10 formas de agregar una columna a los DataFrames de Pandas
10 formas de agregar una columna a los DataFrames de Pandas
A menudo necesitamos derivar o crear nuevas columnas

DataFrame es una estructura de datos bidimensional con filas y columnas etiquetadas. A menudo necesitamos agregar nuevas columnas como parte de los procesos de análisis de datos o de ingeniería de características.
Existen muchas formas diferentes de agregar nuevas columnas. La mejor opción para tus necesidades dependerá de la tarea en cuestión.
En este artículo, aprenderemos 10 formas de agregar una columna a los DataFrames de Pandas.
Comencemos creando un DataFrame simple utilizando el constructor DataFrame
de Pandas. Pasaremos los datos como un dictionary
de Python, donde los nombres de las columnas son las claves y las filas son los valores del diccionario.
import pandas as pd# crear DataFrame
df = pd.DataFrame(
{
"first_name": ["Jane", "John", "Max", "Emily", "Ashley"],
"last_name": ["Doe", "Doe", "Dune", "Smith", "Fox"],
"id": [101, 103, 143, 118, 128]
}
)# mostrar DataFrame
df

1. Usar un valor constante
Podemos agregar una nueva columna con un valor constante de la siguiente manera:
- Conoce a Mojo Un nuevo lenguaje de programación para desarrolladore...
- Gradient Boosting una bala de plata en la predicción
- ¡Olvida PIP, Conda y requirements.txt! Usa Poetry en su lugar y agr...
df.loc[:, "department"] = "ingeniería"# mostrar DataFrame
df

2. Usar una estructura similar a un array
Podemos usar una estructura similar a un array para agregar una nueva columna. En este caso, asegúrate de que el número de valores en el array sea igual al número de filas en el DataFrame.
df.loc[:, "salary"] = [45000, 43000, 42000, 45900, 54000]
En el ejemplo anterior, usamos una lista de Python. Ahora determinemos los valores aleatoriamente con el módulo random
de NumPy.
import numpy as npdf.loc[:, "salary"] = np.random.randint(40000, 55000, size=5)# mostrar DataFrame
df