10 formas de agregar una columna a los DataFrames de Pandas

10 formas de agregar una columna a los DataFrames de Pandas

A menudo necesitamos derivar o crear nuevas columnas

Foto de Austin Chan en Unsplash

DataFrame es una estructura de datos bidimensional con filas y columnas etiquetadas. A menudo necesitamos agregar nuevas columnas como parte de los procesos de análisis de datos o de ingeniería de características.

Existen muchas formas diferentes de agregar nuevas columnas. La mejor opción para tus necesidades dependerá de la tarea en cuestión.

En este artículo, aprenderemos 10 formas de agregar una columna a los DataFrames de Pandas.

Comencemos creando un DataFrame simple utilizando el constructor DataFrame de Pandas. Pasaremos los datos como un dictionary de Python, donde los nombres de las columnas son las claves y las filas son los valores del diccionario.

import pandas as pd# crear DataFrame
df = pd.DataFrame(
    {
        "first_name": ["Jane", "John", "Max", "Emily", "Ashley"],
        "last_name": ["Doe", "Doe", "Dune", "Smith", "Fox"],
        "id": [101, 103, 143, 118, 128]
    }
)# mostrar DataFrame
df
df (imagen del autor)

1. Usar un valor constante

Podemos agregar una nueva columna con un valor constante de la siguiente manera:

df.loc[:, "department"] = "ingeniería"# mostrar DataFrame
df
df (imagen del autor)

2. Usar una estructura similar a un array

Podemos usar una estructura similar a un array para agregar una nueva columna. En este caso, asegúrate de que el número de valores en el array sea igual al número de filas en el DataFrame.

df.loc[:, "salary"] = [45000, 43000, 42000, 45900, 54000]

En el ejemplo anterior, usamos una lista de Python. Ahora determinemos los valores aleatoriamente con el módulo random de NumPy.

import numpy as npdf.loc[:, "salary"] = np.random.randint(40000, 55000, size=5)# mostrar DataFrame
df