Cómo reemplazar eficientemente valores en un DataFrame de Pandas

Cómo reemplazar valores en un DataFrame de Pandas de manera eficiente

PYTHON

Un recorrido por el método “replace” de Pandas y cómo puedes usarlo en algunos ejemplos sencillos

Imagen utilizada con permiso de mi talentosa hermana ohmintyartz

La biblioteca de Pandas tiene una variedad de métodos incorporados que puedes utilizar para procesar y limpiar datos para prepararlos para el análisis y el aprendizaje automático.

A medida que trabajas con diferentes tipos de datos, a menudo encontrarás la necesidad de eliminar filas completas basándote en una condición o actualizar parte de un valor de cadena como parte de la limpieza de datos. También es posible que desees crear nuevas columnas a partir de las existentes como parte de tu proceso de ingeniería de características.

Pandas te permite realizar una variedad de operaciones en tipos de datos de objeto y cadena con sus métodos de transformación nativos. En este artículo, echemos un vistazo específicamente a cómo puedes reemplazar valores completos y/o subcadenas en las columnas de tus DataFrames.

¡Siéntete libre de seguir los ejemplos de este artículo en un cuaderno de notas! Puedes descargar el conjunto de datos de Kaggle, disponible de forma gratuita para su uso bajo la Licencia de Dominio Público y Dedicatoria de Datos Abiertos (PDDL) v1.0. Luego, importa y ejecuta lo siguiente y podemos comenzar:

import pandas as pd
df_raw = pd.read_csv("Top-Largest-Universities.csv")
Imagen por el autor

Usando “replace” en Pandas para editar valores de subcadenas en una columna de una Serie de DataFrame

Supongamos que queremos ver los valores en la columna “Continente” específicamente. Podemos usar el método value_counts en Pandas, que básicamente hace un agrupamiento y en la columna especificada, y luego devuelve un recuento de los valores únicos en el DataFrame para cada valor de la columna. Esto es útil para ver cuántos de cada valor único en la columna existen en el DataFrame.

df.value_counts("Continente")
Imagen por el autor