Revolutionizando el Análisis de Datos con PandasGUI

Revolutionizing Data Analysis with PandasGUI

PandasGUI desencadena un análisis de datos sin precedentes, simple y eficiente.

El análisis efectivo de datos es clave para las empresas en el mundo actual impulsado por los datos, y Pandas, una biblioteca de Python para manipular y limpiar datos, se ha convertido en un recurso invaluable. Aunque no es fácil para principiantes o aquellos que prefieren enfoques más visuales para aprenderlo rápidamente. Pero PandasGUI proporciona una solución increíble: una biblioteca asombrosa con interfaces gráficas de usuario para simplificar la manipulación y visualización de datos. Este artículo guiará en la instalación de la biblioteca y mostrará las características notables que pueden mejorar las capacidades de análisis de datos.

Comenzando con PandasGUI

Para comenzar a usar PandasGUI, el primer paso es descargar su paquete. Puede hacerlo ejecutando el siguiente comando en la línea de comandos:

pip install pandasgui

Ahora puede cargarlo e importarlo usando los siguientes comandos:

import pandas as pd
import pandasgui

Si está utilizando otros sistemas operativos que no sean Windows, es posible que enfrente algunos problemas debido a la ausencia de la variable de entorno APPDATA. Si está utilizando Mac OS o Linux y ha intentado importar PandasGUI, obtendrá un error similar:

Para abordar este problema, una solución simple es asignar una cadena vacía como valor para la variable de entorno que causa el error. Al hacerlo, puede evitar cualquier error y permitir que su código continúe sin interrupción, una solución eficiente que proporciona un alivio rápido de los problemas en cuestión.

import os
os.environ['APPDATA'] = ""

Ahora puede importarlo sin errores. Es posible que reciba un mensaje de advertencia, lo cual está bien. La razón de esta advertencia es la falta de implementación de algunas interfaces recomendadas en Mac OS, por lo que el sistema emite esta advertencia.

El último paso es cargar un conjunto de datos para usarlo como demostración de las características de esta biblioteca. Puede cargar un conjunto de datos estructurado de su elección o puede utilizar el conjunto de datos disponible en PandasGUI. En este artículo, utilizaremos el conjunto de datos de Titanic que viene empaquetado con la biblioteca PandasGUI.

from pandasgui.datasets import titanic

Ahora, estamos listos para lanzar PandasGUI. Simplemente llame a la función show() como se muestra en el siguiente código:

pandasgui.show(titanic)

Una vez que se ejecutan estos comandos, se abrirá una nueva ventana para revelar su dataframe cargado.

Capacidades de PandasGUI

La interfaz de usuario es bastante sencilla. Consiste en los siguientes componentes. Los presentaré en las subsecciones posteriores.

  • Visualizar y ordenar DataFrames
  • Reestructuración de DataFrames
  • Filtrado de DataFrames
  • Estadísticas resumidas
  • Gráficos interactivos

Visualizar y ordenar DataFrames

La primera característica de PandasGPU es visualizar y ordenar DataFrames en orden ascendente y descendente. Este es un paso importante para la exploración de datos y se puede hacer fácilmente como se muestra en la imagen a continuación:

Reestructuración de DataFrames

PandasGUI proporciona dos métodos para reestructurar dataframes que son pivot y melt. El Pivot transforma dataframes desplazando valores de una columna a varias columnas. Puede usarlo cuando intente reestructurar sus datos pivoteando alrededor de una columna en particular. Al especificar un índice y columnas para operaciones de pivote, puede reorganizar su dataframe con mayor facilidad.

Por otro lado, el método melt le permite desnormalizar su dataframe, combinando varias columnas en una sola mientras mantiene otras como variables. Esta función es especialmente útil al hacer la transición de una forma amplia a una forma larga o normalizar su conjunto de datos.

En el gif a continuación, usaremos el método pivot para remodelar el dataframe Titanic:

Filtrado de DataFrame

En muchas ocasiones, le gustaría filtrar sus conjuntos de datos en función de ciertas condiciones para comprender mejor los datos o para extraer una cierta parte de su conjunto de datos. Para aplicar filtros a sus datos utilizando PandasGUI, primero irá a la sección de filtros y escribirá cada filtro y luego lo aplicará. Supongamos que solo queremos obtener los pasajeros que son:

  • Hombres
  • Pertenecen a la clase 3
  • Sobrevivieron al naufragio
  • Edad entre 30 y 40 años

Por lo tanto, aquí están los cuatro filtros que aplicaremos a nuestros conjuntos de datos:

  • Sexo == ‘hombre’
  • Pclass == ‘3’
  • Sobrevivido == 1
  • 30 < Edad < 40

En el gif a continuación, se muestra una guía paso a paso sobre cómo aplicar estos cuatro filtros al conjunto de datos Titanic:

Estadísticas resumidas

También puede usar PandasGUI para proporcionar una descripción estadística detallada del DataFrame. Esto incluirá la media, la desviación estándar, el mínimo y el máximo de cada columna del conjunto de datos.

Trama interactiva

Finalmente, PandasGUI proporciona opciones potentes de trazado interactivo para su conjunto de datos, que incluye:

  • Histograma
  • Gráficos de dispersión
  • Gráficos de línea
  • Gráficos de barras
  • Gráficos de caja
  • Gráficos de violín
  • Gráficos de dispersión 3D
  • Mapa de calor
  • Gráficos de contorno
  • Gráficos de tarta
  • Gráficos Splom
  • Nube de palabras

En el gif a continuación, crearemos tres gráficos interactivos para nuestro conjunto de datos: un gráfico circular, un gráfico de barras y una nube de palabras. Este artículo destaca las características de PandasGUI, una poderosa biblioteca que agrega una interfaz gráfica de usuario a la ampliamente utilizada biblioteca Pandas. Primero demostramos su instalación, cargamos un conjunto de datos de muestra y exploramos características como el filtrado, la clasificación y el análisis estadístico.

Referencias

  • PandasGUI: Analizando dataframes de Pandas con una interfaz gráfica de usuario
  • Todo lo que necesita saber sobre PandasGUI
  • PandasGUI: El secreto definitivo para el análisis de datos sin esfuerzo

Youssef Rafaat es un investigador de visión por computadora y científico de datos. Su investigación se centra en el desarrollo de algoritmos de visión por computadora en tiempo real para aplicaciones de atención médica. También trabajó como científico de datos durante más de 3 años en el marketing, las finanzas y el dominio de la atención médica.