Simplificando tu Análisis Exploratorio de Datos con Estos Cuatro (4) Paquetes
Simplifica tu Análisis Exploratorio de Datos con 4 Paquetes
Cuatro herramientas esenciales que todo científico de datos debe tener en su arsenal
¡Es un gran momento para ser un científico de datos! Lo que antes tomaba mucho tiempo en ser construido ahora puede ser automatizado, dejando mucho espacio para mejorar la creación de ideas y el diseño de modelos de aprendizaje automático.
Ya se ha escrito mucho sobre estas herramientas, y yo quiero agregar más valor limitando mi elección de herramientas y también incorporando mi perspectiva única y experiencia en el uso de estas librerías. Como debemos ser metódicos al respecto, rápidamente veremos que necesitamos elegir qué paquete funciona mejor en nuestro escenario particular. Algunas consideraciones importantes son la velocidad, la simplicidad, la exhaustividad y el tamaño de los datos.
Este artículo puede ser una continuación de los siguientes artículos que recopilan mis ideas sobre el tema de la visualización de datos:
- Mejora drásticamente tu Análisis Exploratorio de Datos (AED)
- Nunca te saltes este paso en tu Análisis Exploratorio de Datos (AED)
- Mejora tus visualizaciones: Carrera de gráficos de barras
Sin más preámbulos, ¡comencemos!
El conjunto de datos
Empecemos por elegir un conjunto de datos que tenga variables cuantitativas y categóricas suficientes. Esto nos permitirá apreciar y criticar cada paquete de visualización para nuestro propio uso.
- Mejores prácticas y patrones de diseño para construir flujos de tra...
- Habilitar métricas GPU basadas en pods en Amazon CloudWatch
- Estudio explora el potencial de la TMS asistida por robots para la ...
Obtendremos uno de OpenML:
pip install openml
Una vez que tengamos este paquete instalado, procedamos a descargar el Conjunto de Datos de Ingresos y Gastos de Filipinas.
La Autoridad de Estadísticas de Filipinas (PSA, por sus siglas en inglés) realiza regularmente una Encuesta Nacional de Ingresos y Gastos Familiares (FIES, por sus siglas en inglés) cada tres años. La encuesta tiene como objetivo recopilar datos sobre los ingresos familiares, los patrones de gasto y otros factores relacionados en Filipinas.
Este conjunto de datos incluye variables seleccionadas de la última FIES, que cuenta con más de 40,000 observaciones y 60 variables principalmente enfocadas en los ingresos y gastos de los hogares. Los datos tienen como objetivo abordar la falta de un modelo de clasificación socioeconómica universalmente aceptado en Filipinas mediante la exploración de los mejores modelos para predecir…