Cómo explorar y limpiar automáticamente tus datos con PandasAI
Explorar y limpiar datos con PandasAI de forma automática
Limpia tus datos fácilmente con el prompt

Estamos en la cúspide de la adopción de los Modelos de Lenguaje Grande (MLG), donde la mayoría de nuestros requerimientos de texto se resuelven rápidamente. Desde responder preguntas, buscar enlaces y planificar tareas diarias hasta la creación de contenido, los MLG pueden hacerlo ahora.
Una de las principales empresas en la investigación de MLG es OpenAI, especialmente con su modelo de la familia GPT. Con la introducción de ChatGPT, el público ha sido introducido al poder de los MLG, del cual es difícil prescindir.
El lenguaje de programación Python tiene una reconocida biblioteca de manipulación de datos llamada Pandas. Es un elemento básico para muchas personas que trabajan con datos y quieren realizar cualquier tipo de exploración de datos en Python. Con la existencia del modelo GPT, una de las aplicaciones emocionantes es combinar el poder de los MLG con Pandas, en el paquete llamado PandasAI.
Utilizando el poder de la IA generativa, PandasAI nos ayuda a manipular los datos con lenguaje natural. ¿Cómo podemos hacer eso? Vamos a explorarlo más a fondo.
PandasAI
PandasAI es un paquete de Python que proporciona la implementación de MLG en Pandas. Su objetivo es complementar a Pandas, no reemplazarlo. Al utilizar PandasAI, podemos convertir el paquete Pandas en una herramienta conversacional que explorará y limpiará automáticamente nuestros datos.
- Regex para el científico de datos moderno – Parte 2
- ¿Es Julia más rápida que Python y Numba?
- Desbloquea información sobre aprendizaje automático utilizando el P...
Para utilizar PandasAI, debemos instalarlo con el siguiente código.
pip install pandasai
Para utilizar el paquete PandasAI, necesitamos tener acceso a las API de MLG. Podemos elegir entre varios modelos, como el GPT de OpenAI o el modelo de HuggingFace.
En este ejemplo, utilizaremos el modelo de OpenAI, pero te daré un ejemplo de código si deseas cambiar el modelo a otro. También realizaremos el ejemplo en el Notebook, por lo que este artículo asumirá el trabajo en ese entorno.
OpenAI
Para utilizar la API de OpenAI, necesitamos generar la clave. Utiliza el sitio web para obtener la clave y úsala en el siguiente código.
from pandasai.llm import OpenAIllm = OpenAI(api_token="Tu clave de API de OpenAI")