Un proyecto de Ciencia de Datos con un intérprete de código ChatGPT
Proyecto de Ciencia de Datos con ChatGPT
Crear un proyecto de ciencia de datos de extremo a extremo con el último plugin de ChatGPT.

Como alguien que actualmente está equilibrando un trabajo de ciencia de datos a tiempo completo con múltiples proyectos independientes, generalmente soy el primero en probar herramientas que pueden disminuir potencialmente mi tiempo de respuesta.
Cuando ChatGPT comenzó a implementar el plugin del Intérprete de Código para sus suscriptores la semana pasada, no podía esperar para incorporarlo en mis proyectos de ciencia de datos.
Si aún no has oído hablar de esta herramienta, el Intérprete de Código es un plugin que te permite cargar documentos y ejecutar programas Python dentro de la interfaz de ChatGPT.
Han quedado atrás los días en que copiábamos y pegábamos manualmente los datos en ChatGPT y esperábamos una respuesta.
Con el Intérprete de Código, simplemente puedes cargar tu conjunto de datos y hacer que la herramienta analice tus datos, construya modelos de aprendizaje automático y genere visualizaciones en minutos.
- Cómo fragmentar datos de texto un análisis comparativo
- Cómo solucionar fechas faltantes para el análisis de series de tiempo
- ¿Logra tu canalización de LLM alcanzar tu objetivo?
En este artículo, te mostraré cómo se puede utilizar el Intérprete de Código para ejecutar un proyecto de ciencia de datos de extremo a extremo.
La Tarea — Segmentación de Clientes
En mi empresa anterior, trabajé como científico de datos de marketing.
Esto significaba que utilizaba los datos de los clientes para aumentar las ventas — identificando a nuestros usuarios más rentables, prediciendo las tasas de abandono y construyendo perfiles de las personas que deberían ser objetivo en futuras campañas de marketing.
Incluso escribí un tutorial sobre cómo construir un modelo de segmentación de clientes con Python, en el que utilizaba un conjunto de datos disponible públicamente para identificar cuán valioso era cada cliente para una empresa de comercio electrónico.
En este artículo, realizaremos la segmentación de clientes en el mismo conjunto de datos. Sin embargo, esta vez utilizaremos el Intérprete de Código de ChatGPT para ayudarnos a construir el modelo.
Pre-Requisitos
Utilizaremos el conjunto de datos de comercio electrónico de Kaggle para este análisis. Este conjunto de datos se obtuvo del Repositorio de Aprendizaje Automático de UCI y comprende información sobre transacciones reales de venta al por menor para una empresa de comercio electrónico con sede en el Reino Unido.
Este conjunto de datos está bajo una licencia Creative Commons Attribution 4.0 International (CC BY 4.0).