¿Reemplazará ChatGPT a los científicos de datos?
No, ChatGPT no reemplazará a los científicos de datos.
Cada empleo está en riesgo. Aquí te mostramos cómo puedes proteger tu carrera del impacto de la inteligencia artificial.
Si trabajas en la industria de datos o aspiras a hacerlo, es posible que te estés preguntando si es hora de cambiar de carrera.
¿Serán los modelos generativos como ChatGPT el fin de los científicos de datos?
Como alguien que ha trabajado en ciencia de datos durante tres años, me gustaría dar mi opinión al respecto.
- Unificando conjuntos de datos de imágenes-subtítulos y clasificació...
- Amanecer de los Denoisers Modelos de Aprendizaje Automático de Múlt...
- Trabajando con los conjuntos de datos de Hugging Face
En un artículo que escribí hace algún tiempo, estuve en desacuerdo con la idea de que el software de IA automatizada pudiera reemplazar a los científicos de datos. Mi argumento fue que estas herramientas mejorarían la eficiencia organizativa hasta cierto punto, pero carecían de personalización y requerían la participación humana en cada etapa.
Pero eso fue en febrero de 2022, mucho antes de que ChatGPT, el revolucionario modelo de lenguaje de OpenAI, fuera lanzado.
Cuando ChatGPT se hizo público por primera vez, se basaba en GPT-3.5, un modelo capaz de entender lenguaje natural y código.
Luego, en marzo de 2023, se lanzó GPT-4. Este algoritmo supera a su predecesor en la resolución de problemas basados en lógica, creatividad y razonamiento.
Aquí hay algunos datos sobre GPT-4:
- Puede escribir código (muy bien)
- Aprobó el examen de abogacía
- Superó a la mayoría de los modelos de vanguardia en pruebas de aprendizaje automático
Este modelo puede convertir un boceto en un sitio web completamente desarrollado y actúa como un gran asistente para tareas de programación y ciencia de datos.
Y ya está siendo utilizado por organizaciones para mejorar la eficiencia.
El CEO de Freshworks, Girish Mathrubootham, dice que las tareas de programación que antes llevaban a sus empleados 9 semanas ahora se completan en pocos días con ChatGPT.
Con la IA generativa, los flujos de trabajo de codificación en esta empresa se completan aproximadamente 20 veces más rápido de lo habitual. Esto llevará a una disminución masiva en el tiempo de respuesta, lo que significa que las empresas pueden hacer más en menos tiempo.
Lo Malo – Por qué tu trabajo está en riesgo
Integraciones de productos
Hasta ahora, solo hemos hablado de programación.
Hay otros aspectos del trabajo de un científico de datos, como la preparación de datos, el análisis, la visualización y la construcción de modelos.
En mi experiencia, los científicos de datos actualmente están muy solicitados debido a la variedad diversa de habilidades que se espera que tengan.
Además de construir modelos estadísticos y aprender a programar, estos profesionales también necesitan usar SQL para extraer datos, trabajar con software como Tableau y PowerBI para visualización y comunicar eficazmente información a las partes interesadas.
Con LLMs como ChatGPT, sin embargo, la barrera para ingresar a un campo como la ciencia de datos o el análisis se reducirá enormemente. Los candidatos ya no necesitan tener experiencia en varios software y, en su lugar, pueden aprovechar el poder de los LLMs para lograr en minutos lo que normalmente llevaría horas.
Por ejemplo, en una empresa con la que trabajé una vez, me pidieron que completara una evaluación de Excel con tiempo límite, ya que la mayoría de la base de datos de la organización residía en hojas de cálculo. Querían contratar a alguien que pudiera extraer y analizar rápidamente estos datos.
Este requisito de contratar candidatos con experiencia en el uso de herramientas específicas, sin embargo, desaparecerá a medida que aumente la adopción de LLMs.
Por ejemplo, con una integración ChatGPT-Excel, simplemente podrías resaltar las celdas que deseas analizar y hacer preguntas a los LLMs como “¿Cuál es la tendencia de estas ventas en el último trimestre?” o “¿Puedes realizar un análisis de regresión?”
Integraciones de productos como esta harán que Excel y otros software similares sean accesibles para personas que normalmente no los utilizan, y la demanda de expertos en la herramienta disminuirá.
Complementos de código
El complemento del intérprete de código ChatGPT es otro ejemplo de cómo los flujos de trabajo de la ciencia de datos se están democratizando. Te permite ejecutar código Python y analizar datos en el chat.
Puedes subir archivos CSV y hacer que ChatGPT te ayude a limpiar, analizar y construir modelos estadísticos con ellos.
Una vez que analices los datos y le digas lo que quieres hacer (por ejemplo, prever las ventas para el próximo trimestre), ChatGPT te dirá los pasos que puedes seguir para lograr el resultado final.
Luego procederá a realizar el análisis y la modelización real por ti, y explicará la salida en cada etapa del proceso.
En este artículo, el autor le pide al intérprete de código de ChatGPT que prediga las tendencias inflacionarias futuras utilizando los datos económicos de la Reserva Federal (FRED). El algoritmo comenzó visualizando la tendencia actual en los datos.
Luego verificó la estacionariedad de los datos, los transformó y decidió utilizar ARIMA para realizar la modelización. Incluso pudo encontrar los parámetros óptimos para utilizar en la generación de pronósticos con ARIMA:
Estos son pasos que normalmente llevarían a un científico de datos alrededor de 3-4 horas para realizar, y ChatGPT pudo hacerlo en minutos simplemente ingiriendo los datos que fueron cargados por el usuario.
Esto es un logro impresionante y reducirá drásticamente la cantidad de experiencia necesaria para facilitar el proceso de construcción del modelo.
Entonces… ¿Se requiere experiencia humana?
Por supuesto, independientemente de lo bueno que sea el IA en la codificación y construcción de modelos, aún se requiere la supervisión de expertos humanos en el proceso.
ChatGPT a menudo genera código incorrecto y toma decisiones equivocadas al construir modelos estadísticos. Las empresas aún necesitan contratar empleados que sean buenos en estadísticas y programación para supervisar el proceso de ciencia de datos, para asegurarse de que el modelo se promueva correctamente.
Los LLM no pueden crear productos de datos completos, ya que los humanos aún necesitan realizar tareas como la recopilación de requisitos, la depuración y la validación de la salida del modelo.
Sin embargo, las empresas no necesitarán tantas personas para realizar estas tareas como antes.
Ganancias significativas de eficiencia como las impulsadas por los LLM significarán que los equipos pueden comenzar a reducirse.
En lugar de contratar a 10 científicos de datos para hacer el trabajo, por ejemplo, las empresas simplemente pueden contratar a 5.
Creo que los trabajos de ciencia de datos de nivel inicial serán los primeros en verse afectados por este desarrollo, ya que los LLM ya pueden realizar codificación de nivel intermedio y flujos de trabajo analíticos.
Las congelaciones de contratación debido a la IA ya se están produciendo en las grandes empresas de tecnología, y podríamos estar presenciando un escenario en el que la fuerza laboral de ciencia de datos supere la demanda de esta habilidad.
Cómo proteger tu carrera en la era de ChatGPT
Afortunadamente, no todo es desesperación para nosotros, profesionales de la tecnología y la ciencia de datos. Aunque los LLM están mejorando rápidamente en tareas como la programación y el análisis de datos, no pueden reemplazar la creatividad y toma de decisiones humanas.
Aquí hay algunas formas de proteger tu carrera en la era de los LLM:
Adquiere experiencia empresarial
Las organizaciones seguirán contratando personas que generen ingresos para el negocio.
Si tienes experiencia en un área específica y comprendes las complejidades de las operaciones de la empresa y las necesidades del cliente, estás en una posición única para identificar oportunidades de crecimiento.
Lo último que quieres hacer es competir en el campo de la IA: no quieres ser la persona encargada de manejar una hoja de cálculo o la persona a la que todos acuden para crear un informe de rendimiento trimestral. Estos empleos se pueden automatizar fácilmente y serán los primeros en desaparecer en la era de ChatGPT.
Yo argumentaría que en lugar de enfocar tus esfuerzos en aprender a usar software específico que los LLM pueden dominar mucho más rápido que tú, aprende a ver el panorama general. Desarrolla habilidades de liderazgo y gestión, y comprende cómo se puede aprovechar la IA para lograr los objetivos de la empresa con datos.
Acepta la IA
Según el Centro de Investigación Pew, solo el 14% de los adultos han probado ChatGPT. Si estás leyendo este artículo, usando ChatGPT para aprender cosas nuevas y manteniéndote al tanto de los avances en IA, entonces eres un adoptante temprano.
Sugiero incorporar los LLM en tus flujos de trabajo, utilizando productos que estén integrados con IA y aprendiendo las mejores prácticas para maximizar la eficiencia con estos modelos.
De esta manera, podrás mantenerte a la vanguardia y comprenderás mejor qué parte de tu trabajo se puede automatizar y qué partes requieren intervención humana.
Esto no solo te convertirá en un mejor científico de datos, sino que cuando las organizaciones comiencen a incorporar la IA en diferentes áreas comerciales, estarás en la mejor posición para asesorar sobre cómo se puede utilizar para aumentar la productividad.
De hecho, ha surgido un nuevo rol llamado ingeniería de indicaciones que ha surgido recientemente, con salarios de hasta $335,000. Un ingeniero de indicaciones es un experto en lograr que las aplicaciones de IA generativa hagan lo que desean.
Un buen ingeniero de indicaciones es alguien que puede “gestionar proyectos” de IA para lograr tareas como el diseño de aplicaciones web.
Independientemente de si te gustaría seguir una carrera como ingeniero de indicaciones, incorporar IA en tus flujos de trabajo existentes te dará una ventaja competitiva sobre las personas que actualmente no lo hacen.
Diversificar tus ingresos
Las organizaciones comenzarán a reestructurarse pronto, ya que comienzan a desarrollar nuevas estrategias comerciales que incorporan IA.
Si esto resulta en despidos masivos, la única forma de protegerte es tener varias fuentes de ingresos que no dependan únicamente de tu trabajo a tiempo completo.
Te sugiero crear un portafolio como freelance: trabajar para más de una organización y obtener ingresos pasivos asegurará que tu futuro no dependa de las decisiones tomadas por un solo empleador.
Crear una marca personal
Finalmente, Harvard Business Review sugiere crear una marca personal para destacarte entre la multitud.
Escritores como Tim Denning y Jessica Wildfire, por ejemplo, seguirán teniendo una base de seguidores dedicados y personas que consumen sus productos, incluso si la IA es capaz de emular su estilo de escritura.
Esto se debe a que, al final del día, los humanos disfrutan de historias reales y quieren sentirse conectados con otras personas, y esto es algo que la IA simplemente no puede proporcionar.
De manera similar, las organizaciones seguirán contratando líderes de la industria que sean reconocidos en el campo, como una declaración de calidad y marca. Algunas formas de construir una marca personal incluyen crear un portafolio de ciencia de datos, crear contenido y mejorar constantemente tus habilidades.
Conclusiones
Los modelos generativos transformarán el panorama laboral, y áreas como la ciencia de datos, el análisis y la programación se verán afectadas debido a las ganancias de eficiencia proporcionadas por estas herramientas.
Sin embargo, esto no significa el fin para los científicos de datos. Siguiendo las estrategias descritas anteriormente, puedes mantenerte a la vanguardia y asegurarte de no competir con la IA. Natassha Selvaraj es una científica de datos autodidacta con pasión por la escritura. Puedes conectarte con ella en LinkedIn.