Si quieres dominar la IA generativa, ignora todas las herramientas (excepto dos)

Dominar la IA generativa, ignora todas las herramientas (excepto dos)

 

Es 7 de febrero. Hace bastante frío afuera, pero aparentemente no lo suficiente como para enfriar la emoción que ChatGPT generó justo antes del invierno. Microsoft está listo para anunciar Bing Chat, un chatbot construido sobre el modelo de próxima generación de OpenAI y capaz de hacer búsquedas en la web. Google está condenado (por segunda vez en cuestión de tres meses, nada menos). Todos saltarán a Bing y Microsoft se comerá los ingresos de búsqueda de Google.

¿O no?

Es 14 de marzo. Las flores están floreciendo tímidamente en el hemisferio norte. Hemos estado esperando especialmente una rara con 8 (¿o son 16?) pétalos. Está a punto de abrirse (o tal vez no). GPT-4 está aquí; el lanzamiento más secreto de todos los tiempos para un modelo de lenguaje. Pero es mejor, no, mucho mejor que GPT-3.5. ¿Quién no pagaría $20 al mes por un aumento de productividad de 100 veces? Es una ganga.

Bueno, tal vez no.

Es 21 de marzo. Una melodía suave y posiblemente alucinada ha despertado a Google de una larga hibernación. Bard es música para los oídos de Sundar Pichai. Pero algunas notas están desafinadas, ¿un lanzamiento apresurado? Puede parecer que el movimiento de pinza de los dos anteriores funcionó muy bien. Pero Bard es solo una prueba, el verdadero éxito llegará en el futuro con modelos más poderosos. Google está de vuelta en la carrera.

¿Lo está, realmente?

Es 18 de julio. El verano más veraniego de todos. El sol está alto, el aire está caluroso, las GPUs volverán a funcionar a toda marcha. Meta ha dejado de perder el tiempo en el Metaverso y anuncia un lanzamiento de IA muy aplaudido: una segunda versión de su popular modelo LLaMA de código abierto, Llama 2. Lo han hecho para darle a OpenAI, Microsoft y Google una lección sobre cómo hacer las cosas de manera abierta.

¿Realmente lo han hecho?

Alberto, creo que te faltan algunos más, ¿sabes? ¿Y qué hay de Claude de Anthropic? ¿Y Perplexity? ¿Character? ¿Pi de Inflection? ¿Jurassic de AI21? ¿Xlarge de Cohere? ¿MPT de Mosaic?… ¡Y no te atrevas a olvidarte de las toneladas de papel de regalo ligeramente sobrevalorado y sobrepreciado que salen cada semana!

Oh chico, esto se está volviendo absurdo.

Este artículo es una selección de The Algorithmic Bridge, un boletín educativo cuyo propósito es cerrar la brecha entre la IA, los algoritmos y las personas. Te ayudará a comprender el impacto que la IA tiene en tu vida y a desarrollar las herramientas necesarias para navegar mejor en el futuro.

 

Quizás eso es suficiente

 

Leí un artículo de la escritora Zulie Rane sobre la saturación de las plataformas de redes sociales, inspirado por la locura de registrarse en Threads (solo para cerrar sesión una semana después). Fue oportuno y tremendamente identificable. Me encantó el estilo de introducción, que he tomado prestado para este artículo. La estructura del titular también está tomada de otro artículo.

No pude evitarlo. La similitud es asombrosa: el mismo fenómeno que ocurre con las redes sociales está ocurriendo con las herramientas de inteligencia artificial generativa. Tal vez esto es lo que nos hemos convertido como sociedad, impulsados por el miedo a perder algo, la abrumadora cantidad de información, el impulso interminable de acelerar nuestras carreras o la desesperación por no quedarnos atrás.

Sea cual sea el caso, no podemos evitarlo. La locura de la IA generativa nos está haciendo intercambiar inconscientemente nuestra cordura mental por la trampa absorbente de la sobreabundancia. No necesito tanto de eso. Tampoco tú. En realidad, casi no necesitamos nada de eso.

La parte de “pero dos” del titular es simplemente una opinión. (Estaba pensando en una herramienta para escribir y otra para imágenes. Pero tal vez quieras una diferente para programar. O tal vez no programes. O tal vez no te importe el arte de la IA. Pero entiendes la idea.) Sin embargo, refleja una sensación muy real que yo —y me atrevo a adivinar que tú también— hemos sentido desde que ChatGPT se volvió viral, de repente, inexplicablemente, inesperadamente y, sí, afortunadamente.

El mundo no estaba preparado para los inmensos beneficios, las amenazas transversales y la sensación individual —pero compartida colectivamente— de fatiga por la IA. Los influencers, los especialistas en marketing y los estafadores no causan esta molesta sensación. Simplemente la adoptan para su beneficio; la causa los precede y es difícil de evitar.

Por eso decidí reducirlo. Me enfoqué en lo que realmente quería y me mantuve en eso. El pequeño valor adicional que hubiera obtenido de otra manera no habría compensado el costo mental.

 

Tres razones para evitar la fatiga de la IA generativa

 

Hasta ahora esto es solo un desahogo visceral, pero hay una lógica subyacente en mis emociones.

 

Un truco tecnológico para gobernarlos a todos

 

A pesar del increíble alcance de la tecnología de IA generativa, la eficacia comprobada de los productos y la cantidad de dinero que fluye de una mano a otra (la mayoría sin salir nunca del Valle del Silicio), la verdad es que todos se derivan de los mismos fundamentos técnicos.

No es que niegue que en cualquier día dado pueda querer usar la barra de búsqueda de Bing o la ventana de contexto de 100,000 tokens de Claude o las habilidades de razonamiento de GPT-4 o la multimodalidad de las sugerencias de Bard o la alta sensibilidad emocional de Pi o la versátil variedad de personalidades de Character… Pero seamos honestos: ¿Realmente necesito todas ellas?

En poco tiempo, serán prácticamente indistinguibles. Las compañías más ricas lograrán comercializar los mejores productos y todos ellos compartirán las mismas características fundamentales. El resto, las startups respaldadas por capital de riesgo y los proyectos más pequeños de envoltura de modelos de lenguaje, tendrán que especializarse o desaparecer. Las herramientas que usemos dependerán de las preferencias personales, pero todas ellas provendrán de un pequeño grupo de grandes compañías. El mismo grupo de siempre.

Incluso las supuestas diferencias de capacidad (cuáles modelos pre-entrenados son mejores) y comportamiento (cuáles no han sido entrenados hasta el punto de ser inútiles) son irrelevantes para la mayoría de las tareas. La supuesta degradación temporal de GPT-4 es simplemente un subproducto de OpenAI iterando en público y seguramente se resolverá pronto, sea cual sea la causa.

En resumen: menos es más en la industria de la IA generativa que pronto se convertirá en un producto de consumo.

Evita la trampa.

 

Mantente alejado del molino de herramientas

 

Pero tal vez te importen esas pequeñas diferencias.

En ese caso, te animo a probar varias herramientas y verás que quedarte con un par de ellas es suficiente. ¿Por qué? Porque te sentirás naturalmente atraído por algunas y no por otras. Como dice Rane: “Tus habilidades e intereses te hacen encajar mal en el 99% de las plataformas y encajar bien en el 1%”. Ella se refería a las redes sociales, pero se puede extrapolar perfectamente a las herramientas de IA generativa. Mis tres criterios son habilidad (¿en qué soy bueno?), preferencia (¿qué me gusta hacer?) y actividad (¿para qué lo necesito?)

Por ejemplo, hagamos un breve resumen no exhaustivo para tareas laborales: si eres autor o escritor creativo, tal vez los modelos base con alta temperatura y baja RLHF sean los mejores para ti (por ejemplo, GPT-3 o 3.5). Si eres especialista en marketing de contenido SEO o redactor, tal vez las envolturas personalizadas sean la mejor opción (por ejemplo, Jasper, aunque ahora ChatGPT, Bard y Claude también funcionarían bien). Si eres un escritor con conocimientos de tecnología, tal vez Llama 2 sea mejor para evitar dependencias. Si eres un artista digital, Midjourney. Si tienes habilidades de programación y quieres mayor control, en su lugar Stable Diffusion. Como programador, GPT-4 o GitHub Copilot. ¿Análisis de datos? Intérprete de código.

Ver las herramientas que están saliendo está bien, pero soy más productivo si me quedo con una o dos; tener que analizar las noticias cada semana para ver si lo nuevo es un 0.1% mejor que lo actual es agotador y el principal ingrediente del agotamiento.

 

La incompatibilidad inherente entre el usuario y la empresa

 

Hay una tercera razón, más periférica que las demás, por la que no vale la pena cansarse de la IA generativa.

Aunque el panorama parece ser una red de dinámicas parecidas a una carrera, conflictos de intereses y tensiones comerciales cuyo resultado inevitable es el bienestar del consumidor impulsado por la competencia, todas las compañías que mencioné anteriormente tienen relaciones sólidas, favorables y mutuamente beneficiosas cuyo único objetivo es hacer que nosotros, los usuarios, paguemos por sus productos (incluyendo, eventualmente, aquellos que actualmente son gratuitos).

Estas empresas no están enviando cada vez más y más productos para proporcionar cada vez más y más valor, sino para obtener una parte del suculento pastel de la IA generativa. Lo cual no está mal. Quiero decir, ¿quién no haría lo mismo? Se espera, de ninguna manera es peor que las plataformas de redes sociales, pero vale la pena tener en cuenta por si acaso pensaste que somos los principales beneficiarios de esto, no lo somos. Las empresas no dudarán ni un segundo en tomar una dirección que no nos beneficie. No dudarán en cortar el acceso a productos y cerrar por completo sus servicios si es necesario.

Entonces, en resumen, las herramientas de IA generativa pueden ser una bendición. También pueden ser una maldición. La vida es demasiado corta para estar persiguiendo todo el tiempo cosas que realmente no necesitamos.

Enfócate. Mantente libre. Evita la fatiga.

Alberto Romero es un escritor independiente que se enfoca en tecnología e IA. Escribe The Algorithmic Bridge, un boletín que ayuda a las personas no técnicas a entender noticias y eventos sobre IA. También es analista de tecnología en CambrianAI, donde se especializa en modelos de lenguaje grandes.

Original. Repostado con permiso.