¿Quién ganará dinero en la fiebre del oro de la IA generativa?

¿Quién ganará dinero en la IA generativa?

La fiebre del oro en la IA Generativa está en pleno apogeo. La IA Generativa (GenAI) ahora está creando contenido, palabras, imágenes, videos y audio, que a menudo es indistinguible del producido por los humanos. La escritura, el diseño visual, la codificación, el marketing, la producción de juegos, la composición musical y el diseño de productos son solo algunas de las áreas de la creatividad humana que están siendo impactadas rápidamente por GenAI. A medida que los servicios creativos se integran en productos como Microsoft Office 365, Slack, Discord, Salesforce Cloud y Gmail, GenAI aumentará la productividad de miles de millones de personas antes de que nos demos cuenta. Pronto todos usaremos GenAI para crear nuestros primeros borradores de cualquier cosa y todo.

Entonces, ¿quién ganará dinero con GenAI? Le hice esa pregunta al servicio de texto a imagen de OpenAI llamado Dall-E-2, y produjo la siguiente imagen. No está mal.

   

En 2018, escribí una entrada de blog popular sobre Quién va a ganar dinero en IA. Aquí está mi publicación de seguimiento sobre los miles de millones que se están invirtiendo en GenAI en miles de nuevos casos de uso. En esencia, existen cinco ‘capas’ de captura de valor potencial en esta fiebre del oro:

1. Infraestructura – las empresas que ofrecen chips e infraestructura en la nube que ejecutarán los enormes modelos informáticos subyacentes de GenAI.

2. Modelos Fundamentales – las empresas que construyen los enormes modelos de texto, imagen, audio y otros que generan resultados creativos.

3. Aplicaciones – las grandes y pequeñas empresas que están construyendo aplicaciones que serán utilizadas por consumidores, empresas y gobiernos para tareas creativas.

4. Industria y organizaciones – que, como parte de sus actividades creativas, extraerán valor de las aplicaciones, herramientas y plataformas de GenAI.

5. Países – que crearán, exportarán e implementarán tecnologías de GenAI tanto dentro como fuera de las fronteras nacionales.

   

En cada una de estas capas, ¿quién será el ganador?

 

1. Infraestructura GenAI

 

Las grandes empresas de tecnología ya dominan en la infraestructura de GenAI con sus servicios en la nube y chips de hardware.

   

Microsoft y Google están bien posicionados en el mercado de la nube de EE. UU., mientras que Baidu y Alibaba están bien posicionados en China. Su infraestructura masiva de supercomputadoras en la nube está diseñada para ejecutar los Modelos Fundamentales de GenAI, que son complejos, costosos y generan texto, imágenes y audio. Ya hay muchos desarrolladores que utilizan sus servicios y herramientas de API de IA en la nube para construir aplicaciones, y se espera que esta tendencia se acelere a medida que los emprendedores se apresuren a abordar prácticamente ilimitados casos de uso de GenAI. Amazon ha estado tranquilo en cuanto a los Modelos Fundamentales, por lo que la gran pregunta es cómo responderán.

GenAI utiliza grandes cantidades de poder computacional para generar resultados creativos. Sam Altman, CEO de OpenAI, dijo:

en algún momento tendremos que monetizarlo [ChatGPT y Dall-E-e]; los costos de computación son asombrosos”.

Se rumorea que el costo de entrenamiento de GPT-3 de Open AI fue de 12 millones de dólares solo en facturas de energía. No sorprende que OpenAI haya recibido una inversión adicional de 10 mil millones de dólares de Microsoft a principios de 2023, gran parte de la cual será en forma de créditos de acceso a la infraestructura de supercomputación de Microsoft Azure.

Los fabricantes de chips están emocionados con la necesidad de potencia de supercomputación. Con una capitalización de mercado de más de medio billón de dólares, el precio de las acciones de NVIDIA (NASDAQ: NVDA) ha subido de $60 en 2018 a $240 a principios de 2023. Las grandes empresas de tecnología también están invirtiendo en sus propios chips optimizados para IA. La reciente prohibición de exportación de chips de IA avanzados a China por parte de Estados Unidos acelerará la ayuda estatal china y la inversión nacional en su industria de semiconductores (además de aumentar las tensiones geopolíticas). Dada la cantidad de inversión requerida, los ganadores en este espacio serán aquellos que son o están respaldados por grandes jugadores.

 

2. Modelos Fundacionales

 

El tamaño y alcance de las grandes tecnológicas les otorgan una ventaja competitiva cuando se trata de desarrollar Modelos Fundacionales de IA General. Estos modelos se entrenan con grandes cantidades de datos, utilizando los vastos recursos computacionales de las grandes tecnológicas. Por ejemplo, el modelo de texto GPT-3 de OpenAI, conocido como un Gran Modelo de Lenguaje (LLM, por sus siglas en inglés), fue entrenado con aproximadamente 45 terabytes de datos textuales que representan medio billón de palabras recopiladas de gran parte de internet en inglés. De manera similar, el modelo basado en texto a imagen Dall-E-2 de OpenAI fue entrenado con 650 millones de pares de imágenes y descripciones.

Las grandes tecnológicas no quieren perder su liderazgo en servicios en la nube al no capturar las enormes corrientes de ingresos generadas por los miles de millones de usuarios finales de estos Modelos Fundacionales en el futuro. Microsoft se ha asociado con OpenAI y Google recientemente lanzó su chatbot de lenguaje llamado Bard, que complementa su modelo Imagen para crear imágenes fotorrealistas a partir de texto de entrada.

Las grandes tecnológicas chinas tampoco se quedan atrás. Alibaba está probando un servicio de chat interno. Baidu ya ofrece ERNIE-ViLG, un modelo de parámetros de texto a imagen, y actualmente está probando un nuevo servicio de chatbot. El tamaño de las grandes tecnológicas les proporciona varias ventajas que las startups encontrarán difícil de replicar.

   

Las grandes tecnológicas tienen la ventaja de la escala para abordar los problemas de verdad, sesgo y toxicidad en los Modelos Fundacionales

 

Las grandes tecnológicas pueden ser las únicas empresas capaces de hacer frente al lado oscuro de la IA General. Aunque la IA General todavía está en sus primeras etapas, los problemas con los Modelos Fundacionales están empezando a ser evidentes. Los problemas van desde la veracidad (la IA General produce contenido que simplemente es incorrecto), el sesgo (prejuicio contra grupos específicos) y la toxicidad (por ejemplo, discurso racista, misógino o de odio). A principios de 2023, la capitalización de mercado de Alphabet se redujo en masivos 100 mil millones de dólares cuando los mercados financieros se asustaron ante las respuestas erróneas y ofensivas del servicio de chatbot de Google llamado Bard. El chatbot de Bing de Microsoft, que fue lanzado en un lanzamiento limitado, también mostró respuestas problemáticas (incluso racistas) de usuarios que rompieron las salvaguardias, aunque su precio de las acciones no cayó tan precipitadamente. También existe un nuevo tipo de ciberataque conocido como inyecciones de comandos, que pueden eludir las protecciones inyectando instrucciones maliciosas.

El desafío para aquellos que desarrollan estos Modelos Fundacionales será garantizar que su salida sea responsable y precisa. Los Modelos Fundacionales no pueden simplemente regurgitar contenido sesgado y tóxico que se haya extraído de los rincones más lejanos de internet. Estos modelos también son alucinatorios. Esto significa que entregan respuestas bien construidas y elocuentes con confianza, pero que pueden ser incorrectas desde el punto de vista factual. Como Noam Shazeer, co-fundador de Character.AI, dijo en el New York Times:

“…estos sistemas no están diseñados para la verdad. Están diseñados para una conversación plausible.”

O dicho de otra manera, son artistas de la charlatanería confiados.

Las grandes tecnológicas no pueden permitirse los riesgos reputacionales, financieros y estratégicos que podrían surgir de fallos en los Modelos. Están construyendo sistemas de supervisión y control que incluyen salvaguardias y ajuste de modelos. Para generar confianza en los usuarios y cumplir con los posibles requisitos regulatorios, las grandes tecnológicas deberán desarrollar soluciones para la transparencia del modelo, su explicabilidad y citación de fuentes. El aprendizaje por refuerzo a partir de la retroalimentación humana (RLFH) requerirá un ejército de personas para revisar y calificar las respuestas del modelo a las preguntas. Estos no son problemas simples de resolver a gran escala. Una vez más, las grandes tecnológicas están bien posicionadas debido a su acceso a capital, talento en ingeniería, conjuntos de datos y la escala de sus bucles de retroalimentación humana que proviene de tener miles de millones de usuarios.

 

Los modelos de BigTech no son adecuados para todas las situaciones

 

A pesar de su tamaño y escala, BigTech no podrá controlar toda la fiebre del oro del Modelo Fundacional. Sus modelos son ampliamente horizontales y adecuados para responder, si no correctamente, cualquier pregunta concebible del consumidor. Sin embargo, no siempre son tan adecuados para las necesidades de la empresa con tareas verticales. ¿Por qué? Los modelos horizontales de BigTech (1) no siempre tienen un buen rendimiento en tareas especializadas, (2) con frecuencia no protegen los datos propietarios de la empresa, (3) no están entrenados en idiomas que no sean el inglés, (4) carecen de transparencia y explicabilidad, (5) no son tan adecuados para su uso en dispositivos periféricos y en el lugar, (6) pueden ser costosos de ejecutar en su nube y (7) crean dependencia de la empresa en BigTech.

 

Unas pocas startups extremadamente bien financiadas están ofreciendo alternativas a los modelos fundacionales de BigTech

 

Los modelos fundacionales de BigTech no son para todos. Esto deja espacio para unas pocas startups extremadamente bien financiadas que han recaudado cientos de millones de dólares, si no miles de millones.

  • Anthropic, fundada en 2021, se centra en modelos de lenguaje de aprendizaje profundo (LLMs) más confiables, explicables y controlables, y ha recaudado más de $1 mil millones, siendo la inversión más reciente de $300 millones proveniente de Google.
  • AI21labs ha recaudado $119 millones para su modelo de texto Jurassic-1. Con más de 178 mil millones de parámetros, Jurassic-1 tiene un tamaño similar al de GPT-3.
  • Cohere ha recaudado $165 millones para LLMs y procesamiento de lenguaje natural (NLP) como servicio.
  • BLOOM es un proyecto de LLM de investigación público-privado respaldado por la empresa privada Hugging Face y los institutos de investigación europeos para crear un LLM de código abierto con 176 mil millones de parámetros. Ha sido entrenado en 46 idiomas humanos, incluidos veinte idiomas africanos que están subrepresentados en la mayoría de los LLMs.
  • Stability AI, con sede en el Reino Unido, recientemente recaudó $100 millones para una valoración superior a $1 mil millones para su servicio de generación de imágenes de código abierto, Stable Diffusion.

BigTech es consciente de las limitaciones de sus modelos, especialmente Microsoft, que anunció recientemente que las empresas podrán “ajustar” sus modelos sin temor a que se compartan datos propietarios para construir un mejor modelo para todos.

Sin embargo, estos pasos no satisfarán a todos. Adelph Alpha, una startup alemana que ha recaudado $31 millones, está abordando las preocupaciones empresariales sobre los modelos fundacionales de BigTech con sus propios modelos “europeos”. Pero no está claro si podrán competir a gran escala.

BigTech ganará la carrera por los Modelos Fundacionales horizontales, dejando espacio para algunas alternativas de startups altamente capitalizadas. Tal vez los modelos de código abierto como BLOOM y Stable Diffusion logren escalar o al menos encuentren una existencia de nicho. Como es habitual, habrá herramientas y proveedores de servicios que se beneficien al facilitar el trabajo con estos Modelos Fundacionales. Pero en general:

La dominancia del mercado de BigTech se amplificará gracias a su capacidad para regalar efectivamente sus Modelos Fundacionales de forma gratuita, ya que la mayoría de sus ingresos provendrán de sus servicios en la nube subyacentes.

3. Aplicaciones de IA generativa

 

Aunque BigTech ganará en las herramientas y servicios de la fiebre del oro de la IA generativa, la capa de aplicaciones es mucho más nivelada. Las empresas de software empresarial existentes, las startups “full stack” y miles de startups habilitadas por estos Modelos Fundacionales ofrecerán nuevas aplicaciones de IA generativa.

Las empresas de software empresarial tradicionales, como Salesforce y Microsoft, de forma orgánica o mediante adquisiciones, agregarán capacidades de IA generativa a sus miles de millones de usuarios. Microsoft también está integrando su servicio de chatbot de IA generativa en su aplicación de búsqueda Bing, desafiando directamente la hegemonía de búsqueda de Google.

Un pequeño número de startups bien financiadas ofrecerá aplicaciones especializadas de “pila completa”. En dominios con datos especializados, secuencias y requisitos computacionales, estas empresas desarrollarán sus propios Modelos Fundacionales subyacentes. Por ejemplo, GenAI podría revolucionar el descubrimiento de medicamentos y la ciencia de materiales mediante la construcción de sus propios modelos con aplicaciones. Los inversores se sentirán atraídos por estas startups, ya que podrían ofrecer recompensas financieras sustanciales, así como una fuerte defensibilidad competitiva.

Adept AI, por ejemplo, ha recaudado $65 millones para desarrollar la próxima generación de automatización de procesos robóticos (RPA) con interfaces de lenguaje natural basadas en LLMs. En modo sigiloso, Inflection.ai está haciendo algo similar. Character.AI, un chatbot que adopta la voz y el conocimiento de los personajes, ha recaudado $200 millones – $250 millones con una valoración de alrededor de $1 mil millones para una implementación de pila completa de LLMs especializados para aplicaciones empresariales con agentes en vivo.

La adopción de GenAI será extremadamente rápida. Si un primer borrador, por ejemplo, de un mensaje de marketing generado por IA no es perfecto, entonces es sencillo editarlo. ChatGPT fue la aplicación de consumo de más rápido crecimiento en la historia, con más de 100 millones de usuarios activos mensuales en poco más de dos meses después de su lanzamiento. Esto significa que la batalla por el número casi infinito de aplicaciones creativas de GenAI será feroz y rápida.

Habrá una aplicación “Copiloto” GenAI para cada caso de uso imaginable

La utilización de GenAI verá a consumidores, empresas y organizaciones de todo el mundo utilizar aplicaciones habilitadas por startups construidas sobre estos Modelos Fundacionales. Muchas startups de GenAI utilizarán el modelo de negocio “Copiloto para X” para ayudar a los usuarios con tareas “creativas” como escribir o codificar, así como tareas repetitivas como la entrada de datos o el relleno de formularios. Aquí hay algunas de las startups que compiten para ganar dinero en diversos casos de uso verticales.

  1. Startups de escritura de texto general están ayudando a los usuarios en tiempo real con tareas de escritura cotidianas, como la composición de correos electrónicos, la creación de documentos y el completado de formularios de texto. Wordtune de AI21labs “reformula tu texto como si fuera un redactor profesional”. El rey de los asistentes de escritura es Grammarly, que ha recaudado más de $400 millones. La lista de startups de escritura es larga e incluye a Lex, HyperWrite, Compose AI y Rytr.
  2. Startups de ventas y marketing incluyen al gigante Jasper.ai, que ha recaudado $145 millones. Anyword ha recaudado más de $45 millones para proporcionar “contenido de texto de alta conversión para ventas”. Persado recaudó más de $66 millones para la generación de lenguaje y “supera a tu mejor copia el 96% del tiempo”. Las startups se especializan cada vez más en tareas específicas, como escribir descripciones de marketing de productos.
  3. Startups de generación de imágenes son impulsadas por los Modelos Fundacionales de texto a imagen de DALL-E-2 de Open AI, Stable Diffusion de Stability AI y Midjourney. Las startups incluyen Art Breeder, que ayuda a los usuarios a crear collages.
  4. Startups de avatares y rostros de consumidores incluyen la aplicación Facetune de Lightricks, que ayuda a crear la imagen de “Instagram perfecta”. Lightricks ha recaudado $350 millones. Los usuarios del popular aplicación Lensa AI pueden crear “avatares mágicos” individuales. Reface, que permite a los usuarios cambiar sus rostros en diferentes escenarios, ha recaudado $5.5 millones.
  5. Startups de diseño de productos incluyen a Botika, que está “reinventando las sesiones de moda” con imágenes hiperrealistas de modelos vestidos con ropa de alta calidad en diferentes escenarios. Maket ayuda a “generar planes arquitectónicos a partir de indicaciones de texto en minutos, no meses”. Tailorbird acelera la creación de planos para propietarios que buscan renovar. Swapp ha recaudado $7 millones para ayudar a automatizar los documentos de construcción de proyectos. TestFit ha recaudado $22 millones para ayudar en el diseño inmobiliario.
  6. Startups centradas en video ofrecen herramientas de ideación, generación, edición y colaboración de fuerza laboral en video. Runway es la más financiada con casi $100 millones en el banco. Magnifi ha recaudado más de $60 millones para la edición de video, mientras que InVideo ha recaudado más de $53 millones. Varias startups, incluyendo Hour One, que ha recaudado $26 millones, ofrecen servicios de texto a video. Synthesia, con sede en Londres, ha recaudado más de $67 millones para su plataforma de creación de videos con avatares. En general, NFX está rastreando 54 empresas que han recaudado un total de $0.5 mil millones para startups de video generativo.
  7. Las startups de Audio GenAI incluyen compañías de creación musical como Soundraw, Boomy y Aiva. Splash ha recaudado $23 millones y permite a los usuarios crear música original y cantar letras en cualquier melodía. DupDub ha recaudado más de $250 millones para servicios de doblaje de voz y cuenta con un millón de usuarios. Descript ha recaudado

     

    Entonces, ¿qué startups ganarán?

     

    No hay escasez de capital fluyendo hacia las startups de aplicaciones de GenAI. Las startups de pila completa recaudarán grandes sumas de dinero en dominios verticales como el descubrimiento de medicamentos, donde crearán modelos y aplicaciones altamente especializados. En el espacio más amplio de B2B, la carrera será horizontal y vertical, con modelos de negocio de copiloto en el centro. Por un lado, las startups horizontales proporcionarán servicios en diversas industrias, como el asistente de ventas y marketing de Jasper. Por otro lado, las startups están cada vez más enfocadas verticalmente por industria, función y tarea.

    Los ganadores lograrán escala y defensibilidad implementando lo siguiente:

    1. Alto retorno de inversión – para su caso de uso, así como un corto tiempo para la prueba de valor.
    2. Modelos Fundamentales Propietarios y Personalizados – “finamente ajustados” para audiencias específicas utilizando datos de la empresa localizados, especializados y propietarios.
    3. Flujos de trabajo – demostrando usabilidad e integración profunda en los procesos del cliente, lo que dificulta su eliminación una vez instalados.
    4. Bucles de retroalimentación – desde el aprendizaje por refuerzo a partir de la retroalimentación humana (RLFH), por ejemplo, para mejorar la alineación del modelo con la intención del usuario.
    5. Dinámica de ciclo virtuoso – cuanto más RLFH y otras retroalimentaciones, mejor será el rendimiento del modelo a través del “ajuste fino”, mayor será el uso y, por lo tanto, crecerá el impulso.
    6. Escala y velocidad de inversión – con márgenes de beneficio más bajos ya que gran parte de la propiedad intelectual pertenece a los Modelos Fundamentales, el juego se trata de la escala. Aquellos que puedan construir rápidamente su marca y atraer a un gran número de usuarios y clientes para hacer girar el ciclo virtuoso prosperarán como líderes de categoría.

    En el espacio de consumo B2C de GenAI, es probable que los jugadores horizontales con velocidad y grandes presupuestos de adquisición de consumidores ganen su carrera.

    AutogenAI, con sede en el Reino Unido, es un ejemplo de una empresa de inicio B2B bien posicionada para ganar en su categoría de copiloto de gestión de ofertas. Han pasado los últimos dos años desarrollando una aplicación que ayuda a las empresas a ahorrar tiempo, dinero y mejorar la calidad de las ofertas, licitaciones y propuestas. Han “ajustado finamente” el modelo de lenguaje de OpenAI utilizando ejemplos de contenido del sitio web de la empresa, ofertas de ventas ganadoras y perdedoras, copias de marketing e informes anuales. También proporcionan una interfaz de usuario de supervisión humano-máquina para ayudar a revisar la fuente y la precisión del contenido y los hechos generados. Esto también proporciona un ciclo crítico de aprendizaje por refuerzo humano con un aumento en el uso. Los clientes están utilizando cada vez más su aplicación como una herramienta de gestión de conocimiento y búsqueda de próxima generación, lo que la hace más pegajosa.

    Unas pocas startups de GenAI serán adquiridas y se convertirán en características de aplicaciones empresariales y de consumo más grandes. Por ejemplo, las grandes compañías de redes sociales con millones de usuarios adquirirán las últimas startups de creación de rostros y avatares. Las empresas de software de diseño gráfico incumbentes adquirirán las startups de edición de imagen y video más prometedoras. Microsoft, por ejemplo, ahora ofrece nativamente GenAI “Microsoft Dynamics 365 Copilot” como parte de sus aplicaciones de CRM y ERP.

    En resumen, unas pocas startups afortunadas y valientes alcanzarán el éxito si pueden construir rápidamente escala y un ciclo virtuoso para sus casos de uso de copiloto. De manera similar, algunas startups de pila completa prosperarán en casos de uso especializados como el descubrimiento de medicamentos. Debido a sus grandes rondas de financiación, mercados uniformes y rápida adopción de la innovación por parte de personas, empresas y gobiernos, las startups estadounidenses dominarán. Sin embargo, la mayoría de las startups volverán a casa con las manos vacías, habiendo contribuido a las ganancias de los proveedores de las herramientas de esta fiebre del oro, predominantemente las BigTech estadounidenses.

    Este es el primero de una serie de publicaciones sobre quién ganará dinero con la IA Generativa. En publicaciones posteriores, discutiré qué organizaciones se beneficiarán más de GenAI, así como qué países y ciudadanos se beneficiarán más de esta tecnología.

    Agradezco sus comentarios.

        Simon Greenman es un pionero en inteligencia artificial e innovación tecnológica. Como cofundador de MapQuest, ayudó a lanzar una de las primeras marcas de internet y IA. Actualmente es socio de Best Practice AI, donde asesora sobre estrategia, tecnología y gobernanza de IA. Recientemente, participó en el Consejo Global de IA del Foro Económico Mundial, contribuyendo a sus herramientas para la Junta Directiva y la Alta Dirección. Simon ha pasado más de una década como Director Digital Principal liderando transformaciones digitales de empresas de directorios y fue CEO de HomeAdvisor Europe, que ofrece principales mercados para profesionales. Ha trabajado con empresas destacadas como Bowers & Wilkins, AOL y Accenture. Es activo en el ecosistema de startups del Reino Unido y tiene un MBA de la Escuela de Negocios de Harvard, así como una licenciatura en Computación e Inteligencia Artificial de la Universidad de Sussex. Es miembro de la Royal Geographic Society.

    Original. Reposteado con permiso.