La AI Fashionista de Google Pruébate Ropa Virtualmente

Google's AI Fashionista lets you try on clothes virtually.

Google ha presentado su último avance en el mundo de la moda y la tecnología: una innovadora función de prueba virtual (VTO) de vanguardia para ropa. Esta herramienta innovadora aprovecha la inteligencia artificial (IA) para proporcionar a los usuarios una visualización realista de cómo quedarían las prendas en modelos con diferentes formas y tamaños de cuerpo. Incluso simula elementos cruciales como el caído, el doblado, el ajuste, el estiramiento y el arrugado. El modelo de IA generativo desarrollado por los investigadores de IA de compras de Google está llevando los límites de la moda virtual al siguiente nivel. Profundicemos en este emocionante desarrollo y exploremos cómo transforma la forma en que compramos ropa en línea.

Revolucionando la prueba virtual: una mirada más cercana al avance de Google

Google ha revolucionado la prueba virtual al introducir una función que establece un nuevo estándar de realismo. Con esta herramienta de prueba virtual, los usuarios pueden imaginar cómo quedarían las prendas en modelos reales, representando con precisión varias formas y tamaños de cuerpo. Al centrarse en los detalles esenciales de cómo las prendas se ajustan al cuerpo, se doblan, se ajustan, se estiran y se arrugan, los investigadores de IA de compras de Google han desarrollado un modelo de IA generativo que ofrece una experiencia de compra virtual sin precedentes.

También te puede interesar: Instacart revoluciona las compras con la búsqueda impulsada por IA: conoce a Ask Instacart

Evolucionando más allá de “Clueless”: superando las limitaciones de las técnicas actuales

La prueba virtual ha recorrido un largo camino desde su representación popular en la película “Clueless”. Las técnicas anteriores se basaban en la deformación geométrica para ajustar las imágenes de la ropa a las siluetas, lo que a menudo resultaba en apariencias deformes e irreales. Estos métodos no adaptaban la ropa al cuerpo y a menudo presentaban defectos visuales como pliegues mal colocados. La nueva función de prueba virtual de Google tiene como objetivo superar estas limitaciones generando imágenes realistas de alta calidad de las prendas desde cero.

De píxel a perfección: el poder de los modelos de IA basados en difusión

Para lograr un realismo sin precedentes, los investigadores de Google adoptaron modelos de IA basados en difusión. La difusión implica agregar gradualmente píxeles adicionales (o “ruido”) a una imagen hasta que se vuelve irreconocible y luego eliminar el ruido para reconstruir la imagen original sin defectos. Al incorporar la difusión en su modelo de IA, la función de prueba virtual de Google genera imágenes realistas de personas vistiendo ropa.

Aprende más: Únete a nosotros para una experiencia de aprendizaje extraordinaria y desbloquea el ilimitado mundo de los modelos de IA generativos con modelos de difusión en nuestro próximo taller en DataHack Summit 2023.

El desafío de visualizar el ajuste de la prenda: combinando la adaptación de pose y forma

Un desafío crítico en la prueba virtual es visualizar con precisión cómo quedará una prenda en un individuo, considerando las variaciones significativas de pose y forma. Los métodos anteriores se centraban en la preservación de los detalles de la prenda sin adaptar los cambios de pose y forma o permitían la prueba con pose y forma deseadas pero carecían de detalles de la prenda. La solución de Google combina la preservación avanzada de detalles de la prenda con una efectiva variación de pose y forma, lo que resulta en visualizaciones precisas y realistas.

La ciencia detrás de ella: comprender la difusión en modelos de texto a imagen

Para comprender el funcionamiento interno del modelo de IA de Google, es esencial comprender el concepto de difusión. En modelos de texto a imagen como Imagen, la difusión implica agregar gradualmente ruido a una imagen hasta que se vuelva irreconocible y luego eliminar el ruido para reconstruir la imagen original. Combinado con un modelo de lenguaje grande (LLM), este proceso genera imágenes realistas basadas únicamente en la entrada de texto.

También te puede interesar: Nextech3D.ai desarrolla IA generativa que convierte texto en modelos 3D

Revelando un enfoque nuevo: difusión basada en imágenes con atención cruzada

Tomando inspiración de Imagen, los investigadores de Google adoptaron la difusión para la prueba virtual pero con un giro. En lugar de utilizar entrada de texto, incorporaron un par de imágenes: una imagen de la prenda y una imagen de la persona en el proceso de difusión. Ambas imágenes interactúan entre sí a través de una red neuronal, utilizando una técnica llamada “atención cruzada”. Esta novedosa combinación de difusión basada en imágenes y atención cruzada forma la base del modelo de IA de Google para la prueba virtual.

Aprovechando el poder de los datos: el gráfico de compras de Google toma el escenario

Para asegurarse de que la función de prueba virtual sea lo más útil y realista posible, los investigadores de Google entrenaron su modelo de inteligencia artificial utilizando el inmenso conjunto de datos disponible a través del Google Shopping Graph. Este conjunto de datos completo abarca los últimos productos, vendedores, marcas, reseñas e inventarios, proporcionando una gran cantidad de información para mejorar la precisión y calidad de la experiencia de prueba virtual.

También lee: SQL Powers para revelar Insights en compras en línea en Brasil

Dominando el Realismo: Entrenamiento Riguroso con Millones de Pares de Imágenes

El modelo de IA de Google pasó por un riguroso entrenamiento para dominar el arte de generar visualizaciones realistas de ropa. Al usar millones de pares de imágenes que representan a personas vistiendo prendas en varias poses, el modelo de IA aprendió a igualar las formas de la prenda con diferentes poses del cuerpo. Este extenso proceso de entrenamiento permite al modelo de IA generar imágenes altamente realistas de ropa en diferentes modelos y desde múltiples ángulos.

Una Nueva Era de Exploración de Moda: Prueba Virtual Disponible Ahora

A partir de hoy, los entusiastas de la moda pueden experimentar la función de prueba virtual para tops de mujer de marcas reconocidas en el Google Shopping Graph. Marcas como Anthropologie, LOFT, H&M y Everlane son parte de este emocionante lanzamiento. La función de prueba virtual promete revolucionar la forma en que los usuarios exploran las opciones de moda en línea, proporcionando una experiencia interactiva e inmersiva.

Embarcándose en el Viaje de la Moda: Tops de Mujer de Marcas Líderes

Con la función de prueba virtual de Google, los usuarios ahora pueden visualizar sin esfuerzo los tops de mujer de una variedad de marcas populares. Ya sea explorando los diseños eclécticos de Anthropologie, la colección versátil de LOFT, la moda de tendencia de H&M o los estilos sustentables de Everlane, los usuarios ahora pueden ver cómo se ven estas prendas en modelos con diferentes formas y tamaños corporales.

El Futuro de la Prueba Virtual: Mejoras y Expansión de Marcas

La función de prueba virtual de Google es solo el comienzo. A medida que la tecnología evoluciona y mejora, la herramienta se volverá aún más precisa y se ampliará para incluir una selección más amplia de marcas favoritas de los usuarios. El futuro promete emocionantes mejoras y expansiones de marcas, brindando a los entusiastas de la moda el poder de probar virtualmente la ropa como nunca antes.

Más información: The DataHour: Ciencia de Datos en Retail

Nuestra Opinión

La línea entre las experiencias de compras en línea y fuera de línea se difumina con la función de prueba virtual de Google. Esta notable innovación, impulsada por modelos avanzados de IA y una gran cantidad de datos, revoluciona la forma en que exploramos las opciones de moda. También tiene el potencial de influir en cómo tomamos decisiones de compra informadas. La prueba virtual se volverá cada vez más realista y accesible en los próximos años. Con tales avances, el futuro de la moda en línea está listo para convertirse en algo más inmersivo, interactivo y adaptado a las preferencias individuales.