Investigadores de Skoltech y AIRI han desarrollado un nuevo algoritmo para la transferencia óptima de datos entre dominios utilizando redes neuronales

Investigadores de Skoltech y AIRI han creado un algoritmo para transferir datos entre dominios con redes neuronales.

Desde la aparición de los OT (Transporte Óptimo) a gran escala y los GANs de Wasserstein, el aprendizaje automático ha abrazado cada vez más el uso de redes neuronales para resolver problemas de transporte óptimo. El plan OT ha demostrado recientemente ser utilizable como un modelo generativo con un rendimiento comparable en tareas reales. El costo OT se calcula y se utiliza a menudo como función de pérdida para actualizar el generador en modelos generativos.

El Instituto de Investigación de Inteligencia Artificial (AIRI) y Skoltech han colaborado en un nuevo algoritmo para optimizar el intercambio de información entre disciplinas utilizando redes neuronales. Los fundamentos teóricos del algoritmo hacen que su resultado sea más fácilmente comprensible que los métodos competidores. A diferencia de otros enfoques que necesitan conjuntos de datos de entrenamiento acoplados como ejemplos de entrada-salida, el nuevo enfoque puede ser entrenado en conjuntos de datos separados de los dominios de entrada y salida.

Los conjuntos de datos de entrenamiento grandes son difíciles de conseguir, sin embargo, son necesarios para los modelos de aprendizaje automático modernos construidos para aplicaciones como el reconocimiento facial o de voz y el análisis de imágenes médicas. Es por eso que los científicos e ingenieros a menudo recurren a simular conjuntos de datos del mundo real a través de medios artificiales. Los avances recientes en modelos generativos han facilitado mucho esta tarea al mejorar drásticamente la calidad del texto e imágenes generadas.

Se enseña a una red neuronal a generalizar y extender a partir de muestras de entrenamiento emparejadas y conjuntos de imágenes de entrada-salida a nuevas imágenes entrantes; esto es útil para trabajos donde se deben procesar muchas fotos idénticas de calidad variable. En otras palabras, los modelos generativos facilitan la transición de un dominio a otro al sintetizar datos de diferentes fuentes. Una red neuronal puede, por ejemplo, convertir un dibujo hecho a mano en una imagen digital o mejorar la claridad de una foto satelital.

Alinear distribuciones de probabilidad con mapas de transporte deterministas y estocásticos es un uso único de la tecnología, que es una herramienta general. El método mejorará los modelos existentes en dominios distintos a la traducción no emparejada (restauración de imágenes, adaptabilidad de dominio, etc.). El enfoque permite un mayor control sobre el nivel de variedad en las muestras producidas y una mejor interpretabilidad del mapa aprendido en comparación con los métodos comunes basados en GANs o modelos de difusión. Los mapas OT que los investigadores adquieren pueden necesitar ser revisados para actividades no emparejadas. Los investigadores resaltan el diseño del costo de transporte para ciertas tareas como un área de estudio potencial.

La intersección entre el transporte óptimo y el aprendizaje generativo se encuentra en el corazón del enfoque elegido. Los campos del entretenimiento, el diseño, los gráficos por computadora, el renderizado, etc., utilizan extensivamente modelos generativos y transporte eficiente. Varios problemas en los sectores mencionados pueden ser adecuados para el enfoque. La posible desventaja es que algunas profesiones en el negocio de la gráfica pueden verse afectadas por el uso de las herramientas anteriores, que permiten hacer tecnologías de procesamiento de imágenes públicamente disponibles.

Frecuentemente, los investigadores tienen que conformarse con conjuntos de datos no relacionados en lugar de los datos emparejados ideales debido a su costo prohibitivo o dificultad de adquisición. El equipo volvió a los escritos del matemático y economista soviético Leonid Kantorovich, basándose en sus ideas sobre el transporte eficiente de carga (la teoría del transporte óptimo) para desarrollar un método novedoso para planificar la transferencia óptima de datos entre dominios. El transporte óptimo neural es un enfoque novedoso que utiliza redes neuronales profundas y conjuntos de datos separados.

Cuando se evalúa en la transferencia de dominio no emparejada, el algoritmo logra mejores resultados que los enfoques de vanguardia en la estilización de imágenes y otras tareas. Además, requiere menos hiperparámetros, que suelen ser difíciles de ajustar, tiene un resultado más interpretable y se basa en una base matemática sólida que los métodos competidores.