Unificando conjuntos de datos de imágenes-subtítulos y clasificación de imágenes con condicionamiento de prefijo

Publicado por Kuniaki Saito, Investigador Estudiantil, Equipo de IA en la Nube, y Kihyuk Sohn, Científico de Investig...

Pre-entrenamiento de lenguaje-visual mejorado con recuperación.

Publicado por Ziniu Hu, Investigador Estudiantil, y Alireza Fathi, Científico Investigador, Equipo de Percepción de G...