ElevenLabs lanza Eleven Multilingual v2 un modelo de habla de IA que admite 30 idiomas

ElevenLabs lanza Eleven Multilingual v2, un modelo de habla de IA con soporte para 30 idiomas.

Investigaciones recientes realizadas por ElevenLabs han lanzado un modelo de generación de voz multilingüe llamado Eleven Multilingual v2 que produce audio de IA ’emocionalmente rico’ en casi 30 idiomas. Este trabajo permitirá a los productores localizar audio para los mercados europeos, asiáticos y de Oriente Medio.

El equipo de investigación estudió los indicadores del habla humana durante 18 meses y desarrolló nuevos métodos para detectar el contexto, expresar emociones en la generación del habla y sintetizar nuevas voces distintivas. El modelo reconoce automáticamente casi 30 idiomas escritos y genera voz en ellos con un nivel de autenticidad sin precedentes cuando se introduce texto en la plataforma de texto a voz de ElevenLabs.

La voz clonada o sintética conserva las características distintivas de la voz del hablante, como su acento nativo, en todos los idiomas hablados. Ahora es posible utilizar la misma voz para animar material en 28 idiomas diferentes.

Este lanzamiento se produjo después de que la plataforma permitiera a todos los autores utilizar la clonación de voz profesional. Los usuarios ahora pueden crear una réplica digital de su voz que es prácticamente indistinguible de la original gracias a esta actualización, que se lanzó junto con mejoras en la seguridad y protecciones. Además de los idiomas existentes (inglés, polaco, alemán, español, francés, italiano, hindi y portugués), el nuevo modelo también admite chino, coreano, holandés, turco, sueco, indonesio, filipino, japonés, ucraniano, griego, checo, finlandés, rumano, danés, búlgaro, malayo, eslovaco, croata, árabe clásico y tamil.

ElevenLabs ha verificado que la plataforma sale de la versión beta hoy, tras la introducción de nuevas funciones y mejoras continuas. Este cambio representa un punto de inflexión en el compromiso de la empresa de servir a sus más de 1 millón de usuarios en todo el mundo con recursos confiables y de vanguardia.

ElevenLabs también está trabajando en un método que permitirá a los usuarios colaborar con la IA para crear nuevo audio a través de la plataforma.

Agregando texto a voz en varios idiomas al contenido visual, la aplicación lo hace más accesible para personas con discapacidades visuales u otras necesidades de aprendizaje. Algunos ejemplos son los siguientes:

  1. La herramienta de generación de habla multilingüe abre nuevas posibilidades para desarrolladores y editores de juegos independientes para traducir experiencias de juego y contenido de audio para audiencias internacionales, permitiéndoles conectar con jugadores y oyentes en sus idiomas sin sacrificar calidad ni precisión.
  2. De manera similar, las escuelas ahora tienen los recursos para proporcionar a los estudiantes acceso oportuno a contenido de audio de alta calidad en idiomas objetivo, mejorando las habilidades de escucha y pronunciación de los estudiantes y satisfaciendo una variedad de preferencias de instrucción dentro de su cuerpo estudiantil internacional.

Al reducir el tiempo y los gastos necesarios para producir audio de alta calidad en numerosos idiomas, ElevenLabs ayuda a las empresas y creadores a producir contenido más original y accesible que sea comprensible para personas de todos los orígenes e idiomas.