Mark Zuckerberg anunció este
lunes 22 de mayo que Meta abrió un nuevo modelo de inteligencia artificial (IA)
capaz de traducir y convertir textos y audios en más de 4 mil idiomas para
facilitar la comunicación y contribuir para preservar la diversidad lingüística
del mundo.
Zuckerberg también indicó
que MMS amplía la tecnología de voz (voz a texto y texto a voz) y puede generar
voces artificiales, así como la conversión de textos con los caracteres
correctos según la gramática de cada idioma.
Este nuevo modelo de IA con
sus códigos se compartirá con otros investigadores para que puedan utilizarlos
como referencia, así como una pequeña contribución para preservar la increíble
diversidad lingüística del mundo.
“Hoy abrimos otro nuevo
modelo de IA que llamamos Massively Multilingual Speech. Puede identificar más
de 4 mil idiomas hablados y facilitará a las personas conectarse y acceder a la
información en su idioma”, publicó Zuckerberg en su perfil de Facebook.
El proyecto Massively
Multilingual Speech (MMS) es en la actualidad uno de los modelos de
reconocimiento de voz con más opciones de idiomas. El MMS utiliza algoritmos y
técnicas de procesamiento de señales de audio con los que interpreta y
transcribe las palabras habladas al idioma que el usuario seleccione y se lo
facilita en un formato sencillo.
“Para superar todos los
obstáculos recurrimos a textos religiosos, como la Biblia, que se tradujeron a
muchos idiomas distintos y cuyas traducciones se estudiaron en profundidad para
investigar la traducción de textos lingüísticos”, indicó Meta debido a que esas
traducciones cuentan con grabaciones de audio, a disposición del público, de
personas leyendo estos textos en diferentes idiomas.
“Como parte de este
proyecto, creamos un conjunto de datos de lecturas del Nuevo Testamento en más
de mil cien idiomas, lo que proporcionó un promedio de 32 horas de datos por
idioma”, agregó la compañía.
Según Meta, muchos idiomas
del mundo están en peligro de desaparecer y las limitaciones de las tecnologías
actuales de reconocimiento y generación de voz solo acelerarán esta tendencia.
“Nuestra visión es un mundo en el que la tecnología tenga el efecto contrario,
que anime a las personas a preservar sus idiomas a raíz de poder acceder a la
información y utilizar la tecnología en su idioma de preferencia”, indicó la
compañía.
“Nuestro objetivo es facilitar a las personas
el acceso a la información y el uso de los dispositivos en su idioma de
preferencia. También hay muchos casos de uso concretos de la tecnología de voz,
como la tecnología de VR/AR (que puede utilizarse en el idioma que prefiera la
persona) o los servicios de mensajes que pueden entender la voz de cualquier persona”,
afirmó Meta.
MMS promete un modelo futuro
capaz de resolver varias tareas de voz en cualquier idioma. “Aunque entrenamos
modelos distintos de reconocimiento de voz, síntesis de voz e identificación de
idiomas, creemos que, en el futuro, un único modelo podrá realizar todas estas
tareas y muchas más, lo que permitirá mejorar el rendimiento general”, se
indicó en un comunicado.