Traducir entre 100 idiomas sin pasar por el inglés: Facebook presenta M2M-100, una IA de código abierto

Facebook ha anunciado un nuevo e importante avance en sus herramientas de traducción automática, un progreso que podría ayudar a mejorar las comunicaciones entre los usuarios de todo el mundo en sus plataformas.

La compañía asegura que diariamente ofrecen 20.000 millones de traducciones en su News Feed, y ahora gracias a su inteligencia artificial M2M-100 afirman que serán capaces de traducir entre cualquiera de los 100 idiomas sin pasar por el inglés.

Del chino al francés sin pasar por el inglés

Este es un cambio importante, y Facebook asegura que "romper las barreras lingüísticas es una de las formas más importantes de unir a las personas, proporcionando información autorizada sobre el COVID-19 y mantenerlas a salvo de contenidos perjudiciales".

Aunque las herramientas de traducción han mejorado mucho en los últimos años (DeepL es un buen ejemplo de ello), todos nos hemos encontrado con traducciones un tanto robóticas o que no tienen demasiado sentido.

Facebook aclara que cuando se traduce (por ejemplo) del chino al francés, "la mayoría de los modelos multilingües centrados en el inglés se entrenan en el chino al inglés y en el inglés al francés, porque los datos de entrenamiento en inglés son los más disponibles".

Con M2M-100, Facebook entrena directamente en los datos del chino al francés "para preservar mejor el significado". Aseguran que son capaces de superar a los sistemas centrados en el inglés en 10 puntos (en la métrica BLEU, utilizada para evaluar las traducciones automáticas).

Es un cambio realmente importante, si tenemos en cuenta que de los miles de millones de publicaciones diarias en 160 idiomas en Facebook, dos tercios están en un idioma distinto al inglés.

Así lo ha señalado Angela Fan, una investigadora asociada de Facebook AI, a Engadget. Ella asegura que hay muchas regiones en el mundo donde la gente habla varios idiomas, y ninguno de ellos es inglés. No parece demasiado efectivo entonces utilizar sistemas de traducción que "dependen en gran medida de los datos de sólo inglés".

Aunque estos avances ya son significativos de por sí, uno de los puntos más importantes de este proyecto es que pasa a ser de código abierto para la comunidad de investigadores y así ayudar a impulsar nuevos avances.

Facebook ha dejado claro que también tiene previsto seguir desarrollando este sistema de manera independiente y, con el tiempo, incorporará la tecnología resultante a sus productos.

Ver todos los comentarios en https://www.genbeta.com

VER 1 Comentario

Portada de Genbeta