La mayoría de los lenguajes que han existido a lo largo de la historia han desaparecido ya, y se prevé que en torno al 50% de los que aún perviven dejen de hacerlo en el próximo siglo. Eso es especialmente grave cuando esto ocurre antes de que hayamos podido dejar registro de esas lenguas, de sus normas gramaticales, de su fonética y, sobre todo, de la traducción de sus términos.
Por eso es tan relevante poder contar ahora con un nuevo algoritmo de inteligencia artificial capaz de descifrar de forma automática lenguas ya perdidas que se han resistido durante décadas a los esfuerzos de los lingüistas.
Y no sólo eso, sino que es capaz de realizar su labor a partir de sólo unas pocas miles de palabras y sin contar con información previa sobre su relación con otras lenguas.
Completando el árbol genealógico de las lenguas
Dicho algoritmo ha sido desarrollado en el Laboratorio de Ciencias de la Computación e Inteligencia Artificial del MIT (CSAIL) por un equipo dirigido por la profesora Regina Barzilay, quien hace hoy un mes ganaba un premio de un millón de dólares otorgado por la Asociación para el Avance de la IA, por sus progresos usando esta tecnología para diagnosticar el cáncer y sintetizar medicamentos.
Para realizar su labor, el algoritmo se basa en lo que ya sabemos sobre la evolución de los lenguajes a lo largo del tiempo, pues la mayoría evoluciona siguiendo unos patrones predecibles: así, un 'p' puede convertirse en 'b' en un idioma descendiente (capitia > cabeza), pero será menos probable que lo haga en 'k', por la distancia fonética.
Dichas distancias son analizadas por el algoritmo insertando los sonidos que usamos los humanos dentro un modelo multidimensional que facilita la detección de patrones y, con ello, de relaciones de parentesco interlingüístico que hasta ahora no habíamos sido capaces de hallar…
…o bien de descartarla, como ha sido el caso de la teorizada relación entre las lenguas íberas y el actual vascuence, de la cual otra investigación similar realizada también en el MIT no ha hallado rastro, situando por ahora a los íberos como hablantes de una 'lengua aislada'.
El trabajo de Barzilay se basa en una investigación previa que se saldó hace un año con el descifrado de dos alfabetos ya olvidados: el ugarítico y la escritura 'linear B' micénica.
A futuro, Barzilay confía en aplicar esta tecnología para identificar el significado semántico de las palabras, incluso si aún no sabemos leerlas: eso permitiría identificar referencias a personas y lugares en los textos, permitiendo así a los historiadores dotarlos de contexto.
Vía | MIT News
Imagen | Dosseman (vía Wikipedia)
Ver todos los comentarios en https://www.genbeta.com
VER 4 Comentarios