A finales de 2018 Google nos dejó conocer sus planes iniciales para comenzar a ofrecer traducciones sin sesgos de género en su traductor. Google Translate dejaría de asignar un género específico a la traducción de palabras que son de género neutro en un idioma. Es algo que pasa mucho en traducciones de inglés a español, por ejemplo algo como "a doctor" que es neutro en inglés, se traducía como "un doctor" al español.
La solución inicial: ofrecer traducciones para género femenino y masculino a la vez, indicando que la traducción distingue por género. Hoy, esos planes han avanzado un poco más, y en Genbeta hemos conversado con Romina Stella, directora de producto en Google Research enfocada en los sesgos de género en el Machine Learning para que nos cuente sobre los retos de ofrecer traducciones más neutras en un mundo que aboga cada vez más por un lenguaje más inclusivo.
Un traductor que no adivina el género del sujeto en una frase sino que aprende dónde cambia el género
Romina nos cuenta que dos han sido los avances más importantes a la hora de resolver los sesgos de género del traductor. El primero es que Google Translate ya no solo ofrece traducciones que distinguen por género para palabras únicas, sino para frases completas desde inglés a español.
Por ejemplo, para una frase como "my friend is a doctor" en la que no se sabe el género de ese amigo, porque en inglés tanto "friend" como "doctor" son de genero neutro, el traductor ofrece dos frases de respuesta: "mi amiga es doctora" o "mi amigo es doctor".
El segundo gran avance es uno que aún no han aplicado a las traducciones inglés español, pero que básicamente cambia el modelo de machine learning a la hora de generar esas dos opciones.
El modelo viejo generaba las dos opciones y nosotros verificábamos que fuesen iguales y de alta calidad, lo que pasaba es que muchas veces esas opciones se perdían porque el modelo generaba traducciones que no eran exactamente iguales. El modelo nuevo genera una sola traducción, ya sea masculina o femenina, y otro modelo de machine learning se encarga de reescribir esa traducción con el otro género.
En español todo es más complicado
La ventaja es que poder reescribir las traducciones en lugar de tener que generarlas todas, hace que se puedan ofrecer las que distinguen por género para muchísimas más frases. Esto es algo que por ahora funciona solo con finlandés, persa, húngaro, y turco a inglés, y aunque español aún usa el modelo viejo, la idea es reemplazarlo con este pronto.
Romina nos explica que en español es mucho más complicado porque hay muchísimas más palabras que varían por género, no solo los términos que se refieren a personas "En español todo varía, varían los artículos, los adjetivos, en inglés de alguna manera es un poco más fácil porque la cantidad de términos que varían es un poco más reducida".
Y cuando el género no es binario...
Si las traducciones sin sesgo de género están apenas despegando, es lógico pensar que traducciones más inclusivas que tomen en cuenta además los géneros no binarios, sean aún más difíciles. Romina nos dice que es algo que en Google están tomando en cuenta a pesar de los muchos desafíos tecnológicos que existen: "necesitamos aprender, estamos avanzando y somos plenamente conscientes de esto".
De hecho, al menos para la versión en inglés, dentro de Gmail decidieron eliminar los pronombres femeninos y masculinos de las predicciones justo para evitar sugerencias que puedan llevar a equivocarse con el género de una persona. "No todos los errores son iguales y el género es algo muy importante como para equivocarse", decía en aquel entonces Paul Lambert, director de producto de Gmail.
En el caso del traductor es un tema más desafiante porque necesitan aprender cómo se manejan en cada idioma, y aunque en inglés parecería que "they y them" son los pronombre más usados para referirse al género neutro, hay muchos pronombres diferentes que pueden usarse para gente que no se identifica con género masculino o femenino.
"En español es bastante más complejo, vemos el uso de la 'x', vemos el uso de la @, vemos el uso de la 'e', vemos gente intentando usar lenguaje neutral a pesar de lo difícil que es en un español que tiene tanto género". Es algo en lo que están pensando, pero que simplemente no han podido resolver.
Google consulta con muchísimos especialistas para esto, muchos son lingüistas, pero como comenta Stella, ni ellos lo entienden todo. Necesitan aprender no solo cómo funciona el idioma sino cómo se usa.
El español es hablado por una enorme cantidad de países, y cada uno tiene sus propias particularidades, y la visión de las personas y las sociedades sobre los temas de género también es sumamente distinta en la mayoría de ellos.
Ver 6 comentarios