Pasar al contenido principal
x

Crea UNAM traductor de lenguas indígenas al castellano

lenguas
Foto(s): Cortesía
Agencia Reforma

Agencia Reforma

Especialistas del Instituto de Investigaciones en Matemáticas Aplicadas y Sistemas (IIMAS) de la UNAM desarrollan un programa que busca traducir de forma automática lenguas indígenas al castellano.
 
La universidad explicó en un comunicado que con este software podrían traducirse wixárica, que se habla en Nayarit; ayuuk, hablado en Oaxaca; mexicanero, en Durango; yorinoqui, en el Estado de México, así como náhuatl clásico y moderno.
 
La intención es que la traducción se realice de manera automática, como ocurre con los traductores de inglés al castellano.
 
México cuenta con 68 agrupaciones lingüísticas, según el catalogo del Instituto Nacional de Lenguas Indígenas (Inali). Una de ellas es el ayapaneco, que se utiliza en Tabasco, pero quedan muy pocos hablantes, comentó Iván Vladimir Meza Ruiz, titular del proyecto e investigador del IIMAS.
 
Delfino Zacarías Márquez Cruz, alumno de maestría, trabaja en un método de interpretación de ayuuk o mixe. Tuvo que realizar trabajo de campo porque no había recursos para entrenar el modelo con el que funcionaría su traductor.
 
Se basa en redes neuronales, un modelo computacional que imita el proceso de traducción de una lengua a otra. Para eso se requieren ejemplos, como frases traducidas entre ambas, explicó Meza Ruiz.
 
Márquez Cruz recopiló información para el corpus o cuerpo de datos, que comprende ejemplos de frases equivalentes en ambas lenguas para que el programa aprende a reconocerlas.
 
"Para lenguas originarias, los corpus más grandes están en cerca de los 10 mil ejemplos, en comparación con los millones de los sistemas comerciales. Estamos muy lejos de tener una experiencia similar a la que tenemos al usar un traductor normal porque tenemos muy poquitos datos", comentó.
 
Otra dificultad es que las lenguas indígenas de México son más orales que escritas, así que su escritura es contemporánea. En algunos casos todavía no se decide cómo se escriben ciertas palabras y conceptos.
 
Además, existen retos para casos particulares, como el wixárica, que se compone de varios vocablos con partículas morfológica, así que lo que en español podría parecer una frase, en realidad es una palabra. 
 
El traductor de wixárica a español puede consultarse en línea. Es un proyecto de Jesús Manuel Mager Hois, egresado de la maestría en Ciencias de la Computación de la UAM.

Noticias ¡Cerca de ti!

Conoce los servicios publicitarios que impulsarán tu marca a otro nivel.