Notimex
Foto: Agencia ID
La Jornada Maya

Ciudad de México
Domingo 26 de febrero, 2017

Académicos y estudiantes de la Universidad Nacional Atónoma de México (UNAM) crearon un repositorio digital nombrado Axolotl, que permite consultar documentos que cuentan con más de un millón de palabras con traducción del español al náhuatl.

El jefe del grupo de Ingeniería Lingüística del Instituto de Ingenieria (II) de la UNAM, Gerardo Sierra, señaló que en ese sitio web se ofrecen textos paralelos, traducciones del español al náhuatl o del náhuatl al español, con los que se puede saber qué oración corresponde a esa misma en la otra lengua (su significado y uso).

Dijo que atraer esos textos en una búsqueda determinada sirve para conocer cómo se utiliza una palabra en la otra lengua.

“Además, permite tener una base para la generación de léxico bilingüe entre ambos idiomas y una componente básica para hacer un sistema de traducción automática”, señaló en un comunicado de prensa.

Detalló que para crear este corpus paralelo se recurrió a técnicas de procesamiento del lenguaje natural e inteligencia artificial que permiten segmentar y paralelizar textos

La estudiante de posgrado y participante del proyecto Axolotl, Ximena Gutiérrez, precisó que se utilizaron tecnologías del lenguaje, un sistema de recuperación de la información y un software de reconocimiento óptico de caracteres.

Lo anterior, para que los usuarios puedan hacer búsquedas en las fuentes de la naturaleza paralela español-náhuatl, detalló.

Normalmente, los traductores de lenguas se basan en grandes colecciones, lo que facilita estadísticamente encontrar la equivalencia entre una palabra y otra.

Pero para desarrollar Axolotl el reto fue mayor, ya que luego de una búsqueda exhaustiva de documentos, se localizaron unos 30 libros traducidos del español al náhuatl o viceversa.

Entre ellos hay textos antiguos y actuales, con temáticas que van desde lo religioso e histórico hasta los cuentos o recetarios.

También fue necesario que el grupo multidisciplinario que creó este sitio web elaborara un diccionario que permitiera al reconocedor óptico de caracteres identificar de mejor manera las grafías del náhuatl.

Este tipo de software usualmente se enfoca a lenguas como el inglés y no funciona bien cuando se enfrenta a otras menos conocidas, precisó.

Axolotl está disponible para todo el público desde la dirección [a=http://www.corpus.unam.mx/axolotl]http://www.corpus.unam.mx/axolotl[/a], y lo usa principalmente estudiosos de la lengua, sobre todo del náhuatl, tecnólogos del lenguaje o ingenieros lingüistas, entre otros usuarios.


Lo más reciente

Reportan el desbordamiento del río Pánuco e inundaciones en Veracruz por impacto de 'Barry'; activan albergues temporales

Autoridades señalan que tras el paso de la tormenta no hay personas lesionadas o fallecida

La Jornada

Reportan el desbordamiento del río Pánuco e inundaciones en Veracruz por impacto de 'Barry'; activan albergues temporales

Abrirán en julio los primeros locales comerciales del Parque del Jaguar, en Tulum

De acuerdo con la información obtenida, serán dos restaurantes y una tienda boutique

Miguel Améndola

Abrirán en julio los primeros locales comerciales del Parque del Jaguar, en Tulum

Contraloría Ciudadana pide solución a inundaciones en Carmen

La inversión para este proyecto requiere la participación de los tres niveles de gobierno, señaló Javier Bello

La Jornada Maya

Contraloría Ciudadana pide solución a inundaciones en Carmen

Agricultura de EU anuncia reapertura gradual de la frontera con México para el ganado

El cierre se había aplicado por la expansión del gusano barrenador en el país

La Jornada

Agricultura de EU anuncia reapertura gradual de la frontera con México para el ganado