Notimex
Foto: Agencia ID
La Jornada Maya

Ciudad de México
Domingo 26 de febrero, 2017

Académicos y estudiantes de la Universidad Nacional Atónoma de México (UNAM) crearon un repositorio digital nombrado Axolotl, que permite consultar documentos que cuentan con más de un millón de palabras con traducción del español al náhuatl.

El jefe del grupo de Ingeniería Lingüística del Instituto de Ingenieria (II) de la UNAM, Gerardo Sierra, señaló que en ese sitio web se ofrecen textos paralelos, traducciones del español al náhuatl o del náhuatl al español, con los que se puede saber qué oración corresponde a esa misma en la otra lengua (su significado y uso).

Dijo que atraer esos textos en una búsqueda determinada sirve para conocer cómo se utiliza una palabra en la otra lengua.

“Además, permite tener una base para la generación de léxico bilingüe entre ambos idiomas y una componente básica para hacer un sistema de traducción automática”, señaló en un comunicado de prensa.

Detalló que para crear este corpus paralelo se recurrió a técnicas de procesamiento del lenguaje natural e inteligencia artificial que permiten segmentar y paralelizar textos

La estudiante de posgrado y participante del proyecto Axolotl, Ximena Gutiérrez, precisó que se utilizaron tecnologías del lenguaje, un sistema de recuperación de la información y un software de reconocimiento óptico de caracteres.

Lo anterior, para que los usuarios puedan hacer búsquedas en las fuentes de la naturaleza paralela español-náhuatl, detalló.

Normalmente, los traductores de lenguas se basan en grandes colecciones, lo que facilita estadísticamente encontrar la equivalencia entre una palabra y otra.

Pero para desarrollar Axolotl el reto fue mayor, ya que luego de una búsqueda exhaustiva de documentos, se localizaron unos 30 libros traducidos del español al náhuatl o viceversa.

Entre ellos hay textos antiguos y actuales, con temáticas que van desde lo religioso e histórico hasta los cuentos o recetarios.

También fue necesario que el grupo multidisciplinario que creó este sitio web elaborara un diccionario que permitiera al reconocedor óptico de caracteres identificar de mejor manera las grafías del náhuatl.

Este tipo de software usualmente se enfoca a lenguas como el inglés y no funciona bien cuando se enfrenta a otras menos conocidas, precisó.

Axolotl está disponible para todo el público desde la dirección [a=http://www.corpus.unam.mx/axolotl]http://www.corpus.unam.mx/axolotl[/a], y lo usa principalmente estudiosos de la lengua, sobre todo del náhuatl, tecnólogos del lenguaje o ingenieros lingüistas, entre otros usuarios.


Lo más reciente

Bancos agradecen a AMLO no haber cambiado las reglas del sector como ofreció en 2019

Atravesamos uno de nuestros mejores momentos en cuanto a generación de ganancias: ABM

La Jornada

Bancos agradecen a AMLO no haber cambiado las reglas del sector como ofreció en 2019

Nahuel Guzmán, suspendido 11 partidos por usar láser para molestar a portero rival

El arquero de los Tigres está lesionado desde marzo, cuando fue operado de la rodilla derecha

Ap

Nahuel Guzmán, suspendido 11 partidos por usar láser para molestar a portero rival

Cecilia Patrón fortalecerá la infraestructura y cultura vial para caminar con más seguridad en Mérida

Recordó que su plan contempla también la implementación de paraderos con luz e internet

La Jornada Maya

Cecilia Patrón fortalecerá la infraestructura y cultura vial para caminar con más seguridad en Mérida

Afore Azteca ''siempre ha cumplido con la ley'', asegura Grupo Salinas

Esto tras los cometarios de AMLO sobre campaña de desinformación emprendida por Tv Azteca

La Jornada

Afore Azteca ''siempre ha cumplido con la ley'', asegura Grupo Salinas