La Jornada Maya
Foto: Afp

Ciudad de México
Lunes 08 de mayo, 2017

El delito del plagio digital podría llegar a su fin. Los artífices del [i]copy[/i]-[i]paste[/i] pueden sentirse vulnerados ante una herramienta que se desarrolla en la UNAM. Símil es el nombre de este proyecto, en estado de prototipo; se trata de un software que detecta la paráfrasis o similitud total de oraciones en diferentes textos, y los ordena y categoriza de mayor a menor.

Gerardo Sierra Martínez, titular del Grupo de Ingeniería Lingüística (GIL) del Instituto de Ingeniería (II) de la UNAM, explicó que se pretende detectar la semejanza entre textos, aunque la idea no se exprese con las mismas palabras.

Este programa compara un par de textos para saber si hay similitud y paráfrasis, no dictamina si se citó o no se citó, o si se viola el derecho de autor; simplemente determina: “este texto es similar a este otro, eso es todo”, enfatizó.

Puede ser que leamos todo un documento y retomemos una idea de un párrafo, y una más de otro, y las combinemos para crear un texto propio, eso es paráfrasis; es reutilizar información que se tiene de otro documento, explicó.

El abordaje de Símil para buscar textos coincidentes es complejo, porque se indagan caracteres y se encuentran aquellos que están escritos tal cual en una oración.

Las personas utilizan sinónimos, pero los sustantivos, que son las palabras clave, difícilmente saben decirlas de otra manera; por eso es importante indicar que el texto o idea referida no es propia, apuntó el académico del II.

Para probar el programa se hizo un corpus propio de paráfrasis. “Regularmente se ensaya con los encabezados de las noticias; en nuestro caso fue con un texto de la historia del sushi, extraído de Wikipedia; es un escrito relativamente pequeño, con 27 frases, y se le proporcionó a varias personas (expertos, estudiantes e incluso niños) para que lo parafrasearan, con ciertas condiciones”.

Logramos que nuestro método hiciera una detección objetiva, pues mediante el uso de las matemáticas, números y la ciencia no hay manera de mentir al comparar automáticamente textos o corpus paralelos. “Así se establece cuáles son las palabras emparentadas, es decir, la similitud textual”, subrayó.

El programa universitario sistematiza las frases y muestra en una tabla en rojo las que tienen mucha cercanía al texto original, en amarillo las que tienen menor grado, y en gris las que casi no tienen similitud.

Sierra Martínez ejemplificó con una oración con paráfrasis baja del mencionado texto de Wikipedia. La original reza: “El resultado era un pescado conservado en una pieza y con un olor desagradable”, y la oración parafraseada se lee: “Lo que concluyó que el pescado conservado tiene mal olor y en una sola pieza”.

Según el integrante del II, se ha incrementado el reúso de frases y de información, y es un hecho que se ha vuelto un hábito desde la educación básica. “A los niños les dicen que si sacan información de Internet no hay problema”.

Entonces, aunque alguien transcriba una tesis con sus propias palabras de principio a fin y le añada una serie de citas e información adicional, e incluso se usen recursos para disfrazar que se trata del mismo documento, siempre habrá cierto léxico que coincidirá.

Esta investigación se realiza con patrocinio del Consejo Nacional de Ciencia y Tecnología y fue derivada de otra que se emprendió hace cuatro años en la licenciatura en Ciencia Forense de la UNAM, la Universidad de Avignon y la Universidad Pompeu Fabra.

“La aportación de esta herramienta no será tan positiva para la gente que está acostumbrada a parafrasear, pero será benéfica en el ámbito académico, para que los alumnos aprendan a citar lo que toman de otro documento y sepan dar referencias adecuadas”.

No es malo copiar y pegar, siempre y cuando se establezca dentro de ciertos límites. Símil es un proyecto de largo aliento que requiere auspicio y apoyo financiero para su continuidad, concluyó.


Lo más reciente

Desarticula FGE red criminal responsable del asesinato del hijo de un policía en Chetumal

Al grupo también se le vincula con hechos de narcomenudeo

La Jornada Maya

Desarticula FGE red criminal responsable del asesinato del hijo de un policía en Chetumal

INM recibe a 28 personas de Cuba rescatadas en altamar por un crucero internacional

Personal del navío turnó a los migrantes a las autoridades en la isla

La Jornada Maya

INM recibe a 28 personas de Cuba rescatadas en altamar por un crucero internacional

Rommel Pacheco se compromente a impulsar deporte e industria creativa

El aspirante a la alcaldía convivió con jóvenes ciberatletas

La Jornada Maya

Rommel Pacheco se compromente a impulsar deporte e industria creativa

Con Cecilia Patrón, menos trámites para generar más empleos

La candidata propone crear un Expediente Único Municipal

La Jornada Maya

Con Cecilia Patrón, menos trámites para generar más empleos