Seleccionar página

En este post abordaremos cómo detectar una copia en una tesis, poniendo como ejemplo, un caso de actualidad.

El País, como la mayoría de mass media, hacía eco de los resultados del cotejo documental realizado a la tesis del presidente del Gobierno, el Sr. Pedro Sánchez.

De entrada, nos sorprendían las discrepancias de resultados, Turnitin contabilizaba un 13% de coincidencia textual, frente al 0,96% en Plagscan -según informaba el rotativo-.

Uno puede pensar que, si el trabajo lo hace un software, deberían obtenerse los mismos resultados. Sin embargo, no es así, porque habría que analizar y comparar los parámetros que han empleado unos y otros para llegar a una cifra tan rotunda y tan dispar.

¿Qué significan estas cifras? Sencillamente que existe una coincidencia textual.

Estos días prensa y twiteros inundan páginas preguntándose sobre la validez de estos resultados, y se preguntan si estos softwares pueden equivocarse.

La experiencia profesional en Lingüística forense  permite a los especialistas medir el alcance y las limitaciones de este tipo de software. Veamos algunas de ellas:

  1. El programa detecta coincidencia, pero sabemos que no toda coincidencia es un plagio, porque se ha citado la fuente, se ha entrecomillado el texto y/o referenciado el autor.

Hay similitud textual pero ya sea por referencia al autor intelectual o por derecho de cita, aquella coincidencia, no es delictiva.

  1. El programa no discrimina si la información coincidente es original o del acervo público. Esto, ¿qué implica?

Sencillamente que existen expresiones, refranes, fechas, personajes, datos y hechos históricos, elementos del folklore y de la cultura popular, que pertenecen al conocimiento público y que el hecho de que aparezcan en dos documentos no significa que uno sea un plagio.

En una ocasión tuvimos el encargo de comparar dos obras que ilustraban la historia de la literatura; el software señalaba cuotas altísimas de coincidencia textual, pero se equivocaba.

El programa detectaba coincidencia en “Camilo José Cela nació el 11 de mayo de 1916 y falleció en Madrid el 17 de enero de 2002.”

20 palabras que engrosaban el porcentaje de plagio.

Y no es plagio, es un dato público y notorio y está expresado de una manera muy universal.

También se detectaban como coincidencia los títulos de libros y expresiones/sintagmas como: “década de los sesenta” “durante la Primera Guerra Mundial”, “mezcla de géneros literarios” “recupera su prestigio” “la Guerra Civil española” “el Premio Cervantes” etc, etc.

Hay coincidencia textual, pero no plagio.

Sencillamente son expresiones que aparecen en todos los libros de historia de la literatura, como el personaje de la princesa en las películas de Disney.

  1. El programa tampoco detecta la apropiación de una idea y el resumen que alguien hace de un texto ajeno sin referenciar el autor original.

En el cotejo documental a veces nos hemos encontrado que un escritor ha parafraseado, resumido o utilizado una información exclusiva de un autor sin referirlo.

Estos programas son útiles para alertar, detectar una posible copia o para comprobar cierto alcance de plagio, pero siempre, y tal como afirmaba el propio responsable de Turnitin en la entrevista publicada en El Pais, ha de ser una persona la que verifique la similitud.

Y una vez detectada la coincidencia textual, el perito va un poco más allá, no sólo para referenciar -si procede- el estilo literario de cada autor, sino también para discriminar el tipo y la idiosincrasia del plagio. Porque como ya hemos dicho en ocasiones, hay plagios conscientes porque se detectan pequeñas alteraciones del texto original, o bien plagios resultado de un burdo copiar/pegar en el que se transfieren, incluso, las erratas. Para esto sí que van bien los softwares.

Todavía, las máquinas van por detrás de los peritos forenses.