You are on page 1of 15

SOFTWARE PARA

DETECTAR EL PLAGIO Curso: Análisis y


Especificación de
Requisitos

Integrantes:
- Ugaz Leonardo Luis
- Efio Rivas Héctor
- Pérez Ramos María
Profesor:
- Torres Benavides Juan Antonio
¿Por qué es malo copiar o plagiar el trabajo de otros? Principalmente porque
vuestra reputación queda en entredicho. Estos días nos estamos hartando de noticias donde a
distintos políticos se les acusan de plagiar sus trabajos académicos (también de políticos que
obtienen tratos de favor en la realización de sus estudios). Pero no solamente el daño que se
puede causar a vuestra reputación es lo único que puede pasar, también el plagio puede
tener consecuencias legales, multas, expulsión del trabajo o centro de estudios, y el malestar de
las personas que han sido plagiadas.

Nacimiento de los Sistemas de detección automática de plagio


Ante la imposibilidad de los organismos (comisiones éticas y universidades) para poder evitar el
plagio y a la abrumadora cantidad de sitios que deben ser vigilados (editoriales de revistas, sitios
web y las aulas escolares), fue que nacieron los primeros sistemas de detección automática de
plagio. La universidad de Virginia desarrollo el WCopyFind, la universidad de Hertfordshire
propuso el Ferret Plagiarism Detector y Stanford su SCAM (Stanford Copy Analysis Mechanism).

Muchas de estas primeras soluciones no mostraron muy buena eficacia; esto se debía
principalmente a cualquiera de las siguientes dos razones: (1) Algunas de las propuestas eran
técnicas no muy apropiadas para esta tarea pues estaban muy influenciadas por las
preexistentes de la recuperación de información; o (2) El abuso de la tendencia por usar técnicas
de fingerprint. Estas técnicas eran utilizadas principalmente por las librerías on-line que tenían
interés en saber si alguno de los contenidos que comercializaban se encontraban disponibles en
la red (colocados Detección automática de plagio basada en la distinción y fragmentación del
texto reutilizado 8 posiblemente por algún inescrupuloso cliente), por tanto, las técnicas con
este enfoque sólo han sido efectivas para encontrar plagios en los cuales el texto robado
presente pocas o nulas modificaciones.

Entre más elaborado sea el plagio más difícil es que los sistemas automáticos lo puedan detectar;
inclusive algunos estudiantes han aprendido el tipo y cantidad de modificaciones necesarias
para poder eludir los sistemas de detección automática utilizados en las universidades.

Rasgos observados en la detección automática de plagio


Existen algunas características observadas en la revisión de obras plagiadas que han dado pie a
ser integradas en el análisis automático, motivando ciertas técnicas de detección de plagio. Estas
características son enlistadas, extendidas y revisadas por el mismo autor; las enunciamos (junto
con unas pocas adicionales) mencionando brevemente cuál es el objetivo de su observación en
el plagio:

1. Uso del vocabulario:


El vocabulario usado en un nuevo documento debe de ser consistente con los
documentos previamente presentados por el estudiante; la aparición de una gran
cantidad de nuevo vocabulario no es común, en especial si éste es más avanzado
que el de su nivel habitual.
2. Cambios de vocabulario:
Estos cambios se refieren a los que suceden en el interior del documento; si párrafos
o secciones del escrito contienen vocabularios distintos (provocados quizá por
estilos o calidades diferentes), es probable que esto suceda porque han sido escritos
por personas distintas, lo que abre la posibilidad de que alguna de esas porciones
de texto sea plagiada.
3. Texto incoherente:
Si a través del texto se presentan inconsistencias (como cambios de persona en la
narración) puede deberse a que no haya sido escrito a conciencia o a que tiene
insertos fragmentos escritos por algún otro autor.
4. Puntuación:
Es improbable que dos autores distintos usen la puntuación de la misma manera.
5. Cantidad de texto común:
Es habitual que documentos que abordan el mismo tema (inclusive aquellos que
sólo son de temas relacionados) compartan cierta cantidad de texto, básicamente
nombres y términos específicos del área; pero si se trata de documentos escritos de
forma independiente, esta cantidad de texto similar o idéntico debería ser pequeña.
6. Distribución de palabra:
La distribución de las palabras se refiere a su frecuencia o habitualidad en
determinado documento. Cada autor prefiere el uso de ciertos términos en lugar de
otros; por lo que encontrar varias palabras que sean usadas con la misma frecuencia
da pie a pensar que dichos textos están influenciados y que podría tratarse de un
plagio.
7. Estructura sintáctica:
Un indicativo del plagio es que los textos compartan las mismas estructuras
sintácticas, referidas al estilo; se espera que la selección de la mayoría de las reglas
sintácticas usadas por autores distintos sea diferente.
8. Referencias incongruentes:
La existencia de referencias a fuentes no enlistadas en la bibliografía o referencias
numeradas que no se encuentra en el orden adecuado, sugiere que pudieron ser
dejadas por descuido o ingenuidad al realizar un plagio.
9. Variaciones de formato:
Si el documento tiene más de un formato (tipo y tamaño de letra, interlineado,
justificación, etc.) a través del texto, puede deberse al copiado y pegado de
secciones de otros trabajos.

Herramientas de detección de plagio existente


Hasta hoy en día se ha desarrollado un gran número de software útiles para detectar el plagio
en textos y en otros tipos de trabajo, pero no existe ninguna que sea 100% efectiva.

 Tipos de herramientas
a) Herramientas online
b) Herramientas locales (escritorio)
 Beneficios de las herramientas existentes
a. Permite analizar grandes cantidades de documentos de manera rápida
b. Existe un amplio soporte a diferentes formatos de documentos de texto
c. Las herramientas ahorran tiempo a los educadores en revisar cosos de plagio

Este reporte, elaborado por la Dra. Azucena Montes (Grupo de Ingeniería Lingüística, UNAM)
para el Seminario universitario de Estudios del discurso forense, presenta la descripción de 12
sistemas de detección de plagio, localizados en la web. Un sistema de detección de plagio es
aquel que se encarga de detectar automáticamente la semejanza entre dos textos, uno de ellos
es el dubitativo y, el otro, el plagiado. La instalación de alguno de estos programas en las
computadoras personales permite identificar, con significativo margen de seguridad, trabajos
en los que detecta alguna forma de plagio.
NOMBRE DEL LINK PAÍS/ IDIOMA DESCARGABLE TIPOS DE RESULTADOS PAGO/
SISTEMA INSTITUCIÓN / EN LÍNEA GRATU
ITO
1 PLAGIUM http://www.pla Septet Inglés En línea Fuentes de coincidencia Gratuito
gium.com Systems Inc. Francés Porcentaje de
Estados Alemán semejanza
Unidos y Italiano
Europa Portugués
Español
2 COPIONIC http://copionic. Citilab, Centro Español En línea Fuentes de coincidencia Gratuito
citilab.eu/ para la Porcentaje de
Innovación semejanza
Social y Digital
de Barcelona
3 WCOPYFIND http://plagiaris Universidad Inglés En línea Resalta el texto plagiado Gratuito
m.bloomfieldm de Virginia, Español
edia.com/z- EEUU
wordpress/

4 EDUCARED www.educared. Silicon Artist, Español En línea Está en desarrollo. Gratuito


ANTIPLAGIO org Madrid,
España

5 APPROBO http://approbo. Symmetric Español En línea Porcentaje de Gratuito


citilab.eu/ (empresa semejanza
española)

6 JPLAG https://www.ip Universidad Alemán En línea Da las fuentes de donde Gratuito


d.uni- Karlsruhe, Francés proviene el plagio
karlsruhe.de/jpl Alemania Español Resaltan el texto
ag/ Portugués plagiado

7 COPYSPACE http://www.cop Indigo Stream Multilingüe En línea 10 sitios por búsqueda Gratuito
yscape.com/ Technologies,
Ltd
8 COPY SPACE http://www.cop Indigo Stream Multilingüe En línea Resultados ilimitada Pago
yscape.com/ Technologies,
Ltd

9 TURNITIN http://www.tur Universidad 11 idiomas, En línea Fuentes de coincidencia Pago


nitin.com de Berkeley, entre ellos el Porcentaje de anual
California español. semejanza

10 URKUND http://www.urk Prioinfo, Inglés Se envía un e- Pago por


und.com/int/en empresa Alemán mail búsqueda
/ sueca Francés conocer@urk
Turco und.es, y
Polaco devuelven los
Español resultados
Sueco
11 EASY http://www.can Canexus, El programa Descargable Sitios de plagio Pago por
VERIFICATION exus.com/ Canadá está en inglés Porcentaje de licencia
ENGINE semejanza permanente
Resalta el texto plagiado
12 PLAGIARISM http://www.pla Skyline Inc Inglés En línea o Porcentaje de Pago
DETECTOR giarism- Español Descargable, semejanza
detector.com/ Italiano dependiendo Resalta el texto plagiado
Alemán de la licencia
Francés
Japonés
China

 Descripción de algunas herramientas


I. Turnitin

Detección de plagio en línea cuyo servicio es plagio, cuneta con el soparte para
documentos en español en formato PDF, provee servicios para detectar plagio tanto en
trabajos académicos, escueles, editoriales, periódicos, etc. Esta es una de las
herramientas de detección de plagio más completas. Dispone de una amplia base de
datos y tiene una funcionalidad llamada “Grade Mark”, que incluye comentarios de los
documentos o textos revisados. Asimismo, cuenta con una herramienta de evaluación
que indicará la evolución de los escritores y elaborará informes de su desempeño.
II. Viper

Viper es también una solución de escaneo y detección de plagios de renombre. Se trata


de una herramienta de pago, aunque cuenta con una versión gratuita que permite
realizar el escaneo de un documento de hasta 30.000 palabras cada semana. Quizá es
un poco limitado para profesores, pero puede estar bien para pruebas puntuales. En
cuanto a sus características, tiene soporte para español, 10.000 millones de fuentes
desde las que analizar los textos. Entre estas fuentes hay libros, periódicos y revistas en
la web. También ofrece asistencia personalizada, informes descargables y la promesa de
que los documentos no se mantienen online por la empresa.

III. WCopyFind

Está basada en n-gramas, por lo cual el documento que se va analizar puede estar en
cualquier idioma. Es una alternativa de código abierto basada en Windows que compara
documentos e informes similares para buscar parecidos en su texto. Por lo tanto, no
compara los textos con una base de datos online, sino que buscar plagios en textos que
ya tienes y añades tú de forma manual a la aplicación. A cambio de esta limitación, tienes
una aplicación totalmente gratuita. Entre las cosas que puedes hacer, aunque la
configuración es algo compleja, están el escribir fuentes de webs de noticias para buscar
similitudes, crear listas de palabras que se repiten o analizar tus hábitos de escritura
para resaltarte frases sobrantes.

Análisis de las técnicas de detección de plagio textual:

 Detección de plagio intrínseco

Se lo realiza utilizando características del estilo de escritura, obtenidas a partir del mismo
documento.

1. Técnica de detección por estilo del autor

Busca partes dentro del texto dentro del documento que se sospecha que tiene plagio,
que no tenga el mismo estilo de la escritura de autor. El gran problema de esta técnica
es necesario contar con el estilo de escritura del autor.

2. Técnica de detección de cambios de complejidad

Consiste en detectar cambios de complejidad del texto dentro del fragmento del
documento, esto se logra a través de comparar el estilo de escritura de dicho fragmento
con el estilo de escritura del resto del documento.

 Detección de plagio con cooperación a fuertes externas

Conlleva el tener disponibilidad de acceso a las posibles fuentes de dónde pudo existir plagio

1) Técnica vectorial

Utiliza medidas de similitud, así también como también el peso de frecuencia del
término, es decir les da mayor importancia a las palabras que mas se repiten en el
documento.
2) Técnica de n-gramas

Esta técnica divide al documento en trozos con una cierta longitud, dependiendo del
tamaño que tengan estos.

 Detección de plagio translingüe


I. CL-ASA

Utiliza un diccionario para detectar plagio en otros idiomas, esta técnica consiste
primero en traducir los documentos en un idioma común.

II. CL-CNG

Detección de plagio utilizando n-gramas, este método es muy recomendable


cuando se intentan comparar dos leguajes que tienen similitudes sintácticas.

Análisis de requerimientos para la plataforma

Los principales requerimientos que debe presentar la plataforma son:

 Acceso a la web
a. Capacidad de conexión con diferentes buscadores web: Google, Bing, Yahoo!
b. Extraer metadatos de documentos buscados en la web: esto se maneja en virtud de
que se requiere mejor filtrado de la información.
c. Almacenar las búsquedas o los documentos encontrados en el disco duro: finalidad
de mejorar la velocidad de búsqueda en internet.
d. Capacidad de evitar bloqueos por múltiples consultas
 Funcionalidad de análisis léxico semántico
a) Soporte de funciones de análisis léxico
Eliminación stop words
Obtener palabras más relevantes
b) Acceso a diccionarios
Sinónimos, antónimos, significados, traducciones
c) Brindar funciones de separación de textos por palabras
 Carga y lectura de documentos
1) Soporte de documentos: PDF, DOC, DOCX y texto plano
2) Debe de reconocer automáticamente el formato del archivo
3) Proveer el servicio de extracción de texto de dichos documentos
 Gestión de algoritmos y servicios
A. Los algoritmos deben funcionar como una libreta, es decir invocar desde una capa
superior.
B. Permitir nuevos algoritmos en tiempo de ejecución, es decir la plataforma no debe
de tener un límite de subir algoritmos.
C. Determinar un porcentaje de plagio en los documentos analizados.
 Acceso a la plataforma (interfaz del usuario) y GUI
1. La plataforma debe trabajar con múltiples usuarios concurrentes, es decirse
pretende que la plataforma trabaje con varios usuarios a la vez, por lo cual se busca
que funcione entorno a la web.
2. Adicionalmente también debe ejecutarse en un entorno de escritorio, con la
finalidad de uso de pruebas, de ahí que es importante que sea independiente de la
GUI por la que se accede y administra.

Conclusiones:

 Tener varios atributos especializados en coincidencias textuales (o no) de varios


tamaños aumenta la efectividad de la detección automática de plagio; esto es
demostrado por la mejora que presentaban los métodos de referencia que contaban
varios atributos (el método del conjunto de atributos de cubrimientos con n-gramas
expuesto por primera vez aquí como una extensión del encubrimiento de n-gramas).
 Como es de sospecharse, las categorías o tipos de plagio más difíciles son aquellos en
los que se involucra la reescritura. El método propuesto logra mejorar la discriminación
del plagio que involucra reescritura, aunque este sigue siendo el escenario más difícil de
tratar.

REFERENCIAS:

- https://inaoe.repositorioinstitucional.mx/jspui/bitstream/1009/727/1/SanchezVJF.pdf
- https://www.julianmarquina.es/15-herramientas-para-detectar-el-plagio-de-tus-
trabajos-academicos-o-profesionales/
- http://discursoforense.unam.mx/sites/default/files/archivos/publicaciones/s_plagio.p
df
- http://scielo.sld.cu/scielo.php?pid=S2227-
18992014000400008&script=sci_arttext&tlng=en
Cuestionario:
Evaluador de tesis:
o ¿Tiene algún conocimiento de los programas para detectar plagio?
o ¿Puede detectar si hay algún plagio a simple vista?
o ¿Qué métodos utilizaría para descubrir si el estudiante uso plagio?
o ¿De que forma reporta el plagio?
o ¿Qué consejo les daría a los estudiantes que hacen plagio?
Evaluador de trabajos académicos:
o ¿Usted conoce los programas que detectan plagio?
o Al ser tutor de un alumno para la preparación de su tesis ¿Ha descubierto
algún tipo de plagio?
o ¿Cómo enfrenta este problema las universidades?
o Nunca ha pensado que el plagio de un alumno fuera de forma intencional
¿Cómo descubriría si el alumno no hizo plagio apropósito?
o ¿Qué pautas le daría al alumno para que no cometa plagio en su tesis?
Estudiante:
o ¿Sabias que hay programas que detectan los plagios?
o ¿Tienes algún conocimiento de que es el plagio?
o ¿Has hecho algún plagio alguna vez?
o ¿Cómo te sentirías si hubieras hecho plagio en tu tesis y te descubrieran?

Entrevistas:
 Entrevista al evaluador de tesis:
o Fecha: 18/05/19
o Sede: Universidad Católica Santo Toribio de Mogrovejo
o Entrevistado:
o Respuestas:
 ¿Tiene algún conocimiento de los programas para detectar plagio?

 ¿Puede detectar si hay algún plagio a simple vista?

 ¿Qué métodos utilizaría para descubrir si el estudiante uso plagio, sin
uso de algún software?

 ¿De qué forma reporta el plagio?

 ¿Qué consejo les daría a los estudiantes que hacen plagio?

 Entrevista al evaluador de trabajos de tesis:
o Fecha: 19/05/19 Hora: 18:46 pm
o Sede: Universidad Católica Santo Toribio de Mogrovejo
o Entrevistado: Javier Hipólito Darchu, docente de la facultad de ingeniería
industrial
o Respuestas:
 ¿Qué sabe de los programas que detectan plagio?
 Si se sobre estos programas, hago uso de uno de ellos que se llama
que se me hace más fácil de usar es el Plag.es, que me indica que
tanto de porcentaje ha sido plagiado, el plagio no es que hayas
tomado alguna frase u información de algún autor, sino que al
hacer eso no hayas citado correctamente y esto genere
problemas a futuros para el alumno.
 Al ser tutor de un alumno para la preparación de su tesis ¿Ha
descubierto algún tipo de plagio?
 Es un poco difícil ya que tendría que tener mucha información
sobre todas o la gran mayoría de trabajos de tesis, pero a veces
cuando en una tesis veo que hay datos estadísticos o resultados
de alguna investigación y no han sido citados me muestra ciertos
indicios de que puede haber plagio, pero puedo usar alguna de
estas herramientas que sean gratuitas y aclare mi indicio mas no
a simple vista que se puede detectar plagio o no.
 ¿Cómo enfrenta este problema las universidades?
 La SUNEDU obliga a las universidades privadas y públicas, a que
adquieran un software en la cual detecten en que tesis en
pregrado, maestría o doctorado en que porcentaje han utilizado
textos de otras investigaciones que no han sido citadas, lo que
desconozco las metodologías y procedimientos que usan las
universidades para que corrigen al estudiante o le quiten su
oportunidad de presentar tesis
 Nunca ha pensado que el plagio de un alumno fuera de forma
intencional ¿Cómo descubriría si el alumno no hizo plagio apropósito?
 Me centro mas en la forma y en el fondo del trabajo, ya que no
contamos con software y en mi opinión al usar el programa
Plag.es y eso me ayuda, y es más rápido encontrar alguna frase
me suenan a conclusiones de trabajos de investigación y
automáticamente me busca de que pagina proviene y de esa
manera reviso del alumno ha citado correctamente. En caso de
mis alumnos reviso trabajo por trabajo y detectar si existen textos
transcritos sin citar, ya que si superan la mayor cantidad de frase
se debe reportar y si lo hago conocer al alumno hablando con el
detenidamente de donde ha conseguido esa información y que
me refute correctamente, en algunos casos los alumnos para que
no los descubra me cambia algunas palabras con sinónimos y
cambian el orden pero no tiene mucho sentido es más fácil
detectar el plagio en ese aspecto, y le hago entender el error que
esta cometiendo y en la medida del tiempo lo pueda corregir.
 ¿Qué pautas le daría al alumno para que no cometa plagio en su tesis?
 Cundo hablo con mis alumnos en la etapa de pregrado como en
un entrenamiento, pueden salir bien o mal las cosas pero lo
lograran, pero el detalle esta a futuro en la etapa laboral, si ellos
no asumen el rol que les corresponde que deben hacer un buen
trabajo o un buen informe, y deben valorar las investigaciones de
otras personas, no esta mal utilizar frases de otros autores sino
en el no citar de donde proviene dicha frase y no reconocer que
eso te ha ayuda a realizar tu trabajo de investigación, es un
proceso de aprendizaje y en la vida real se evite caer en ese delito
ya que ahora el plagio es considerado un delito.
 Entrevista al estudiante:
o Fecha: 18/05/19 Hora: 13:55 pm
o Sede: Universidad Católica Santo Toribio de Mogrovejo
o Entrevistado:
- Alarcón Ovando José, 7° ciclo, ingeniería de sistemas
- Reaño Cobeña Jheiner, 7° ciclo, ingeniería de sistemas.
o Respuestas:
 ¿Sabías que hay programas que detectan los plagios?
 Si, al presentar una tesis y no citar las fuentes bibliográficas y hace
no sean buenas presentaciones y te anulen tu tesis.
 ¿Has hecho algún plagio alguna vez?
 Si, en MTI fue en un tema libre e hicieron sobre los iluminatis,
copiamos sobre algunos párrafos, fueron alumnos del profesor
Torres Benavides Juan Antonio, mencionaron que hicieron copia
en un examen y les hizo valer y salieron bien.
 ¿Cómo te sentirías si hubieras hecho plagio en tu tesis y te
descubrieran?
 Hay que saberla hacer, tu mismo eres consciente, muchos
rechazan las tesis, pero si pasas el porcentaje establecido te
validan la tesis, pero al momento de jurado no se obtiene el
resultado obtenido.
DESARROLLO DEL SOFTWARE PROPUESTO:
1° Paso: Determinar los problemas de información
 Actualización de nuevos vocabularios
 Lentitud en los resultados del plagio
 No tener proyección a vocabularios futuros
 Capacidad de lectura en los diferentes vocabularios
 Capacidad de verificar varias tesis a la vez
 Actualización métodos para detectar plagio

2° Paso: Determinar los requerimientos funcionales


 Listar vocabularios por áreas o fuentes
 Determinar tiempos de respuesta
 Actualizar vocabulario constantemente
 Realizar registros de nuevos vocabularios
 Listar tipos de métodos para detectar el plagio

Flujogramas:

You might also like