Comience buscando en Google Scholar (o un sitio similar que le permita buscar publicaciones académicas).
Existen muchas técnicas diferentes que se pueden utilizar para encontrar plagio.
La técnica más simple, que sería fácil de implementar en Java, sería buscar el porcentaje de palabras en común entre cada par de documentos en un corpus más grande. Puede mejorar ligeramente esto filtrando palabras de función comunes (por ejemplo, “the”, “and”, “of”).
- ¿Cuál es más rápido: clasificación rápida o burbuja, y por qué?
- Si una cadena de números contiene todas las demás cadenas de números, ¿eso significa que la cadena también se contiene estrictamente a sí misma?
- ¿Cómo son útiles las conferencias sobre algoritmos de Ravindra Babu Ravula para las entrevistas en el campus?
- ¿Cuál es la complejidad temporal del algoritmo babilónico para encontrar la raíz cuadrada?
- Cómo escribir un programa en C para buscar los elementos usando el orden de fusión
Dentro de Java, piense cómo dividiría esto en clases (por ejemplo, podría tener una clase en la que cada instancia tome un nombre de archivo a través de su constructor, luego lo divide en una lista de palabras con recuentos de palabras listos para futuras comparaciones).
Tenga en cuenta que esta es una vista muy simplista y que los motores de detección de plagio más modernos son más complejos y también dependen de la verificación de fuentes externas. También querrá pensar en la escalabilidad y en cómo mantener el sistema funcionando rápidamente a medida que crecen los números a verificar.