Cómo implementar un verificador de plagio en Java

Comience buscando en Google Scholar (o un sitio similar que le permita buscar publicaciones académicas).

Existen muchas técnicas diferentes que se pueden utilizar para encontrar plagio.

La técnica más simple, que sería fácil de implementar en Java, sería buscar el porcentaje de palabras en común entre cada par de documentos en un corpus más grande. Puede mejorar ligeramente esto filtrando palabras de función comunes (por ejemplo, “the”, “and”, “of”).

Dentro de Java, piense cómo dividiría esto en clases (por ejemplo, podría tener una clase en la que cada instancia tome un nombre de archivo a través de su constructor, luego lo divide en una lista de palabras con recuentos de palabras listos para futuras comparaciones).

Tenga en cuenta que esta es una vista muy simplista y que los motores de detección de plagio más modernos son más complejos y también dependen de la verificación de fuentes externas. También querrá pensar en la escalabilidad y en cómo mantener el sistema funcionando rápidamente a medida que crecen los números a verificar.

More Interesting

¿Tengo que estudiar matemáticas discretas, algoritmos y estructura de datos para convertirme en un buen desarrollador de Android?

¿Cómo puedo mover puntos colocados al azar con un radio de 'visión' en una línea para cubrir completamente la línea y minimizar la distancia total recorrida?

Procesadores de señal digital (DSP): cuando alguien escribe un archivo en una tarjeta SD usando un bus spi, ¿cómo sabe dónde debería estar el comienzo de un nuevo archivo?

¿Cuántas veces se realiza la comparación [código] i> = n [/ código] en el siguiente programa? [código] int i = 200, n = 110; main () {while (i> = n) {i = i-1; n = n + 1;}} [/ código]

¿Cuál es la mejor función hash que está disponible para identificar cadenas de forma exclusiva?

¿Cuáles son algunos de los mejores libros sobre Estructura de datos y Algoritmo en Java para principiantes?

¿Qué tipo de operaciones podrían aplicarse sobre un árbol de segmentos?

¿Cómo se le ocurrió al autor la fórmula (programación dinámica) en la editorial CIELRCPT - Editorial (Ciel y Receipt)?

¿Cómo se puede predecir el rango basado en el rango anterior y los datos de puntaje disponibles?

¿Cómo pasan su tiempo exactamente los participantes en varios sitios de codificación de algoritmos?

¿Cuál es la complejidad temporal de eliminar el borde de la estructura de la lista de adyacencia en un gráfico?

¿Cuál es la forma correcta de escribir un algoritmo? ¿Podemos usar la sintaxis del lenguaje en el que estamos escribiendo?

¿Pueden los algoritmos de aprendizaje automático reforzar los estereotipos?

¿Para qué se utiliza el algoritmo de fuerza bruta?

¿Qué es un árbol y un gráfico en las estructuras de datos?