¿Hay nueva información sobre el tema X o la gente sigue copiando y pegando?

Querido Peter,

esa es una tarea muy difícil a la que apunta, pero no imposible 🙂 Entonces, primero le sugiero que se haga algunas preguntas:

-> ¿Cómo defino ‘nueva información’? ¿Cómo hago para que un sistema sea lo suficientemente robusto como para reconocer que ‘información x’ = ‘información y’ (vea el ejemplo a continuación)?

Por ejemplo, URL1-> Apple es una fruta. vs URL2-> Una fruta roja es consumida con mayor frecuencia por los humanos para estimular su sistema inmunológico.

—-> En este caso, tiene ‘nueva información’ sobre la ‘manzana’ en URL2, sin embargo, ¿reconocerá su algoritmo que ‘manzana’ de URL1 es la ‘fruta roja’ de URL2?

Este es el punto de vista lógico. Ahora, en lo que respecta a ‘copiar y pegar’, mi pregunta es:

-> ¿Qué quieres lograr aquí? ¿Desea verificar el plagio o simplemente busca un algoritmo que pueda clasificar el contenido antiguo frente al nuevo?

Cuando encuentre respuestas justificadas a estas preguntas, escríbame una línea;)

mario