¿Qué tan difícil sería crear una IA que escanee automáticamente todas las respuestas, comentarios y ediciones de Quora y las colapse automáticamente e informe al usuario si detecta que son anuncios de spam para piratas informáticos falsos, justo después de que se envían?

Permítanme decirlo de esta manera: el analista de spam y abuso de escala para el que Quora está reclutando actualmente debería poder hacerlo en sus primeros 15 minutos en el trabajo. Y ni siquiera tiene que ser lo suficientemente inteligente como para determinar que están enviando spam a piratas informáticos falsos (cónyuge u otros).

Cuando un usuario (cualquier usuario) presiona “Enviar” en una respuesta, comentario, sugerencia de edición, mensaje o Respuesta Wiki, se deben realizar dos comparaciones. (Exactamente cómo se hacen las comparaciones es, afortunadamente para mí como un tipo que no es CompSci, más allá del alcance de esta respuesta y en gran medida irrelevante. ¿Hashes? ¿Cosas bayesianas? ¿AI?) Probablemente hay muchas maneras de pelar al gato, y desde que Aquí se trata de escala , la velocidad es probablemente un factor decisivo).

En primer lugar, ¿qué tan similar es este contenido a otras cosas que este usuario ha enviado? En otras palabras, ¿este usuario publica lo mismo una y otra vez? Este es el enfoque clásico de “spammer”.

En segundo lugar, ¿qué tan similar es este contenido a otras cosas que otros usuarios han publicado? Este es el modus operandi “spammer de múltiples cuentas”.

Si la respuesta a cualquiera de esas preguntas es “muy, muy similar” y la cantidad de cosas con las que es similar es sustancial, entonces sí, los privilegios de alguien deben ser refrenados a toda prisa . Dada la aversión de Quora por incluso el auto- plagio, hay poca o ninguna excusa para que alguien publique lo mismo literalmente más de una o quizás dos veces, y si dos o tres cuentas ya han publicado lo mismo una vez cada una, cualquier cuenta adicional intentar publicarlo probablemente puede ser bloqueado de edición inmediatamente y tener el contenido rechazado inmediatamente, etc.

Este enfoque no solo ralentiza a los spammers, sino también a los plagiarios, a las personas que cortarán y pegarán un artículo completo como “su” respuesta, y a los fanáticos ocasionales que intentarán deslumbrarnos a todos con pantalla tras pantalla de tonterías repetidas.

No puedo esperar a que Quora empiece a tomarse en serio estas cosas.

¿Qué tan difícil sería crear una IA que escanee automáticamente todas las respuestas, comentarios y ediciones de Quora y las colapse automáticamente e informe al usuario si detecta que son anuncios de spam para piratas informáticos falsos, justo después de que se envían?

Sospecho que no se ha hecho debido a la eliminación accidental de falsos positivos. En cambio, Quora confía en la comunidad para reportar spam, lo que he hecho muchas veces.

Honestamente, si aún no se implementa, sería hilarantemente fácil.

La mayoría de los anuncios de spam de los hackers siguen un patrón simple: cada respuesta que escriben es idéntica. Así que simplemente detecte en cualquier momento que el usuario envíe una respuesta si ya ha publicado exactamente la misma respuesta y, si lo hicieron, repórtelo.

Hay formas más sutiles en las que los hackers se destacan, pero esa es una forma simple pero efectiva.