Permítanme decirlo de esta manera: el analista de spam y abuso de escala para el que Quora está reclutando actualmente debería poder hacerlo en sus primeros 15 minutos en el trabajo. Y ni siquiera tiene que ser lo suficientemente inteligente como para determinar que están enviando spam a piratas informáticos falsos (cónyuge u otros).
Cuando un usuario (cualquier usuario) presiona “Enviar” en una respuesta, comentario, sugerencia de edición, mensaje o Respuesta Wiki, se deben realizar dos comparaciones. (Exactamente cómo se hacen las comparaciones es, afortunadamente para mí como un tipo que no es CompSci, más allá del alcance de esta respuesta y en gran medida irrelevante. ¿Hashes? ¿Cosas bayesianas? ¿AI?) Probablemente hay muchas maneras de pelar al gato, y desde que Aquí se trata de escala , la velocidad es probablemente un factor decisivo).
En primer lugar, ¿qué tan similar es este contenido a otras cosas que este usuario ha enviado? En otras palabras, ¿este usuario publica lo mismo una y otra vez? Este es el enfoque clásico de “spammer”.
- Cómo hacer carrera en robótica
- Cómo usar vl_nnbnorm en mi propia implementación de una red neuronal
- ¿Cómo se comparan las arquitecturas de aprendizaje profundo?
- Aprendizaje de refuerzo: ¿por qué las recompensas están asociadas con acciones (independientemente del estado en el que termines)?
- ¿Qué habilidades se necesitan para los trabajos de aprendizaje automático en Amazon?
En segundo lugar, ¿qué tan similar es este contenido a otras cosas que otros usuarios han publicado? Este es el modus operandi “spammer de múltiples cuentas”.
Si la respuesta a cualquiera de esas preguntas es “muy, muy similar” y la cantidad de cosas con las que es similar es sustancial, entonces sí, los privilegios de alguien deben ser refrenados a toda prisa . Dada la aversión de Quora por incluso el auto- plagio, hay poca o ninguna excusa para que alguien publique lo mismo literalmente más de una o quizás dos veces, y si dos o tres cuentas ya han publicado lo mismo una vez cada una, cualquier cuenta adicional intentar publicarlo probablemente puede ser bloqueado de edición inmediatamente y tener el contenido rechazado inmediatamente, etc.
Este enfoque no solo ralentiza a los spammers, sino también a los plagiarios, a las personas que cortarán y pegarán un artículo completo como “su” respuesta, y a los fanáticos ocasionales que intentarán deslumbrarnos a todos con pantalla tras pantalla de tonterías repetidas.
No puedo esperar a que Quora empiece a tomarse en serio estas cosas.