La retroalimentación de los usuarios, por ejemplo, el botón “Marcar como spam”, es una de las señales más potentes para conducir un sistema antispam, pero tiene las deficiencias clave de que 1) no es confiable, 2) es escasa y 3) es tarde.
1) Como señala Richie, algunos usuarios son jueces de “spam” mucho más confiables que otros. Las razones de la escasez son múltiples, desde los usuarios que no entienden lo que constituye “spam” (“ese aviso de factura electrónica de American Express es tan costoso que lo llamaré spam”), a los usuarios que hacen clic en el botón equivocado, a los usuarios Jugar intencionalmente el sistema (por ejemplo, castigar a un competidor). Dado que, un voto de un usuario individual debe ser ponderado adecuadamente antes de poder llegar a una conclusión generalizada.
2) Es escaso: la vasta gran mayoría de los mensajes no reciben datos de etiqueta de ninguna manera. Como un sistema no puede depender únicamente de los votos del usuario y debe extrapolar más allá de eso, cualquier voto dado puede contarse poco o mucho en la clasificación global.
- Cómo generar todos los números primos de un número dentro de un rango
- ¿Cuál es la mejor transmisión para ir en el presente, Mainframe o .Net?
- ¿Los problemas NP-hard que no están en NP necesitan un nuevo nombre?
- ¿Qué puede hacer un graduado en informática para mejorar su currículum, ya que los proyectos realizados por la mayoría de los estudiantes son más o menos proyectos académicos con estándares comunes en diferentes universidades?
- ¿Cuál es la diferencia entre AI, Machine Learning, PNL y Deep Learning?
3) Es tarde: por esta misma razón, los spammers a menudo intentarán entregar sus mensajes en una gran explosión. Esto significa que, para cuando el primer usuario vote, es posible que ya se hayan entregado miles de mensajes. Los jugadores a gran escala como Yahoo pueden eliminar retroactivamente estos mensajes ofensivos, pero para muchos usuarios el daño ya estará hecho.
Dicho esto, muchos sistemas (incluido Yahoo) mantendrán una lista de bloqueo de nivel individual, de modo que incluso si su voto es contrario a la clasificación global, al menos dentro de su cuenta, un mensaje posterior debe manejarse adecuadamente.