Si tuviera que dar un título académico a esta pregunta, entonces sería algo así como “Clasificación de spam usando Machine Learning”.
Esto hace que la pregunta sea más clara, es decir, en general, la verificación de spam es un problema de clasificación para el aprendizaje automático. En términos más técnicos, sería un aprendizaje supervisado.
Cualquier algoritmo de aprendizaje automático supervisado toma un conjunto de características que tiene una muestra de cada clase. En este caso, hay dos clases, es decir, correo electrónico no deseado de ham / benign v / s que lo convierte en una clasificación supervisada binaria.
- ¿Cuál es el editor preferido para un tipo de aprendizaje automático que trabaja principalmente en Python?
- ¿Cuáles son las relaciones entre el aprendizaje automático, el aprendizaje profundo, el aprendizaje supervisado y el aprendizaje no supervisado?
- ¿Cuánto del aprendizaje automático es en realidad solo optimización?
- ¿Qué son los modelos mixtos en términos simples?
- Si se le da una opción entre el aprendizaje automático y el Internet de las cosas como una opción, ¿cuál es la mejor para elegir, teniendo en cuenta el alcance y el futuro?
Ahora, cómo crear un conjunto de características para entrenar a cualquier clasificador supervisado para la verificación de spam. Para esto, los pasos generales son:
- Recopile muestras de la clase de spam y spam, es decir, correos electrónicos que son ham y spam.
- Decide qué función quieres usar. Por ejemplo, las bolsas de palabras es uno de los métodos más antiguos para la clasificación de texto que también se utiliza para la clasificación de spam. Pero hay algunas otras características que pueden ser útiles para construir un clasificador de spam. (consulte algún artículo de investigación académica).
- Una vez que haya decidido el tipo de característica, extraiga esas características y pase a un clasificador.
- Scikit-learn es un marco de Python para tareas de aprendizaje automático, es rico en muchos algoritmos de ML.
- Entrenado y prueba tu clasificador.
- Implemente su clasificador de spam aprendido.
A continuación, no es necesario que filtre su correo electrónico en busca de correos no deseados. Hurrahhhh … !!!