El filtrado de correo no deseado utilizando redes neuronales es básicamente un problema de clasificación.
Aquí están los pasos para implementarlo.
1. Recopilar conjunto de datos de spam y jamón (mensajes de correo electrónico legítimos). Etiquetar estos conjuntos de datos
- Cómo usar el aprendizaje automático en mi aplicación móvil
- ¿Hay publicaciones sobre la generación automática de video a partir de texto plano y viceversa?
- ¿Puede una computadora usar inteligencia artificial para vencer al 'mejor' jugador de póker siempre?
- ¿Cuáles son algunos ejemplos de 'ideas de bot de chat' que podrían cambiar mucho el mundo?
- ¿Cómo podemos usar la inteligencia artificial y el aprendizaje automático en circuitos electrónicos y EDA?
Puede encontrar conjuntos de datos en – Conjuntos de datos de correo electrónico no deseado
2. Use técnicas de extracción de características y vectorización en estos mensajes
Por ejemplo: Aplicar BagofWords, Word2vec, Feature Hashing o tfidf Vectorizer, etc.
Puede encontrar más detalles aquí: http://scikit-learn.org/stable/m…
3. Una vez que se realiza la vectorización del conjunto de datos, aplique un algoritmo de red neuronal de aprendizaje supervisado como Back Propagation, Multi-Layer Perceptron o Radial Basis Network.
Más información sobre redes neuronales.
- http://scikit-learn.org/stable/m…
- http://lcn.epfl.ch/tutorial/docs…
- https://en.wikipedia.org/wiki/Ba…
- https://en.wikipedia.org/wiki/Mu…
4. Entrene su conjunto de datos etiquetado en estas redes neuronales. Una vez completada la capacitación, pruebe este modelo de red neuronal capacitado en diferentes mensajes de correo electrónico o puede retener una fracción de su conjunto de datos para realizar pruebas. Calcule la precisión, precisión y recuperación de su modelo entrenado utilizando el conjunto de datos de prueba. Para aumentar la precisión, puede entrenar durante más tiempo, cambiar los pesos iniciales, cambiar la tasa de aprendizaje, cambiar las condiciones de detención de la red neuronal o puede usar diferentes técnicas de extracción de características.
Más detalles sobre este método:
- http://scikit-learn.org/stable/m…
- http://scikit-learn.org/stable/t…
- http://scikit-learn.org/stable/a…
5. Una vez que esté satisfecho con la precisión de su modelo. Felicidades, creaste tu propio clasificador de spam. Puede usar este modelo suyo para clasificar y filtrar los mensajes de correo electrónico no deseado de varias maneras:
- Como complemento en aplicaciones de correo
- Como una aplicación web que clasifica y calcula el contenido de spam de un mensaje de correo electrónico
- Como una API que clasifica un mensaje en spam o no spam.
Para obtener más información o detalles, puede consultar mi cuenta de github donde implementé un clasificador de mensajes de correo electrónico no deseado utilizando diferentes algoritmos de aprendizaje automático como: SVM, Naïve Bayes, KNN, árbol de decisión, etc.
https://github.com/nikhibdg/Spam…
Para más dudas o sugerencias pm me.