Creo que es mejor entender primero el enfoque de alto nivel para resolver la tarea de clasificación de texto:
Un enfoque de aprendizaje supervisado:
- ¿En qué se basa IBM Watson? ¿Es una alternativa interna de IBM a TensorFlow?
- ¿Por qué podría mejorarse el arrepentimiento del bandido lineal mediante una proyección aleatoria?
- En TensorFlow, ¿qué es una capa 'densa' y una 'abandonada'?
- ¿Cuáles son los 10 problemas principales en Machine Learning para 2014?
- ¿Es malo tener una gran cantidad de funciones en Machine Learning?
Un enfoque de aprendizaje no supervisado:
En lo anterior, puede usar Deep Learning para algunos de los componentes, como los vectores de características, que podrían ser como word2vec (https://papers.nips.cc/paper/502…) o GLoVe (http: //www-nlp.stanford .edu / pubs …).
Un ejemplo de una tarea de agrupación de texto sin supervisión:
Para la clasificación, por supuesto, puede utilizar la red neuronal hacia adelante de alimentación profunda (FFNN) habitual. Cuando desee hacer una secuencia de aprendizaje de secuencia, una buena opción es RNN (LSTM, GRU con / sin atención y variantes). Un LSTM también es una buena opción cuando aprender sobre el contexto del contenido del documento ayuda a hacer una mejor clasificación.
Una arquitectura un poco más sofisticada:
Es aconsejable tomar un conjunto de datos real como los mencionados en las imágenes anteriores y resolver el problema de la clasificación binaria.