Cómo aplicar ConvNet en el análisis de sentimientos

Un buen lugar para comenzar con CNN y documentos de texto es leer un artículo de Rie Johnson y Tong Zhang: Uso efectivo del orden de las palabras para la categorización de texto con redes neuronales convolucionales.

Del resumen:

Este artículo estudia CNN en la categorización de texto para explotar la estructura 1D (es decir, el orden de las palabras) de los datos de texto para una predicción precisa. En lugar de usar vectores de palabras de baja dimensión como entrada como se hace a menudo, aplicamos directamente CNN a datos de texto de alta dimensión, lo que lleva a aprender directamente la incrustación de pequeñas regiones de texto para su uso en la clasificación. Además de una adaptación directa de CNN de imagen a texto, se propone una variación simple pero nueva que emplea la conversión de bolsa de palabras en la capa de convolución. También se explora una extensión para combinar múltiples capas de convolución para una mayor precisión. Los experimentos demuestran la efectividad de nuestro enfoque en comparación con los métodos más modernos.

[1412.1058] Uso efectivo del orden de las palabras para la categorización de texto con redes neuronales convolucionales

Seguramente Google Scholar puede ayudar, pero una forma de comenzar es práctica: ¡revisa el código y juega con él! xiaohan2012 / twitter-sent-dnn

More Interesting

Procesamiento del lenguaje natural: ¿De qué maneras puedo probar el error de aplicar un modelo de tema a los tweets, dado que no hay un corpus conocido de etiquetas de temas?

¿A qué tipo de personalización en Machine Learning se refería Andrew Ng en su artículo de Harvard Business Review sobre las capacidades de IA?

¿Cuál es la diferencia entre tensorflow y CVX?

¿Cuál sería la arquitectura más apropiada para entrenar una red neuronal basada en dos imágenes de entrada?

¿Por qué el aprendizaje profundo no tiene un mínimo local?

¿Qué es mejor para mí como estudiante? ¿Debería codificar los modelos de aprendizaje automático (donde pueda) o debería usar la biblioteca tanto como pueda?

¿Cuál es el mejor método de selección de características cuando los datos del tren tienen más características que el número de puntos de datos? ¿Asumir que los datos son muy grandes?

¿Cómo debo aprender el aprendizaje automático? ¿Puede proporcionar una hoja de ruta específica desde un principiante hasta un experto?

¿De qué manera es una 'Máquina de Turing Neural Lie Access' superior a las NTM normales?

¿Cómo escriben las personas pruebas automatizadas para sus algoritmos estocásticos?

¿Es un árbol de decisión solo un nombre elegante para una secuencia de declaraciones if-else-if-else -if-else?

En cuanto al aprendizaje automático o el aprendizaje profundo, ¿existe el fenómeno de que el modelo funciona bien pero el diseñador no puede explicar la razón?

¿Cuáles son algunos problemas no resueltos en el procesamiento del lenguaje natural?

¿Qué es una explicación intuitiva de la convolución 1 × 1 en ConvNets?

¿SSD es realmente mejor que YOLO?