Un buen lugar para comenzar con CNN y documentos de texto es leer un artículo de Rie Johnson y Tong Zhang: Uso efectivo del orden de las palabras para la categorización de texto con redes neuronales convolucionales.
Del resumen:
Este artículo estudia CNN en la categorización de texto para explotar la estructura 1D (es decir, el orden de las palabras) de los datos de texto para una predicción precisa. En lugar de usar vectores de palabras de baja dimensión como entrada como se hace a menudo, aplicamos directamente CNN a datos de texto de alta dimensión, lo que lleva a aprender directamente la incrustación de pequeñas regiones de texto para su uso en la clasificación. Además de una adaptación directa de CNN de imagen a texto, se propone una variación simple pero nueva que emplea la conversión de bolsa de palabras en la capa de convolución. También se explora una extensión para combinar múltiples capas de convolución para una mayor precisión. Los experimentos demuestran la efectividad de nuestro enfoque en comparación con los métodos más modernos.
- ¿Cuál es una explicación intuitiva para el problema de optimización cuadrática?
- ¿Hay algún sitio web donde pueda encontrar ideas para mi tesis de licenciatura en Informática? (Estoy interesado en algoritmos y aprendizaje automático).
- ¿Cómo funciona el refuerzo con los algoritmos de clasificación del árbol de decisión?
- ¿El antiguo guardia de IA ha frenado la investigación de aprendizaje automático en el MIT?
- Cómo usar el procesamiento del lenguaje natural (PNL) para resumir un documento en una serie de ideas principales
[1412.1058] Uso efectivo del orden de las palabras para la categorización de texto con redes neuronales convolucionales