Mi enfoque para el análisis de sentimientos a nivel de documento es:
- Preprocesamiento del documento. (Ejemplo: eliminación de la puntuación, espacios adicionales (no una sola pestaña), palabras de detención (excepto “no” o palabras de negación)). Puede encontrar el diccionario de palabras de negación en línea.
- Identifique las palabras candidatas que poseen algún puntaje de sentimiento. Busque ventanas de bigrams y trigrams de estas palabras para identificar más palabras candidatas.
- Estas palabras candidatas identificadas usando n-gramas y trigramas pueden tener negación asociada a ellas. Esto afecta su puntaje de sentimiento.
- Después de tener una lista completa de todas las palabras, identifique la puntuación y la frecuencia del sentimiento en el documento.
- El valor de frecuencia de las palabras (unigramas, bi-gramos, trigramas) sirven como una columna de intensificación.
- Ahora, tiene una columna de palabras, una columna de puntaje de sentimiento por palabra y puntaje intensificado (se puede calcular como frecuencia * puntaje de sentimiento de una sola palabra).
- Ahora, usamos el clasificador de aprendizaje automático. Pasamos el documento al clasificador de aprendizaje automático para identificar oraciones de sentimiento positivas y negativas.
- Ahora tenemos el puntaje de nivel de palabra y el nivel de oración usando el clasificador. Agregamos estos puntajes (ponderados) para encontrar el puntaje de opinión del documento.
¡Espero eso ayude!
- ¿Pueden los algoritmos de aprendizaje profundo predecir los resultados de los partidos deportivos?
- ¿Por qué los nodos en una capa oculta producen resultados diferentes (cuando se basan en las mismas entradas)?
- ¿Cuántas imágenes se requieren para las redes adversas generativas (GAN)?
- Cómo crear mi propia biblioteca de tokenizadores en PNL
- PNL: ¿Cuáles son las aplicaciones del análisis en el procesamiento del lenguaje natural?