¿Cómo implemento un análisis de sentimiento a nivel de documento?

Mi enfoque para el análisis de sentimientos a nivel de documento es:

  1. Preprocesamiento del documento. (Ejemplo: eliminación de la puntuación, espacios adicionales (no una sola pestaña), palabras de detención (excepto “no” o palabras de negación)). Puede encontrar el diccionario de palabras de negación en línea.
  2. Identifique las palabras candidatas que poseen algún puntaje de sentimiento. Busque ventanas de bigrams y trigrams de estas palabras para identificar más palabras candidatas.
  3. Estas palabras candidatas identificadas usando n-gramas y trigramas pueden tener negación asociada a ellas. Esto afecta su puntaje de sentimiento.
  4. Después de tener una lista completa de todas las palabras, identifique la puntuación y la frecuencia del sentimiento en el documento.
  5. El valor de frecuencia de las palabras (unigramas, bi-gramos, trigramas) sirven como una columna de intensificación.
  6. Ahora, tiene una columna de palabras, una columna de puntaje de sentimiento por palabra y puntaje intensificado (se puede calcular como frecuencia * puntaje de sentimiento de una sola palabra).
  7. Ahora, usamos el clasificador de aprendizaje automático. Pasamos el documento al clasificador de aprendizaje automático para identificar oraciones de sentimiento positivas y negativas.
  8. Ahora tenemos el puntaje de nivel de palabra y el nivel de oración usando el clasificador. Agregamos estos puntajes (ponderados) para encontrar el puntaje de opinión del documento.

¡Espero eso ayude!