Dada una oración, quiero encontrar la emoción de la persona que la dijo. ¿Cómo puedo hacer esto?

Esto es lo que debes hacer.

Si tiene datos etiquetados :

  • Cree características a partir de las frases de texto, la más fácil es la Matriz de documentos de términos
  • Alimente esto a cualquier clasificador (SVM / ANN …) y entrene su modelo
  • Generar resultados para datos de prueba

También revise: En el análisis de sentimientos, ¿cómo convierte la información semántica y sintáctica contenida en el texto en vectores de características?
Análisis de sentimientos en críticas de películas

Si no tiene datos etiquetados, lo que sucede la mayor parte del tiempo:

  • Encuentre un gran corpus (documentos) relacionado con el campo para el que desea realizar un análisis de sentimientos. Puede obtenerlo de algún lugar, puede ser su cliente o de Internet, como Google News, etc.
  • Ejecute el análisis semántico latente y calcule la polaridad de todas las palabras. Por lo tanto, debe obtener una lista de palabras positivas, negativas y neutrales con fuerza.
  • Una vez que obtenga esta lista, para cada oración, conéctela en palabras y encuentre la polaridad de toda la oración y, por lo tanto, obtenga el análisis de sentimientos.

También echa un vistazo: ¿Cuáles son los buenos algoritmos relacionados con el análisis de sentimientos?

Puedes encontrar las emociones de un texto calculando la polaridad. Calcular la polaridad es bastante sencillo; extraiga cada oración, divídala en una bolsa de palabras y calcule la media de valencia, excitación y clasificación de dominancia.
La siguiente pregunta es dónde obtener estas calificaciones.
Hay un diccionario provisto por la Universidad de Florida, calles ANEW, que tiene alrededor de 1500 palabras con polaridad. Puede usarlos para obtener la valencia media de cada palabra. Una valencia más alta y excitación> 5 generalmente significa una emoción feliz.
Puedes leer la publicación de mi blog en iScanned: Escaneando el mundo tecnológico.

a2a. Tendrá que entrenar su algoritmo en un corpus, o mejores corpus, con estados emocionales etiquetados. Soy consciente de un número creciente de bases de datos, como DES, EMO-DB, GEES, SUSAS y estoy seguro de que hay un número creciente que desconozco.

Por otro lado, una de las razones clave para las rápidas mejoras en el procesamiento del lenguaje natural (PNL) y el aprendizaje automático (ML) en general, es el crecimiento de los cuerpos de capacitación adecuados. Los cuerpos de parte del discurso lideraron el camino, permitiendo las mejoras en el reconocimiento general del habla. Los corpus con etiqueta de sentimiento se han vuelto ampliamente disponibles y ahora los corpus con etiqueta de emoción están comenzando a proliferar. El estado de los algoritmos de ML es tal que puede lograr excelentes resultados siempre que tenga un corpus lo suficientemente grande, con las etiquetas que necesita, para entrenar.

1. El primer paso sería encontrar un corpus de frases adecuado. Esto significa que los datos de prueba deben estar bien representados en los corpus. Por ejemplo, la literatura inglesa adecuada no se puede utilizar como corpus para tweets.
2. Como es el caso con el análisis de sentimientos, necesita encontrar la bolsa de palabras que realmente ponen una emoción a la frase completa en lugar de a la frase completa. Use bigrams / trigrams para obtener una mejor bolsa de palabras
3. Entrene a un clasificador ingenuo bayes, svm, etc. con esa bolsa de palabras.
4. Use su modelo en los datos de prueba. Intente mejorar el modelo utilizando nlp y otras herramientas de análisis de texto.

Conjuntos de entrenamiento, conjuntos de entrenamiento. Optaría por corpus en los que se etiquetan las frases, en lugar de las palabras, ya que esto tendrá en cuenta mejor el sarcasmo / ironía / matiz. Utilice un algoritmo de clasificación para clasificar su conjunto de pruebas.

Puede consultar esta página de papel en munmund.net