Determinar que un tweet es negativo / positivo es uno de una clase más amplia de tema conocido como análisis de sentimientos. Esencialmente, para positivo / negatividad, es un problema de clasificación.
Algunos métodos para clasificar son análisis semántico latente, modelado de “bolsa de palabras”, algoritmos de aprendizaje automático como máquinas de vectores de soporte, regresión, etc.
Las características comunes de los tweets que se usan en el análisis de sentimientos son buscar palabras influyentes “positivas” / “negativas”, como buena, excelente (positiva) o mala, mala (negativa). Y al correlacionarlos con los nombres de equipo / jugador que se mencionan en cada tweet, un programa de computadora puede determinar rápidamente si un tweet es positivo / negativo, utilizando un modelo que fue entrenado anteriormente.
- ¿Qué debo aprender en Data Science para ayudar a mi startup?
- Cómo construir una consulta a partir de una pregunta de lenguaje natural en Python
- ¿Cómo se puede reducir el tamaño del modelo TFIDF sin reducir significativamente la precisión?
- Visión por computadora: ¿Cuáles son algunos problemas de investigación abierta en la recuperación de imágenes basada en contenido?
- ¿Cómo puedo usar Gensim LDA para la clasificación binaria?
Para una introducción técnica / lectura en profundidad a las técnicas de análisis de sentimientos, puede consultar ” Análisis de opinión y análisis de sentimientos ” de Bo Pang y Lilian Lee, que está disponible gratuitamente en su sitio web de Cornell:
http://www.cs.cornell.edu/home/l…