Además de las otras respuestas proporcionadas aquí, hay otra gran pieza, que es el hecho de que el análisis de sentimientos de Twitter es un problema muy novedoso desde un punto de vista académico. Durante mucho tiempo, el análisis de sentimientos se basó en gran medida en muestras de texto que eran un párrafo o más. Con la gran cantidad de información en un párrafo de texto, es mucho más fácil lograr un buen rendimiento.
Cuando Twitter salió por primera vez, rompió por completo la mayoría de los enfoques de análisis de sentimientos existentes, principalmente porque se basaba en un texto informal muy corto. Se convirtió en un problema muy interesante, no solo desde una perspectiva comercial, sino también desde una perspectiva académica.
La otra buena parte fue que el conjunto de datos de Twitter es MASIVO. La gran cantidad de datos que Twitter pone a disposición hizo posible explorar una serie de enfoques de aprendizaje automático, específicamente en el ámbito de las redes neuronales que eran en gran medida intratables en conjuntos de datos más pequeños.
- Cómo hacer aplicaciones basadas en un modelo basado en datos que toma datos de entrada y muestra predicciones de algo en particular
- Empecé a aprender ciencia de datos. ¿Dataquest.io vale la suscripción?
- ¿Cuál es la mejor manera de probar los motores de recomendación en los datos históricos del usuario?
- ¿Están sobrevaloradas las estimaciones de la escasez de científicos de datos? La inversión en herramientas y productos de big data está en aumento, al igual que los institutos que ofrecen títulos en Big Data / Data Science. ¿La inversión y el desarrollo de infraestructura significarán una disminución en el empleo?
- ¿Qué tan unidos están la inteligencia empresarial y la ciencia de datos?
En última instancia, la sinergia entre la curiosidad académica y el interés comercial llevó a una gran cantidad de interés en el análisis de sentimientos de Twitter visto públicamente. El análisis de sentimientos se eligió en gran medida porque es un simple problema de clasificación binaria que elimina muchos factores de confusión como el desequilibrio de clase que impediría problemas más complejos.