Eche un vistazo a este artículo, que ofrece una breve descripción de los diferentes enfoques para el análisis de sentimientos que podría usar, aunque como los documentos de Twitter (Tweets) son muy pequeños, probablemente esté buscando enfoques a nivel de documento. El artículo sugiere cómo puede ampliar su colección de entrenamiento a bajo costo.
Para mí, el mejor lugar para comenzar y ganar experiencia es construir una colección .
Cuando construimos una colección, nuestro objetivo es recopilar suficientes datos para los que podamos crear un modelo representativo y luego anotar cada documento en nuestra colección, en este caso las anotaciones podrían ser “positivas”, “neutrales”, “negativas”.
- Para comenzar en los roles de la ciencia de datos, ¿los cursos de Jigsaw Academy o Coursera son lo suficientemente buenos?
- ¿El aprendizaje automático es un comienzo de invasión de estadísticas?
- ¿Existe algún algoritmo específico para prevenir un ataque DDoS?
- ¿Cuáles son los propósitos de ganchos y andamios en TensorFlow?
- Como aprender redes neuronales
Puede parecer una tarea trivial, pero puede haber mucho que aprender a crear colecciones. Haga una búsqueda en Google y encuentre algunas colecciones existentes, analícelas y compárelas. ¿Todos abordan la tarea de la misma manera?
En mi propia experiencia, he notado que los clasificadores de sentimientos generales de Twitter funcionan peor que los clasificadores de sentimientos específicos de dominio (automotriz vs bancario vs entretenimiento, etc.). ¿Afectará esto a cómo recopila / etiqueta sus datos?