¿Cómo podemos usar el ingenuo clasificador de Bayes para el análisis del sentimiento sementico de los datos de Twitter?

El clasificador ingenuo de Bayes para el análisis de sentimiento semántico no es trivial. Pero es posible el análisis sintáctico (también conocido como morfológico o de nivel de palabra). Considere tener dos canastas de datos de texto, una con sentimientos positivos y la otra con textos de sentimientos negativos. Suponga una representación de bolsa de palabras para estos textos. Si calcula las frecuencias de palabras para las cestas positivas y negativas, formará la tabla de densidad condicional de clase. Puede calcular los anteriores de la clase en función del número de puntos de datos de Twitter positivos y negativos. Ahora, la predicción de una publicación arbitraria de Twitter representada en forma de bolsa de palabras es mediante la suma logarítmica de las probabilidades en la tabla condicional de clase de todas las palabras presentes en la consulta. Tendrás dos de estas sumas, una para la clase positiva y otra para la negativa. Cualquiera que sea la suma más alta se considera la clase predicha por el ingenuo clasificador bayes.

Esto es muy similar al ejemplo ingenuo de clasificación de spam bayes que se encuentra en varios tutoriales.

More Interesting

¿Puedo usar el aprendizaje por refuerzo para ayudar a las personas a elegir la ruta más barata cuando viajan en avión?

¿Las herramientas como BigML o Google Prediction API dejarán a los expertos en aprendizaje automático fuera del trabajo?

¿Cuáles son las buenas heurísticas para elegir el tamaño de un lote en el entrenamiento de la red neuronal?

¿Cuál es el mejor algoritmo para implementar un reconocimiento de voz robusto en entornos ruidosos?

¿Cómo se aplica el aprendizaje profundo en la industria?

He realizado el curso de aprendizaje automático de Andrew Ng pero no lo he programado. ¿Debo decir que tengo los conocimientos básicos?

Si quiero trabajar en Machine Learning e Inteligencia artificial, ¿debería especializarme en Matemáticas / CS o Estadísticas / CS?

¿Cuáles son las diferencias entre hacer aprendizaje automático en la academia y en la industria?

¿Es posible una batalla de humanos contra máquinas en el futuro previsible?

¿Qué pasaría si pocos puntos de datos son comunes en los conjuntos de capacitación y validación?

Kaggle: ¿Cuáles son las técnicas utilizadas para reducir el número de columnas antes de predecir la variable dependiente? Por favor vea la descripción

¿Cuáles son algunos buenos proyectos de aprendizaje automático que implican el uso de estructuras de datos y tienen aplicaciones de la vida real y se pueden hacer en 2-3 semanas?

Cómo evaluar la reciente eliminación de recomendaciones para usar hilo dental

¿Cuál es la mejor GPU que se utilizará para Deep Learning con presupuesto (> 400 $)?

¿Qué pila de tecnología usa Akinator?