¿Es el análisis de sentimientos todo sobre lingüística?

Gracias por A2A.

En un esquema más amplio de cosas, sí, otros factores importan mucho.

En el mundo real, simplemente no sabes quién escribió la publicación en la mayoría de los casos. Todo lo que tienes es un fragmento de texto, ya sea anónimo o semi-anónimo (controlador de Twitter que es una fuente de publicaciones en su mayoría sin sentido, “tener capuccino con mi mejor amigo”). Este problema está siendo abordado por personas como Klout y equivalentes, pero a veces los datos no están disponibles.

Los factores de peso que describió pueden ser diferentes para diferentes tareas. Incluso los aspectos pueden jugar un papel diferente. Digamos que, en el caso de una aerolínea económica, la mayoría de los clientes están allí no porque les gusten los asientos estrechos y los bocadillos en lugar de la comida real, sino porque el factor precio es más importante que el resto.

Así que piense en esto como una capa adicional, que debe ajustarse de acuerdo con la tarea en cuestión. Personalmente, mi software solo obtiene el texto, maneja la parte lingüística y luego los agregadores de redes sociales lo combinan con los factores que consideren relevantes.

El análisis de sentimientos cae bajo el paraguas del procesamiento del lenguaje natural, por lo que es esencialmente una tarea nlp. Dado que nlp se superpone con la minería de datos y la recuperación de información, sa también puede abordarse desde esas perspectivas. Si el corpus involucra lenguaje natural, entonces es un problema nlp. Si involucra información estructurada, puede ser más un problema de minería de datos. Depende de los datos que estaría utilizando.

Entonces, es cierto que el resto de estos factores son importantes, pero si lo piensas bien, muchos de esos factores también tienen alguna señal en el lenguaje. Las personas hablan de manera diferente en diferentes fechas, las personas con diferentes niveles de credibilidad, etc … todos tienen diferentes estilos de escritura.

La mayoría de los enfoques basados ​​en ML capturan implícitamente mucha de esta información. Lo bueno de los enfoques basados ​​en ML en comparación con los sistemas expertos es que permiten el aprendizaje de estas señales ocultas sin codificarlas explícitamente.

El análisis de sentimientos ha logrado una precisión bastante increíble (hasta 94% en algunos corpii), con enfoques basados ​​en ML, por lo que claramente no es demasiado lamentable. Incluso los humanos no son 100% con sentimiento.

More Interesting

¿Por qué el escalado es importante para la clasificación SVM lineal?

Además del aprendizaje profundo, ¿qué otras herramientas de extracción de funciones están funcionando o son prometedoras para el aprendizaje automático?

¿Tiene sentido entrenar clasificador para cada clase?

¿Cuál es el mejor enfoque para construir un sistema de clasificación basado en la clasificación de otros?

¿Se utiliza R en la minería de datos a gran escala en grandes compañías de software como Facebook y LinkedIn?

¿Es estúpido cambiar de trabajo de programación en C a aprendizaje automático?

¿Cuál es la conexión entre un modelo probabilístico y un gráfico en un modelo gráfico probabilístico?

Cómo usar KNN para datos mixtos (categóricos y numéricos)

¿Se pueden usar las redes de confrontación generativas para casos no supervisados?

¿Cómo podemos usar el ingenuo clasificador de Bayes para el análisis del sentimiento sementico de los datos de Twitter?

¿Cuál sería un buen enfoque de aprendizaje automático para un bot de comercio de criptomonedas con aproximadamente media docena de parámetros de entrada de estrategia de comercio numérico y una salida numérica (porcentaje de ganancia diaria)? Todos los días el modelo probaría nuevos parámetros.

¿Cómo aprendo el aprendizaje automático y el procesamiento de imágenes para aplicaciones móviles? Por ejemplo, para usar los mismos efectos de filtro en aplicaciones iOS y Android, ¿debería usar Python?

¿Cuáles son los cursos necesarios para aprender la recuperación de información y el aprendizaje automático?

Suponga que la máquina es multinúcleo, el tiempo de ejecución de un programa en una máquina que ejecuta solo ese proceso es igual al tiempo de ejecución en una máquina en la que hay otros procesos ejecutados junto con él, ¿no es así?

¿Cómo determina el algoritmo de aprendizaje automático de Quora la clasificación de la calidad de la pregunta?