Permítanme explicar la relación entre el análisis de sentimientos, el aprendizaje automático, la PNL utilizando una imagen muy simple.
Machine Learning y NLP son dos hijos de la IA, que trabajan juntos y ayudan a resolver muchos problemas de datos.
- ¿Cómo deberías comenzar una carrera en aprendizaje profundo?
- ¿Cómo se compara Python con R para el análisis de datos y el aprendizaje automático?
- ¿Cómo podemos hacer una buena predicción usando el aprendizaje profundo MXNet R?
- ¿Cómo utiliza Facebook feed el aprendizaje profundo?
- Cómo interpretar los resultados de dos modelos de clasificación.
El procesamiento del lenguaje natural ( PNL ) es un campo de la informática, la inteligencia artificial y la lingüística computacional que se ocupa de las interacciones entre las computadoras y los lenguajes humanos ( naturales ) y, en particular, se ocupa de la programación de computadoras para procesar fructíferamente grandes cuerpos de lenguaje natural.
El aprendizaje automático es una subárea central de la inteligencia artificial, ya que permite a las computadoras entrar en un modo de autoaprendizaje sin ser programado explícitamente. Cuando se exponen a nuevos datos, los programas de computadora están habilitados para aprender, crecer, cambiar y desarrollarse por sí mismos.
El análisis de sentimientos (definición formal) es el proceso de identificar y clasificar computacionalmente las opiniones expresadas en un texto, especialmente para determinar si la actitud del escritor hacia un tema, producto, etc. es positivo, negativo o neutral.
Existen principalmente tres enfoques para realizar el análisis de sentimientos (la respuesta de Pathan Karimkhan a ¿Cómo funciona el análisis de sentimientos, en general?)
- Basado en léxico: considera el diccionario de léxico para identificar la polaridad del texto (puramente basado en PNL)
- Enfoque basado en el aprendizaje automático: necesita desarrollar un modelo de clasificación, que se entrena utilizando un conjunto de datos preetiquetado de contenido positivo, negativo y neutral. (Combina el concepto de PNL y ML)
- Enfoque combinado: que utiliza el diccionario léxico junto con un conjunto de datos preetiquetado para desarrollar el modelo de clasificación. ( Combina el enfoque 1 y el enfoque 2)
Ahora déjame explicarte con los pasos del análisis de sentimientos. Tendrás idea de cómo NLP y ML se utilizan para el juego. He proporcionado pasos muy básicos que uno puede profundizar para una mejor precisión. (La respuesta de Pathan Karimkhan a Soy un principiante en este campo y quiero hacer un análisis de sentimientos en un conjunto de datos dado. ¿Dónde hay un tutorial paso a paso para el mismo?)
- Obtenga términos: reduzca cada revisión (texto) a la lista de palabras (Uso de conceptos de PNL de tokenización y programación)
- Filtrado: elimine las palabras innecesarias que no agregarán valor para el análisis de sentimientos; es, entre, pero, y eso (conceptos de PNL del procesamiento de palabras de detención)
- BaseWord – Convierta todas las inflexiones a su palabra raíz: alevines, papas fritas, fritos -> alevines (Concepto de PNL de derivación y lematización)
- Detección de negación: identificación del contexto de negación, es decir, no es feliz -> triste, no está mal-> bueno (Nuevamente usando conceptos de PNL de procesamiento de tokens)
- Generaciones de características: use las palabras extraídas de una revisión como características para indicar lo positivo o negativo de esa revisión (Use algoritmos de extracción de características Bolsa de palabras, TF-IDF, Count vectorizer, etc., lo cual – PNL nuevamente ayuda aquí)
- Clasificador estadístico: capacite a un clasificador de aprendizaje automático para predecir la positividad (aplicando algoritmos de aprendizaje automático en las características generadas en los pasos anteriores para predecir la polaridad del documento)
Entonces, PNL ayuda a la máquina a comprender el texto, a partir de esta comprensión, los algoritmos de ML permiten que el programa aprenda de documentos de texto históricos para predecir la polaridad negativa-positiva-neutral.