¿Es posible aplicar las técnicas de N-gram para el análisis de sentimientos?

El punto básico de los n-gramos es que capturan la estructura del lenguaje desde el punto de vista estadístico, como qué letra o palabra es probable que siga al dado. Cuanto más largo sea el n-gramo, más contexto tendrá para trabajar y más recursos y potencia de cálculo necesitará para entrenar su modelo.

Los modelos de N-gram se utilizan principalmente en una variedad de tareas, como corrección ortográfica, división de palabras y resumen de texto. Otro uso de n-gramas es para desarrollar características para modelos supervisados de Aprendizaje Automático como SVM, Naive Bayes, etc.

Desde mi experiencia personal, el uso de bigrams y trigrams en su espacio de características no necesariamente produce una mejora significativa

Puede consultar mi documento sobre Amazon Review System y cómo un modelo Unigram proporcionó más del 90% de precisión.

Análisis de sentimiento de las características en la minería de revisión

análisis de sentimientosAprendizaje automático

Related Content

Estoy atrapado en la regresión. ¿Qué debo aprender después de esto?

Si uno está tratando de construir un codificador automático para el conjunto de datos MNIST, ¿debería normalizar los datos sin procesar?

¿Cómo debo proceder para implementar un analizador probabilístico de lenguaje natural?

¿Cuándo debo usar la asignación de Dirichlet latente en la minería de texto? ¿Es bueno usarlo para un sistema que requiere alta precisión, como un sistema de detección de fraude?

¿Qué tan útil es un trabajo cuantitativo en Goldman Sachs para un doctorado posterior en Machine Learning?

¿Se utiliza el cálculo integral en Machine Learning o Deep Learning?

¿El aprendizaje por refuerzo con redes neuronales profundas implica descenso de gradiente y propagación hacia atrás?

More Interesting

¿Cuáles son algunas aplicaciones interesantes de aprendizaje profundo en FinTech?

He asignado mis pesos (w) a un múltiple multinomial (o k-simplex), dividiendo cada componente de w por la suma de todos los componentes. ¿Cómo realizo la regularización (equivalente a l1 o l2) en el nuevo espacio multinomial múltiple (k-simplex)?

¿Cómo se usa el análisis de componentes principales en el procesamiento del lenguaje natural?

¿Cuáles son algunos trabajos de investigación basados en ciencia de datos y aprendizaje automático en los que R se utiliza como lenguaje de programación?

Quiero solicitar un programa de doctorado en Machine Learning, ¿cómo debo prepararme?

¿Qué tan importante fue el Premio Netflix para el área de Sistemas de recomendación?

¿Cuál es un ejemplo de un sistema, proceso o actividad que no puede ser modelado por un proceso de decisión de Markov?

¿Qué significa decir que dos clasificadores son independientes?

¿Cuál es la diferencia entre derivada de una función o pendiente de gradiente?

¿Las GPU seguirán dominando la inteligencia artificial y el aprendizaje automático, aumentando el valor de compañías como Nvidia y AMD, o los chips especializados como los de Graphcore se harán cargo?

Si la IA de aprendizaje automático no puede explicar una respuesta, ¿se puede 'confiar' en un diagnóstico médico?

¿Cuáles son las mejores herramientas de última generación para la extracción de información en Python?

¿Cómo escribirías un programa de aprendizaje automático desde cero?

¿Cómo afectará el aprendizaje automático al mundo para 2030?

¿Puede Quora generar un patrón para el futuro de las personas con sus respuestas y preguntas?

Web Analytics