¿Cuáles son los límites de los modelos ocultos de Markov en la minería de texto?

Los modelos ocultos de Markov (HMM) son un modelo probabilístico que generalmente representa dependencia condicional. Cuando aplicamos el modelo oculto de Markov en la minería de texto de “redes sociales”, donde estamos mayormente acostumbrados a textos más cortos (twitter 140 caracteres), vemos la siguiente limitación en los HMM:

  1. El tiempo de cálculo del algoritmo de viterbi es muy grande, ya que requiere un gran volumen de secuencias para el entrenamiento (también llamadas secuencias de semillas).
  2. Hay muchas configuraciones de HMM para una secuencia dada, por lo tanto, definir la estructura apropiada es difícil.
  3. Cuando intentamos medir las influencias sociales en un usuario en particular, se puede hacer usando HMM, pero cuando tenemos un gran número de usuarios, algunos de los cuales, como una estructura gráfica, los HMM son difíciles de configurar.

Espero que ayude 🙂

More Interesting

¿Cómo ayuda el enfoque ontológico con la clasificación de texto?

¿Cuándo sale mal la reducción de dimensionalidad?

¿Me puede explicar sobre el aprendizaje automático? ¿Cuál es el alcance del aprendizaje automático?

¿Es factible hacer una regresión logística en conjuntos de datos con miles de características sin usar una computadora de clúster? ¿Qué tal decenas de miles?

¿Cuáles son algunas de las estadísticas más importantes y más engañosas en la predicción de partidos de fútbol?

¿Cómo funciona el método de daño cerebral óptimo?

¿Cuáles son los roles de probabilidad y estadística en el aprendizaje automático? ¿Qué tan importantes son? ¿Cuáles son sus aplicaciones en el aprendizaje automático?

¿Qué es una explicación intuitiva para PCA?

¿Por qué hay tantas redes de aprendizaje profundo?

Cómo comenzar mi investigación sobre el aprendizaje por refuerzo si no soy bueno en Python

¿Cuál es el proceso paso a paso para aplicar el aprendizaje automático en el trabajo (desde el procesamiento de la entrada hasta la etapa final)?

¿Cuál es la mejor manera de distribuir el descenso de gradiente?

¿En qué aspectos el aprendizaje automático y la inteligencia artificial cambiarán la fabricación pesada, como la industria del petróleo y el gas?

¿Qué es una explicación intuitiva de lo que significa que un espacio de hipótesis rompa un conjunto de puntos?

¿Cuáles son las principales empresas que trabajan en Deep Reinforcement Learning aparte de DeepMind y OpenAI?