¿Cuándo se usaría un modelo oculto de Markov en lugar de una red neuronal recurrente?

  1. Los HMM son modelos más simples que los RNN. Entonces, como con cualquiera de los dos algoritmos con diferentes complejidades, usted elige el modelo más simple cuando tiene pocos datos, y elige el modelo más complejo cuando tiene más datos.
  2. En relación con el punto anterior, los HMM hacen la suposición de Markovian, es decir, usted supone que el estado actual depende solo del estado anterior y del siguiente. Entonces, si sus datos satisfacen esa suposición, los HMM podrían ser el método preferido, porque los RNN pueden encontrar patrones espurios y, por lo tanto, sobreajustados.
  3. Con los HMM, las entradas y las salidas tienen una correspondencia uno a uno, por ejemplo, en el etiquetado de parte del discurso, cada palabra en la entrada se asigna a un único POS. Por lo tanto, los HMM podrían ser más adecuados aquí, en comparación con una tarea como traducir de un idioma a otro, donde varias palabras en un idioma podrían mapearse en una sola palabra en el otro idioma.
  4. Los HMM son modelos generativos, mientras que los RNN son principalmente modelos discriminativos. Entonces, si su tarea requiere modelar cómo se generaron los datos, entonces los RNN no se pueden usar.