¿Cuándo se usaría un modelo oculto de Markov en lugar de una red neuronal recurrente?

Los HMM son modelos más simples que los RNN. Entonces, como con cualquiera de los dos algoritmos con diferentes complejidades, usted elige el modelo más simple cuando tiene pocos datos, y elige el modelo más complejo cuando tiene más datos.
En relación con el punto anterior, los HMM hacen la suposición de Markovian, es decir, usted supone que el estado actual depende solo del estado anterior y del siguiente. Entonces, si sus datos satisfacen esa suposición, los HMM podrían ser el método preferido, porque los RNN pueden encontrar patrones espurios y, por lo tanto, sobreajustados.
Con los HMM, las entradas y las salidas tienen una correspondencia uno a uno, por ejemplo, en el etiquetado de parte del discurso, cada palabra en la entrada se asigna a un único POS. Por lo tanto, los HMM podrían ser más adecuados aquí, en comparación con una tarea como traducir de un idioma a otro, donde varias palabras en un idioma podrían mapearse en una sola palabra en el otro idioma.
Los HMM son modelos generativos, mientras que los RNN son principalmente modelos discriminativos. Entonces, si su tarea requiere modelar cómo se generaron los datos, entonces los RNN no se pueden usar.

Aprendizaje automáticoCiencia de datosmodelos ocultos de MarkovRedes neuronales recurrentesRedes Neuronales y Aprendizaje Profundo

Related Content

¿Qué herramientas usan los periodistas de datos para crear visualizaciones de datos? ¿Qué características les gustan más?

Cómo convertirse en un científico actuarial y de datos al mismo tiempo

¿Cuál es el mejor idioma para aprender a entrar en la ciencia de datos o big data en los requisitos actuales como graduado de comercio?

¿Por qué tantos datos se vuelven 'oscuros'?

¿Qué tipo de análisis de datos hay en R?

¿Es obligatorio organizar el número en orden ascendente para averiguar la mediana?

En la selección de características, ¿debemos eliminar siempre todas las características que tienen una alta covarianza entre ellas?

More Interesting

¿Existe alguna diferencia entre un científico de datos y el perfil ofrecido por Mu Sigma-Trainee Decision Scientist?

¿Hay un curso sobre Hadoop / data science en ETS, Montreal?

¿Cuál es la importancia de utilizar la tendencia central en el análisis de datos?

Cómo agudizar mi habilidad en el análisis de datos usando el software R

Cómo encontrar la cantidad óptima de camas necesarias para una sala de hospital utilizando análisis de datos

¿Por qué los datos toman espacio? ¿Hay alguna forma de comprimir todos los datos del mundo en 1 megabyte de espacio?

¿Cómo se relacionan los nombres de los archivos de extensión con los datos?

¿Es bueno aprender análisis de datos siendo un desarrollador de Java?

¿Cómo explicaría al público la importancia de generar ideas a partir de los datos?

Cómo usar una PC virtual para el análisis de datos

¿Puedes trabajar remotamente como científico de datos?

¿Qué puede hacer Java por un científico de datos que Python / R no puede?

¿Cuál es la diferencia entre la desigualdad de Hoeffding y el intervalo de confianza?

¿Quiénes son los mejores expertos en aprendizaje automático (ML)?

¡Necesitamos sus comentarios sobre nuestra startup FlyElephant! ¿Puedes ayudarnos?

Web Analytics