Estos no son datos pequeños. El problema no es el número de ejemplos de entrenamiento, son las características por paso de tiempo: tiene ~ 10,000 características. Tienes que encontrar una manera de reducir esos 10,000. Teóricamente, podría tener un gaussiano para cada característica, pero es poco probable que funcione.
Tampoco dices cuántas etiquetas tienes.
Parece que este es un buen ajuste para un enfoque híbrido: construya un enfoque de aprendizaje profundo no supervisado utilizando máquinas de Boltzmann restringidas o escasa autocodificación o redes adversas generativas para reducir el número de dimensiones, luego use eso para la representación del espacio de estado HMM.
- ¿Qué es mejor en términos de ROI: MS en informática o MS en análisis de datos / ciencia de datos en EE. UU.?
- ¿Cuáles son los mejores cursos introductorios para el aprendizaje automático disponibles en Internet para principiantes?
- ¿Cuál es la diferencia entre Hidden Markov Chain y Markov Chain?
- ¿Se pueden utilizar algoritmos genéticos y optimización de enjambre de partículas para construir sistemas de reconocimiento de voz?
- ¿Por qué la necesidad de depuración aún no se ha resuelto después de tantos desarrollos en tecnología, informática, algoritmos y aprendizaje automático?
La otra preocupación es cuántos estados diferentes tiene en su HMM. Si es así, diga un simple HMM de 5 estados (se espera que diga 10–20 pasos en cada estado), entonces esto podría funcionar. Si tiene 20 estados (cada uno de los 4 pasos), simplemente no tiene suficientes datos para esta tarea.