Está en la línea correcta, pero pensar en el problema explícitamente en términos de las funciones de densidad de probabilidad podría ayudar a aclarar lo que está sucediendo.
Si sabía con certeza que la observación número 1001 provino del estado [matemáticas] k [/ matemáticas], sería fácil hacer una predicción probabilística de su valor observado. Es solo la función de probabilidad [math] p (x_ {1001} | \ theta_k) [/ math], donde [math] \ theta_k [/ math] es el conjunto de parámetros para el componente [math] k [/ math] en el HMM En su caso, esta es una mezcla de 4 gaussianos: [math] \ sum_ {j = 1} ^ {4} \ pi_ {k, j} \ mathcal {N} (x_ {1001} | \ mu_ {k, j }, \ sigma_ {k, j}) [/ math], donde [math] \ mu_ {k, j} [/ math], [math] \ sigma_ {k, j} [/ math] y [math] \ pi_ {k, j} [/ math] representa la media, la desviación estándar y la proporción de mezcla de la [math] j ^ {th} [/ math] gaussiana de la [math] k ^ {th} [/ math] componente de su HMM, respectivamente. Parece que ya has inferido estos parámetros.
Pero como no conoce el estado número 1001, debe utilizar el producto y la suma de las reglas de probabilidad: [matemática] p (x | y) p (y) = p (x, y) [/ matemática] y [matemáticas] \ sum_y p (x, y) = p (x) [/ matemáticas] (marginación sobre y). Usando estas reglas puede ‘marginar’ la incertidumbre del estado para formar una densidad predictiva sobre la observación número 1001.
- ¿Cuáles son los beneficios de convertir una capa totalmente conectada en una red neuronal profunda a una capa convolucional equivalente?
- ¿Cuál es la posibilidad de que un humano gane el juego de entropía?
- ¿Podemos lograr mejor que una disminución sub-lineal en el error al aumentar el número de muestras en regresión lineal?
- Composición musical algorítmica: idea para una investigación
- Como estudiante universitario de ciencias de la computación, cuál es la mejor opción entre cs o estadísticas Ph.D. para la carrera de ciencia de datos?
Primero, aplique la regla del producto usando la matriz de transición [matemática] p (z_ {n + 1} | z_n) [/ matemática] para obtener la distribución conjunta en los estados 1000 y 1001 (suponiendo que ya tenga la distribución posterior sobre el 1000 estado de inferencia): [matemáticas] p (z_ {1001}, z_ {1000} | x_ {1, \ puntos, 1000}) [/ matemáticas] [matemáticas] = p (z_ {1000} | x_ {1, \ puntos, 1000}) p (z_ {1001} | z_ {1000}) [/ math]. luego, marginar sobre el estado número 1000 utilizando la regla de suma: [matemática] p (z_ {1001} | x_ {1, \ puntos, 1000}) [/ matemática] [matemática] = \ sum_ {k = 1} ^ 5 p (z_ {1001}, z_ {1000, k} | x_ {1, \ dots, 1000}) [/ math] (abusando ligeramente de la notación con [math] z_ {n, k} [/ math] indicando [math ] k ^ {th} [/ math] componente del estado en el paso de tiempo [math] n [/ math]).
Luego, use la regla del producto para incorporar la función de probabilidad: [matemática] p (x_ {1001}, z_ {1001} | x_ {1, \ dots, 1000}, \ theta) [/ matemática] [matemática] = p ( x_ {1001} | z_ {1001}, \ theta) p (z_ {1001} | x_ {1, \ puntos, 1000}) [/ math]. Finalmente, use la regla de la suma por última vez para obtener una predicción sobre el estado 1001: [math] p (x_ {1001} | x_ {1, \ dots, 1000}, \ theta) [/ math] [math] = \ sum_ {k = 1} ^ 5 p (x_ {1001}, z_ {1001, k} | x_ {1, \ dots, 1000}, \ theta) [/ math]. Esta es tu respuesta.
La predicción será una mezcla de [matemática] 5 \ veces 4 = 20 [/ matemática] gaussianos (suponiendo que ninguno de los gaussianos en la función de probabilidad tenga parámetros idénticos).