Modelos ocultos de Markov: ¿cómo se obtiene el siguiente valor observado pronosticado de un HMM?

Está en la línea correcta, pero pensar en el problema explícitamente en términos de las funciones de densidad de probabilidad podría ayudar a aclarar lo que está sucediendo.

Si sabía con certeza que la observación número 1001 provino del estado [matemáticas] k [/ matemáticas], sería fácil hacer una predicción probabilística de su valor observado. Es solo la función de probabilidad [math] p (x_ {1001} | \ theta_k) [/ math], donde [math] \ theta_k [/ math] es el conjunto de parámetros para el componente [math] k [/ math] en el HMM En su caso, esta es una mezcla de 4 gaussianos: [math] \ sum_ {j = 1} ^ {4} \ pi_ {k, j} \ mathcal {N} (x_ {1001} | \ mu_ {k, j }, \ sigma_ {k, j}) [/ math], donde [math] \ mu_ {k, j} [/ math], [math] \ sigma_ {k, j} [/ math] y [math] \ pi_ {k, j} [/ math] representa la media, la desviación estándar y la proporción de mezcla de la [math] j ^ {th} [/ math] gaussiana de la [math] k ^ {th} [/ math] componente de su HMM, respectivamente. Parece que ya has inferido estos parámetros.

Pero como no conoce el estado número 1001, debe utilizar el producto y la suma de las reglas de probabilidad: [matemática] p (x | y) p (y) = p (x, y) [/ matemática] y [matemáticas] \ sum_y p (x, y) = p (x) [/ matemáticas] (marginación sobre y). Usando estas reglas puede ‘marginar’ la incertidumbre del estado para formar una densidad predictiva sobre la observación número 1001.

Primero, aplique la regla del producto usando la matriz de transición [matemática] p (z_ {n + 1} | z_n) [/ matemática] para obtener la distribución conjunta en los estados 1000 y 1001 (suponiendo que ya tenga la distribución posterior sobre el 1000 estado de inferencia): [matemáticas] p (z_ {1001}, z_ {1000} | x_ {1, \ puntos, 1000}) [/ matemáticas] [matemáticas] = p (z_ {1000} | x_ {1, \ puntos, 1000}) p (z_ {1001} | z_ {1000}) [/ math]. luego, marginar sobre el estado número 1000 utilizando la regla de suma: [matemática] p (z_ {1001} | x_ {1, \ puntos, 1000}) [/ matemática] [matemática] = \ sum_ {k = 1} ^ 5 p (z_ {1001}, z_ {1000, k} | x_ {1, \ dots, 1000}) [/ math] (abusando ligeramente de la notación con [math] z_ {n, k} [/ math] indicando [math ] k ^ {th} [/ math] componente del estado en el paso de tiempo [math] n [/ math]).

Luego, use la regla del producto para incorporar la función de probabilidad: [matemática] p (x_ {1001}, z_ {1001} | x_ {1, \ dots, 1000}, \ theta) [/ matemática] [matemática] = p ( x_ {1001} | z_ {1001}, \ theta) p (z_ {1001} | x_ {1, \ puntos, 1000}) [/ math]. Finalmente, use la regla de la suma por última vez para obtener una predicción sobre el estado 1001: [math] p (x_ {1001} | x_ {1, \ dots, 1000}, \ theta) [/ math] [math] = \ sum_ {k = 1} ^ 5 p (x_ {1001}, z_ {1001, k} | x_ {1, \ dots, 1000}, \ theta) [/ math]. Esta es tu respuesta.

La predicción será una mezcla de [matemática] 5 \ veces 4 = 20 [/ matemática] gaussianos (suponiendo que ninguno de los gaussianos en la función de probabilidad tenga parámetros idénticos).