En el algoritmo EM, ¿debería aumentar el valor de la función objetivo a través de cada M-STEP?

La probabilidad en EM aumenta en cada paso. Eso significa tanto en los pasos de Expectativa como de Maximización.

La salida del paso M en la iteración [matemática] n [/ matemática] le proporciona algunos parámetros [matemática] \ theta_n [/ matemática] y el valor de función asociado alcanzado por estos parámetros en la función objetivo Q es [matemática ] x_n [/ matemáticas]. Luego, el E-step modificará esa función que acaba de optimizar. La buena noticia es que lo que hace el E-step es aumentar aún más la probabilidad de que [math] \ theta_n [/ math]. Entonces, cuando vuelve a optimizar (el paso M en la [matemática] (n + 1) [/ matemática] -th iteración) y comienza en [matemática] \ theta_n [/ matemática] usando su nueva función Q, eso el primer valor es donde te ubica el E-step. Y a partir de ahí, aumentarás la probabilidad aún más al pasar a nuevos parámetros [math] \ theta_n [/ math].

Entonces, el valor de la función objetivo Q siempre, siempre, siempre aumenta.

Trataré de decirlo metafóricamente. Es como si tu eres la variable [matemáticas] \ theta [/ matemáticas] y el mundo define una función objetivo Q que mide la felicidad. En el paso M, te adaptas al mundo. En el E-step, los mundos se adaptan a ti. En cada paso, la felicidad aumenta. Tenga en cuenta que, dado que el mundo se ha movido para aumentar su felicidad, tiene al menos la misma felicidad que en la iteración anterior. De lo contrario, mover el mundo (E-step) no tiene sentido.

Related Content

¿Cuál es la relación entre los algoritmos y las IA (modernas)?

Cómo eliminar caracteres duplicados en la cadena char * p = 'chaabbcc'

¿Cuál sería un algoritmo para aplicar un filtro rosa a una imagen?

¿Cuáles son las ventajas de los algoritmos SVM?

¿Cuáles son algunos algoritmos interesantes que se han encontrado en la naturaleza?

¿Por qué la naturaleza no usa “direcciones postales”? ¿Cómo se hace referencia a sí misma “Naturaleza”?

¿Cuál es la diferencia entre las arquitecturas i386 y x86?

More Interesting

¿Cómo fue Alkhwarizm 2013 por IIIT Allahabad?

¿Las estructuras en lenguaje C son similares a los objetos en Java?

¿Cómo se puede explicar el algoritmo para la conversión de un número binario a un hexadecimal (código fuente incluido)?

¿Cuál es un buen algoritmo para generar un archipiélago en un mapa en particular?

Cómo usar el algoritmo profundo de Facebook en nuestra aplicación

En el algoritmo O (n) para encontrar el elemento máximo en una matriz, ¿cuál es el valor esperado del número total de cambios en el valor de una variable que mantiene el máximo sobre el paso de una matriz?

¿Cuáles son algunas aplicaciones inteligentes de búsqueda binaria?

¿Qué hace que NP-hard sea más difícil?

¿Qué pasaría si más personas se dieran cuenta de que la Ley podría entenderse como una serie de algoritmos sociales en un programa que se resiste a la compilación?

¿Cuáles son todos los algoritmos que debe saber para funcionar bien en Codeforces?

¿Cuáles son algunos de los códigos más pequeños que generan un número pseudoaleatorio?

¿Por qué la complejidad del algoritmo O (logN) significa que los datos disminuyen a la mitad?

¿Cómo se copia el contenido de un árbol de búsqueda binario que tiene emparejamientos K, V?

¿Qué algoritmo debo usar para la generación de código para mi AST?

¿Cómo es la búsqueda tan rápida por los motores de búsqueda? Generan millones de instrucciones en menos de un segundo. ¿Qué algoritmo usan?

Web Analytics