¿Alguien puede resolver este ejemplo de algoritmo EM?

Como [math] x_1 [/ math] y [math] x_2 [/ math] son ​​independientes, no hay razón para optimizar [math] theta_1 [/ math] y [math] theta_2 [/ math] conjuntamente. Además, la forma en que ha definido [math] p (x_1) [/ math] implica que solo hay un valor particular de [math] theta_1 [/ math] que dará como resultado un [math] p (x_1) legal / mates]. Todos los demás tendrán el área debajo de [math] p (x_1) [/ math] será algo diferente a 1. Entonces, o me falta algo aquí, o hay un error tipográfico en la pregunta.

Al llegar a [math] theta_2 [/ math], el valor óptimo de [math] theta_2 [/ math] es simplemente [math] max (todos los valores conocidos de x_2) [/ math] porque el punto de datos desconocido no contiene absolutamente ninguna información sobre [matemáticas] p (x_2) [/ matemáticas]. Para los datos proporcionados, [math] theta_2 [/ math] es 5. Esto supone que no tiene antecedentes sobre theta_2 que no ha mencionado aquí. (No estoy seguro de lo que quieres decir con [matemáticas] theta_0 [/ matemáticas]).

More Interesting

¿Alguna de las bibliotecas actuales de aprendizaje profundo permite restricciones de monotonicidad?

Si quiero trabajar en Machine Learning e Inteligencia artificial, ¿debería especializarme en Matemáticas / CS o Estadísticas / CS?

¿Hay alguna prueba de que no hay una solución algebraica para ajustar las redes neuronales con una (o más) capa (s) oculta (s)?

¿Cuáles son las ventajas del aprendizaje semi-supervisado sobre el aprendizaje supervisado y no supervisado?

¿Qué tecnologías de IA están disponibles para el reconocimiento del usuario por comportamiento (interacción con el sistema), estilo de escritura, etc. y cómo procedo a hacer una?

¿Cuáles son algunos conjuntos de datos etiquetados disponibles públicamente que usan Kinect para su uso en la investigación de la visión por computadora?

¿Cómo toman decisiones las neuronas del cerebro? ¿Funcionan de la misma manera que las neuronas artificiales en ANN?

¿Cómo se glorifican los métodos del kernel en la coincidencia de plantillas?

Cómo hacer aprendizaje automático usando scikit-learn para un archivo CSV que tiene muchas columnas de texto

¿Qué es un 'descriptor' en el contexto de una transformación de característica invariante de escala (SIFT)?

¿Cómo se actualizan los pesos en la red neuronal probabilística?

¿Cuándo se deben usar modelos generativos y no modelos discriminativos?

Cómo optimizar el ANFIS de MATLAB usando el método de descenso de gradiente conjugado

Inteligencia artificial: ¿Qué tan importante es el aprendizaje de transferencia / transferencia profunda?

¿Por qué Microsoft decidió usar bosques aleatorios en el Kinect?