¿Por qué es importante la eliminación de variables en los modelos gráficos probabilísticos?

Supongamos, el siguiente modelo gráfico.

[matemáticas] A \ rightarrow B \ rightarrow C \ rightarrow D \ rightarrow E [/ math]

Supongamos que queremos calcular P (E) o podemos calcular E para cierto valor como P (E = e). Luego, bajo el modelo gráfico, necesitamos calcular

¿Cuáles son las configuraciones adecuadas para la agrupación de documentos con K-means?
¿Qué se necesita para aprender a construir una aplicación de reconocimiento de imágenes?
¿Cuál es una buena manera de entender la pérdida de Minkowski con una configuración diferente?
¿Cómo es trabajar con Watson de IBM?
Regularización: ¿Por qué se llaman así los SVM L1 y L2 cuando ambos miden la distancia a un hiperplano a lo largo de la proyección ortogonal?

[matemáticas] p (E) = \ sum_ {A, B, C, D} P (A, B, C, D, E) [/ matemáticas]

Si consideramos que cada variable toma los valores posibles de [math] n [/ math], esto tomará el tiempo de cálculo [math] O (n ^ 4) [/ math].

Sin embargo, E solo depende de D. Por lo tanto, no necesitamos calcular otras variables, podemos eliminarlas (por supuesto, eliminamos mediante la reorganización del término de suma a lo largo de los nodos de dependencia).

Finalmente, terminaremos con

[matemáticas] P (E) = \ sum_ {D} P (E | D) P (D) [/ matemáticas] esto solo requiere [matemáticas] O (n ^ 2) [/ matemáticas].

La eliminación de variables es importante porque reduce el tiempo de cálculo al eliminar cálculos innecesarios.

Aprendizaje automáticoEstadísticaModelos gráficos probabilísticos

¿Qué se considera estado de arte para la traducción automática neuronal?

En la optimización matemática, ¿por qué alguien usaría el descenso de gradiente para una función convexa? ¿Por qué no encontrarían simplemente la derivada de esta función y buscarían el mínimo de la manera tradicional?

¿Qué es una máquina de vectores de soporte?

Según muchas personas, la inteligencia artificial y el aprendizaje automático son las principales razones de los despidos de trabajo de TI. ¿Qué trabajos han sido reemplazados por estas disciplinas?

¿Es posible rastrear cualquier operación de lectura y escritura desde una computadora?

¿Cuál es la ventaja de combinar la red neuronal convolucional (CNN) y la red neuronal recurrente (RNN)?

Es la técnica que le enseña cómo hacer inferencia al marginar sobre las variables. Sin ella, no puedo ver cómo haríamos inferencia. Tal vez habría otro algoritmo, supongo. No estoy seguro si hay un límite inferior en las cosas, pero me sorprendería bastante si hay un mejor algoritmo por ahí.

para detalles:

https://ocw.mit.edu/courses/elec …

Brando Miranda

More Interesting

¿Cómo se puede utilizar la máquina de Boltzmann restringida en problemas de clasificación?

¿Cuáles son algunas buenas escuelas de investigación (PhD) para Inteligencia Artificial General (no Machine Learning)?

¿La validación cruzada más pequeña siempre es un indicador de un mejor modelo predictivo incluso si un modelo predictivo tiene una gran cantidad de parámetros?

¿Qué piensa Andrew Ng sobre Deep Learning?

¿Qué es la enseñanza profunda?

¿Cuál es el propósito de usar la variable slack en SVM?

Las entidades biológicas inconscientes que simplemente reaccionan automáticamente a su entorno han evolucionado y se han vuelto autoconscientes. ¿Qué impide que AI lo haga?

¿Cómo se puede interpretar el teorema de Bayes en términos de inferir relaciones causales en los datos?