¿Cuál es la relación entre inferencia y transmisión de mensajes en el contexto del aprendizaje automático?

No significan lo mismo.

La inferencia es más general que las PGM, y realmente solo se refiere a una evaluación de una distribución de probabilidad condicional. Por ejemplo, supongamos que le di una distribución de probabilidad conjunta sobre tres variables x, y y z. En este caso, digamos que P (x, y, z) es una matriz multivariada normal con identidad de covarianza. Si luego le dijera que “se observa que x es 2”, los métodos de inferencia le permitirían decirme algo sobre la distribución de probabilidad sobre las variables no observadas. Si usted es bayesiano, este pensamiento se extiende a las distribuciones sobre los parámetros del modelo, aunque ese es quizás un tema para otra pregunta.

La transmisión de mensajes es realmente solo una programación dinámica aplicada a modelos gráficos, que para muchas estructuras proporciona una solución exacta en tiempo polinómico en lugar de tiempo exponencial. Resulta que estos mensajes se pueden usar para calcular la función de partición de registro (nombre elegante para la constante de normalización) y las distribuciones marginales de los campos aleatorios de Markov, todo de una vez.

Un algoritmo de paso de mensajes es un algoritmo en el que los nodos de un gráfico literalmente pasan mensajes entre sí para realizar cálculos. Los algoritmos utilizados en los modelos gráficos son a menudo algoritmos de paso de mensajes. Creo que uno de los métodos particulares se llama propagación de creencias.

Por lo tanto, la transmisión de mensajes es una clase general de algoritmos y la inferencia en un modelo gráfico es una tarea más específica, que a menudo se realiza mediante la transmisión de mensajes.

El paso de mensajes es un enfoque para hacer inferencia en modelos gráficos.

La inferencia se trata de encontrar buenos parámetros en un modelo dado.