Pairwise Markov Random Field (MRF) es uno de los modelos gráficos más populares que se utilizan en Computer Vision. La estructura de un MRF por pares lo convierte en una opción natural para problemas de comprensión de la imagen, como la segmentación semántica y el etiquetado de escenas. Considere la tarea de segmentación semántica, es decir, etiquetar cada píxel de una imagen con la etiqueta del objeto correspondiente. El MRF que se muestra a continuación se puede usar para resolver esta tarea:
Para esta tarea, los nodos azules corresponden a píxeles de la imagen, y los nodos variables rojos corresponden a la etiqueta.
- ¿Qué reglas debo seguir para seleccionar todas las rutas que son válidas de un vértice a otro vértice?
- ¿Qué tan bien defienden las especificaciones profundas o los sistemas informáticos verificados formalmente que se ejecutan en unidades de estado sólido contra ataques avanzados de canal lateral?
- Tengo una idea para una aplicación de Realidad Virtual, ¿dónde puedo encontrar un desarrollador?
- ¿Qué hace que un curso de CS de 3 o 4 años sea valioso?
- ¿Debo aprender MATLAB para aprendizaje automático / IA?
El número de píxeles en una imagen es demasiado grande para hacer una inferencia exacta en estos MRF. Para hacer inferencia en MRF por pares, uno podría usar enfoques de inferencia aproximada, como la propagación de creencias en bucle. Sin embargo, la propagación de creencias puede conducir a malos resultados. En cambio, los investigadores de la comunidad de Computer Vision han desarrollado asombrosos algoritmos de movimiento como la expansión alfa, el intercambio alfa beta, que no solo son rápidos, sino que también tienen garantías sobre la calidad de la solución.
Consulte este documento seminal si está interesado en obtener más información sobre estos algoritmos de movimiento: http://www.cs.sfu.ca/CourseCentr…
Fuente de la figura: donde el aburrimiento, el tiempo libre y la curiosidad se unen