En el campo de la visión por computadora, ¿a qué se refiere el término ‘segmentación’?

En Computer Vision, la segmentación de imagen se refiere al proceso de agrupar regiones de píxeles en la imagen que son visualmente similares .

Entonces, el objetivo de la segmentación es:

Para que podamos:

¿Por qué hacer esto?
Creo que la mejor motivación para esto viene dada por esta cita:

“Me paro en la ventana y veo una casa, árboles, cielo. Teóricamente podría decir que hubo 327 brillos y matices de color. ¿Tengo “327”? No. Tengo cielo, casa y árboles “. Max Wertheimer (1880-1943)

Como puede ver, la agrupación es clave para la percepción visual. Entonces, al encontrar formas de segmentar una imagen, queremos avanzar hacia una mejor comprensión de la imagen.

Algunas técnicas para la segmentación de imágenes:

  1. k-significa
  2. MoG (EM)
  3. Cambio medio
  4. Segmentación como minimización de energía (usando cortes de gráficos) [Página en berkeley.edu]

Créditos de imagen y contenido :
Bastian Leibe, Steve Seitz, Kristen Grauman, Svetlana Lazebnik