La segmentación de imágenes es un área activa de investigación en visión artificial. Estos enfoques se pueden clasificar en términos generales como: – modelos de nivel de objeto y nivel de píxel. El nivel de objeto modela la segmentación como un problema regresivo y requiere que proporcione cuadros delimitadores como anotaciones para las imágenes de entrada. La segmentación a nivel de objeto ha sido más popular de las 2 variantes debido a la velocidad de procesamiento más rápida derivada de la facilidad computacional. Además, tienden a tener un mejor mAP debido a la relativa facilidad de formulación del problema. Algunas variantes populares recientes son máscara: RCNN, YOLO, SSD
En situaciones donde no tiene la intención de proporcionar coordenadas de nivel de objeto, podría modelarlo como un problema de clasificación. Aquí, no necesitará proporcionar coordenadas regresivas para los cuadros delimitadores. Sin embargo, tendrá que utilizar un enfoque de clasificación de nivel de píxeles. Estos usan comúnmente codificadores automáticos y Segnet es una de las variantes más populares.
En el segundo tipo, debe proporcionar una clasificación de nivel de píxeles en la imagen en lugar de las coordenadas regresivas del cuadro delimitador.
- En los modelos gráficos, ¿cuál es la diferencia entre un gráfico de clúster y un gráfico de factores?
- ¿Qué clases de modelos se pueden usar para predecir distribuciones de series de tiempo?
- Cómo comenzar mi investigación sobre el aprendizaje por refuerzo si no soy bueno en Python
- Cómo dominar el aprendizaje automático en el menor tiempo posible
- ¿Qué método de aprendizaje profundo usar para clasificar archivos de texto?
Así es como podría interpretar tu problema.
Ahora, si detecta coordenadas para un objeto sin anotarlo en la imagen de entrada, la pregunta parece abstracta, entonces podría realizar un procedimiento de clasificación pero no un procedimiento de detección. Es decir, puede detectar la presencia de un objeto pero no localizarlo.
Lo que das es lo que obtienes. Si entrena un modelo para optimizar su aspecto clasificando los objetos presentes en una imagen, no puede esperar que localice el objeto en el momento de la prueba.
Espero eso ayude.