Redes neuronales convolucionales: ¿Qué están haciendo los regresores de cuadro delimitador en Fast-RCNN?

Los regresores del cuadro delimitador son esenciales porque las propuestas iniciales de la región podrían no coincidir completamente con la región que se indica por las características aprendidas de la red neuronal convolucional. Es una especie de paso de refinamiento.

Por lo tanto, en función de los pesos del clasificador (por ejemplo, redes neuronales, SVM), las propuestas de la región se regresan. Tenga en cuenta que las características utilizadas para la regresión son las características obtenidas al final de la capa de agrupación final.

Este tipo de regresión ofrece una mejor estimación de la posición del objeto que nuestros simples Generadores de propuestas, ya que se basa en las características generadas por la Red profunda.

[1]

R-CNN y Fast (er) R-CNN se explican muy bien por el profesor Bastian Leibe en sus conferencias en el RWTH. Puede encontrar todo el material aquí: Computer Vision – Computer Vision

¡Espero que esto ayude! ¡Feliz aprendizaje!

Notas al pie

[1] http: // Crédito de la imagen: Bastian L …

Sí, ya tienes el ROI, pero el regresor ayuda a obtener un cuadro delimitador más preciso. Esta estrategia ya se usó en el primer artículo de R-CNN:
“Demostramos que un método simple de regresión de cuadro delimitador reduce significativamente las localizaciones erróneas, que son el modo de error dominante”. (Más detalles en el documento)