Redes neuronales convolucionales: ¿Qué están haciendo los regresores de cuadro delimitador en Fast-RCNN?

Los regresores del cuadro delimitador son esenciales porque las propuestas iniciales de la región podrían no coincidir completamente con la región que se indica por las características aprendidas de la red neuronal convolucional. Es una especie de paso de refinamiento.

Por lo tanto, en función de los pesos del clasificador (por ejemplo, redes neuronales, SVM), las propuestas de la región se regresan. Tenga en cuenta que las características utilizadas para la regresión son las características obtenidas al final de la capa de agrupación final.

Este tipo de regresión ofrece una mejor estimación de la posición del objeto que nuestros simples Generadores de propuestas, ya que se basa en las características generadas por la Red profunda.

[1]

R-CNN y Fast (er) R-CNN se explican muy bien por el profesor Bastian Leibe en sus conferencias en el RWTH. Puede encontrar todo el material aquí: Computer Vision – Computer Vision

¡Espero que esto ayude! ¡Feliz aprendizaje!

Notas al pie

[1] http: // Crédito de la imagen: Bastian L …

¿Se están realizando estudios actuales que utilicen la minería de datos o el aprendizaje automático en campos científicos?

¿Cómo manejo tanto la programación como la investigación en el área de redes neuronales y redes neuronales profundas?

¿Dónde puedo encontrar cursos de aprendizaje automático y redes neuronales en la web?

¿Cuáles son las principales aplicaciones de aprendizaje profundo en centros de datos?

¿Qué es $ delta en la validación cruzada?

¿Cuáles son los beneficios de convertir una capa totalmente conectada en una red neuronal profunda a una capa convolucional equivalente?

Sí, ya tienes el ROI, pero el regresor ayuda a obtener un cuadro delimitador más preciso. Esta estrategia ya se usó en el primer artículo de R-CNN:
“Demostramos que un método simple de regresión de cuadro delimitador reduce significativamente las localizaciones erróneas, que son el modo de error dominante”. (Más detalles en el documento)

Gianluca Nan

More Interesting

¿Cómo elegiría el marco de aprendizaje profundo adecuado para un proyecto?

¿Se siguen evaluando empíricamente las arquitecturas de redes neuronales profundas?

¿Cuál es el mejor título de maestría para obtener hoy en inteligencia artificial, aprendizaje automático, etc.?

¿SVM siempre supera a J48? Tengo un caso de uso donde J48 funciona mejor. ¿Significa que algo está mal con mi enfoque / implementación?

¿Cómo funciona el texto predictivo?

¿Cómo resolverías el siguiente diagrama de perceptrón?

Cómo desarrollar una recuperación de imagen basada en contenido

¿Es la memoria y la potencia informática paralela masiva del cerebro más útil para el "entrenamiento" o la "prueba"?

¿Qué tema es importante para la ingeniería integrada, las redes neuronales o la automoción moderna?

¿Qué núcleo (para los métodos de núcleo en el aprendizaje automático) es menos sensible a la alta dimensión: cauchy, gaussiana o laplaciana?