¿Cómo funcionan las redes de propuestas regionales (RPN)?

Una red de propuesta de región (RPN) es una red neuronal superficial totalmente conectada (NN) introducida por primera vez en la R-CNN (red neuronal convolucional de región más rápida) para proponer regiones con una alta probabilidad de contener un objeto de interés.

El RPN no especifica la clase del objeto en las regiones propuestas, simplemente está entrenado para generar una puntuación que mide la “objetividad” como una medida de probabilidad. Luego, se aplica un umbral al puntaje de objetividad y las regiones asociadas con el puntaje por encima de ese umbral se procesan más.

Dicho esto, el RPN se alimenta de un mapa de características convolucional (conv) de alto nivel de tamaño m × n. Básicamente, muestra el mapa de funciones m × n conv usando una ventana deslizante de 3 × 3. En realidad, el tamaño efectivo es mucho mayor que 3 × 3 cuando se proyecta de nuevo a la imagen de origen. Entonces el RPN procesa suficiente contexto para tomar las decisiones correctas. La ventana en sí tiene una profundidad de d dependiendo de la cantidad de mapas de características separadas. Por lo tanto, la ventana es en realidad un tensor 3 × 3 × d donde d> 100 para la mayoría de las CNN prácticas.

La salida de objetividad en el RPN tiene dos en lugar de una salida con una función de activación softmax. Una salida es para “como objeto” y la otra es para “no como objeto” en forma de una distribución de probabilidad. Por lo tanto, si la probabilidad similar a un objeto es mayor que la probabilidad no similar a un objeto, entonces esa región se procesa más adelante, de lo contrario se rechaza.

Luego hay 4 salidas adicionales por caja de anclaje que hacen que el tamaño de salida RPN sea:

k (4 + 2)

Donde k = cuadros de anclaje, 2 son las salidas de objeto y no de objeto.

Las 4 salidas son las compensaciones (x, y, w, h) relativas a los cuadros de anclaje. Por lo tanto, estos son cabezales de regresión para hacer retroceder los desplazamientos de los cuadros delimitadores propuestos.

NOTA : El número máximo total de resultados de todo el proceso de propuesta de región es m × n × k (4 + 2), ya que el RPN se desliza sobre todas las celdas m × n del mapa de características conv.

El RPN, siendo un NN típico, se entrena como cualquier otro NN con la ayuda de cajas de límite de verdad.

Espero que esto ayude.

More Interesting

¿Cuáles son los temas sobre big data para hacer una tesis de maestría que excluye el aprendizaje automático?

¿Qué método aparte del análisis de sentimientos puedo usar para obtener el puntaje de una oración?

¿Qué técnicas son buenas para suavizar los clics de las consultas de cola larga en los motores de búsqueda?

¿Hay abandonos universitarios que trabajan como científicos de datos o especialistas en aprendizaje automático?

¿Necesito una GPU para aprender el aprendizaje profundo?

¿Cuáles son algunas buenas ideas de proyectos para aplicaciones web de negocios que utilizan análisis de sentimientos?

He asignado mis pesos (w) a un múltiple multinomial (o k-simplex), dividiendo cada componente de w por la suma de todos los componentes. ¿Cómo realizo la regularización (equivalente a l1 o l2) en el nuevo espacio multinomial múltiple (k-simplex)?

¿Qué métodos / códigos están disponibles para estudiar un corpus que consiste en correos electrónicos?

¿Por qué la optimización del aprendizaje profundo es más rápida en las CPU que en las GPU?

Cómo lidiar con una matriz escasa de pares de elementos de usuario mientras se construye un sistema de recomendación de filtrado colaborativo basado en perceptrón

¿Qué es una explicación simplificada y una prueba del lema de Johnson-Lindenstrauss?

¿Qué temas de matemáticas recomienda Conner Davis a alguien interesado en el aprendizaje automático teórico para aprender en su tiempo libre?

Además de experimentar emoción, ¿qué cosas puede hacer un niño humano que una computadora no puede hacer?

¿Cuál es la mejor hoja de ruta para aprender el aprendizaje automático usando Python?

¿Se puede solicitar un doctorado en aprendizaje automático sin conocimientos y habilidades de CompSci? ¿Se puede aprender en el trabajo?