La imagen de arriba, tomada del documento, ilustra cómo funciona SSD. SSD hace coincidir objetos con cuadros predeterminados de diferentes aspectos (mostrados como rectángulos discontinuos en la imagen). Cada elemento del mapa de características tiene varios cuadros predeterminados asociados. Cualquier casilla predeterminada con un IOU de 0.5 o mayor con una casilla de verdad básica se considera una coincidencia. Dos de los cuadros de 8 × 8 se corresponden con el gato (se muestra en azul), y uno de los cuadros de 4 × 4 se corresponde con el perro (se muestra en rojo). Es importante tener en cuenta que los cuadros en el mapa de características 8 × 8 son más pequeños que los del mapa de características 4 × 4: SSD tiene seis mapas de características en total, cada uno responsable de una escala diferente de objetos, lo que le permite identificar objetos a través de Una amplia gama de escalas.
Para cada cuadro predeterminado en cada celda, la red genera:
- ¿Cómo se calcula el punto de ruptura de un algoritmo de aprendizaje?
- ¿Cuáles son los mejores cursos de ciencia de datos en Udemy?
- ¿Cuáles son algunas aplicaciones destacadas de los métodos de máxima verosimilitud?
- Cómo implementar el aprendizaje automático en una aplicación de Android
- ¿Cuáles son algunas buenas técnicas para la clasificación / segmentación de datos de series temporales?
- Un vector de probabilidad de longitud c, donde c es el número de clases, que representa las probabilidades del cuadro que contiene un objeto de cada clase (incluida una clase de fondo que indica que no hay ningún objeto en el cuadro).
- Un vector de desplazamiento con 4 entradas que contiene los desplazamientos previstos necesarios para que el cuadro predeterminado coincida con el cuadro delimitador del objeto subyacente. Se dan en el formato (cx, cy, w, h): centro x, centro y, y compensaciones de ancho y alto, y solo tienen sentido si en realidad hay un objeto contenido en el cuadro predeterminado.
En el caso de la imagen de arriba, todas las etiquetas de probabilidad indicarían la clase de fondo con excepción de los tres cuadros coincidentes (dos para el gato, uno para el perro).
* foto tomada del artículo original
más aquí: cómo construimos y capacitamos un detector de unidades múltiples de SSD en Tensorflow