En mi opinión, podemos entenderlo mejor en un ejemplo simple: recortar la cabeza del pájaro (en la imagen de entrada existe un pájaro completo).
Durante el paso directo : en primer lugar, la entrada (mapa de características) U se pasa a la red de localización, que genera una matriz de parámetros theta (tenga en cuenta que theta está condicionada a la entrada actual). Entonces, nuestro mapa de características de salida esperado V es la cabeza del ave, por lo tanto, de acuerdo con la transformación afín, multiplicamos la verdad de tierra de salida V por theta , que tiene como objetivo encontrar la región en la imagen de entrada que mejor coincida con V Este proceso se llama generador de cuadrícula . Finalmente, usamos el generador para muestrear U (como una operación PS) para obtener transformaciones predichas. A través del cálculo de la pérdida de salida, la pérdida fluirá mediante el proceso Back-Propogation para actualizar los parámetros.
Durante el paso hacia atrás : los gradientes de la siguiente capa fluyen hacia atrás en dos corrientes: (1) V -> U -> capas anteriores ; (2) V -> (x_sample, y_sample) -> theta -> parámetros en la red de localización (porque theta está condicionado a la entrada de corriente, por lo tanto, el segundo flujo se detiene aquí).
- ¿Qué habilidades tangibles no específicas de la plataforma adquieren los informáticos a través de su educación universitaria?
- ¿Qué es la estrategia de bandidos multibrazos en línea en el aprendizaje automático?
- ¿Cuáles son algunos de los exámenes de certificación de Cloud Computing aprobados a nivel mundial?
- ¿En qué campo debe centrarse un informático para el futuro?
- ¿Qué es lo que impide que la humanidad logre una IA fuerte, la velocidad de procesamiento o un algoritmo desconocido?