No son particularmente invariables para la iluminación, la distancia focal o el cambio de punto de vista, pero son simplemente tolerantes a esas condiciones. La tolerancia se produce de muchas maneras, la tolerancia a los cambios de distorsión, como el cambio del punto de vista o el cambio de la distancia focal de la cámara, se crean alternando capas de submuestreo.
Si bien la tolerancia a los cambios de iluminación se puede construir al blanquear las imágenes o al realizar la normalización de respuesta local (LRN) o la normalización de contraste local en la entrada o en la salida de cada capa en la red.
En general, se puede aumentar la tolerancia a cualquier transformación [matemática] T [/ matemática] al aumentar el conjunto de datos originales.
- ¿Alguien ha probado el cableado cíclico de la red neuronal?
- En el aprendizaje de características, ¿cuál es la regla general para decidir el número de parches aleatorios y el número de iteraciones / épocas con respecto al número deseado de nodos / longitud de la característica?
- Cómo obtener una pasantía de investigación en aprendizaje automático o inteligencia artificial en una universidad de los EE. UU., Ser indio trabajando en una startup
- ¿Existe alguna implementación de aprendizaje profundo de respuesta basada en la recuperación de preguntas?
- ¿Cuál es una buena manera de entender la pérdida de Minkowski con una configuración diferente?
[matemáticas] S = [x_1, x_2, …, x_ {n}] [/ matemáticas]
Con el conjunto de datos transformado [math] T (S) [/ math] para construir un conjunto de datos aumentado.
[matemáticas] S_ {aumentada} = [S, T (S)] [/ matemáticas]
donde [matemáticas] T (S) = [T (x_1), T (x_2),…, T (x_ {n})] [/ matemáticas]
Al entrenar el sistema de reconocimiento de imágenes con [math] S_ {augmented} [/ math] se acumula tolerancia a la transformación [math] T [/ math]. [matemática] T [/ matemática] puede ser cualquier cosa como iluminación, rotación, escalado, etc.
Por lo tanto, al transformar deliberadamente las imágenes usando varias transformaciones y aumentar esos puntos transformados en el conjunto de datos originales, el sistema aprende a mapear esas imágenes transformadas de la misma manera que el original, creando así una representación que es algo tolerante a esas transformaciones.
Espero que esto ayude.