Intentar clasificar los patrones que han cambiado de posición o que están deformados en forma puede no ser reconocido si su red neuronal no puede manejar los cambios en la posición / forma debido al desplazamiento / deformación del objeto.
Podría intentar entrenar su red con todos los cambios / deformaciones posibles, pero esto obviamente no es factible. Es mejor diseñar una red que tenga “respuestas invariantes de deformación de posición”.
En la clasificación de imágenes, un gran desafío es lidiar con la variación en la resolución, diferentes tamaños del mismo objeto, etc. Por lo tanto, la información relevante que buscamos varía en escalas espaciales.
- ¿Por qué los algoritmos de búsqueda de IA solo parecen funcionar en la estructura de árbol?
- ¿Hay software de chat bots?
- Desde el punto de vista de la IA, ¿cuáles son los pros y los contras de Rust and Go?
- ¿Hay alguna referencia para C # como la documentación de Java AI?
- Inteligencia artificial: ¿está vivo hoy Miles Dyson, el creador de Skynet?
Una de las características definitorias de las CNN son sus características de invariancia de traducción y, por lo tanto, también se conocen como SIANN.
Por lo tanto, un SIANN puede manejar los cambios en las imágenes y aún así tener un buen desempeño en las tareas de clasificación. Esto es algo que la gente obviamente hace bien. Si le muestro diferentes imágenes de una tabla, cada una con diferentes sombras, orientación, tamaños, etc., todavía sabrá que es una tabla.
- Red neuronal convolucional – Wikipedia