Las ANN totalmente conectadas generalmente se caen cuando se traduce la entrada. Debido a que asignan pesos únicos para diferentes regiones del espacio de entrada, una característica que reconoce ‘nariz’ dentro del espacio de entrada de una región de ‘cara’ ya no reconocerá la nariz si se traslada fuera del campo de visión de esa característica.
Las arquitecturas convolucionales, por otro lado, tienen características con pesos que se relacionan con todo el espacio de entrada, por lo que si el morro se mueve a otra región, el detector de características lo detectará cuando convolucione esa región. Esto los hace invariantes de traducción.
Sin embargo, las CNN no son perfectas. Como se explicó en una respuesta anterior, la naturaleza de las operaciones de agrupación puede generar que se deseche mucha información útil. Un ANN completamente conectado no utiliza la agrupación, por lo que no ‘desperdicia’ información de la misma manera.
- ¿Todavía necesitamos crear modelos matemáticos a la antigua usanza, cuando tenemos aprendizaje automático para encontrar alguna función que represente un sistema?
- Al construir una red neuronal artificial para un simulador de caminata, ¿cuál es el número óptimo de variables de entrada?
- ¿Cuál es la mejor manera de aprender robótica completa? ¿Cómo obtengo los conocimientos básicos de robótica para poder construir cualquier tipo de robot?
- ¿Qué tan bien se necesita conocer la codificación para seguir una carrera en inteligencia artificial y trabajar en empresas como Google y Tesla?
- ¿Existen aplicaciones comerciales que hayan utilizado algoritmos de visión artificial?