¿Los sistemas de reconocimiento de imágenes de aprendizaje profundo siempre aprenden esencialmente las mismas características de bajo nivel?

Si usa una CNN ( Redes neuronales convolucionales), entonces sí.

Ahora la pregunta es ¿qué es una CNN?

Lo que queremos que haga la computadora es poder diferenciar entre todas las imágenes que se le dan y descubrir las características únicas que hacen que un perro sea un perro o que un gato sea un gato. Este es el proceso que continúa en nuestras mentes también inconscientemente. Cuando miramos la imagen de un perro, podemos clasificarla como tal si la imagen tiene características identificables como patas o 4 patas. De manera similar, la computadora puede realizar la clasificación de imágenes al buscar características de bajo nivel como bordes y curvas, y luego construir conceptos más abstractos a través de una serie de capas convolucionales. Esta es una descripción general de lo que hace una CNN.

Después de usar DeConvNet, esto es lo que obtenemos. Entonces cada capa aprende de las características de bajo nivel en la imagen.