No codifican la posición y orientación del objeto en sus predicciones.
Pierden por completo todos sus datos internos sobre la pose y la orientación del objeto y dirigen toda la información a las mismas neuronas que pueden no ser capaces de manejar este tipo de información.
Una CNN hace predicciones mirando una imagen y luego verificando si ciertos componentes están presentes en esa imagen o no. Si lo son, entonces clasifica esa imagen en consecuencia.
- ¿Cuáles son los modelos de redes neuronales más básicos que un principiante debe aprender?
- Cómo ejecutar una sesión de tensorflow en un solo proceso y núcleo
- Deseo obtener un doctorado en Ciencias de la Computación de la India y no de ninguna universidad de los Estados Unidos. ¿Será esta una buena decisión?
- ¿Las startups ofrecen trabajos orientados a la investigación?
- ¿Qué tan pronto la automatización afectará el futuro del arte conceptual?
En una CNN, todos los detalles de bajo nivel se envían a todas las neuronas de nivel superior. Estas neuronas luego realizan convoluciones adicionales para verificar si ciertas características están presentes. Esto se hace caminando el campo receptivo y luego replicando el conocimiento en todas las neuronas diferentes
Según el profesor Hinton, si una neurona de nivel inferior ha identificado un oído, entonces tiene sentido enviar esta información a una neurona de nivel superior que se ocupa de identificar caras y no a una neurona que identifica sillas. Si la neurona facial de nivel superior obtiene mucha información que contiene tanto la posición como el grado de certeza de las neuronas de nivel inferior de la presencia de una nariz, dos ojos y un oído, entonces la neurona facial puede identificarla como una cara.
Su solución es tener cápsulas, o un grupo de neuronas, en capas inferiores para identificar ciertos patrones. Estas cápsulas generarían un vector de alta dimensión que contiene información sobre la probabilidad de la posición de un patrón y su pose. Estos valores serían luego alimentados a las cápsulas de nivel superior que toman múltiples entradas de muchas cápsulas de nivel inferior