No estoy seguro exactamente de lo que está preguntando, y debo admitir que no he mirado los documentos particulares que menciona en su largo comentario.
Pero aquí hay otro trabajo similar en espíritu al enlace que cita Akshay Balwally, pero más reciente, y le permite visualizar lo que varios filtros convolucionales están “buscando”:
Invertir redes convolucionales con redes convolucionales
- ¿Cuáles son las desventajas de usar el algoritmo clásico de árbol de decisión para grandes conjuntos de datos?
- Cómo interpretar la salida de una red neuronal
- ¿Cuáles son las cosas divertidas que encontró en el procesamiento del lenguaje natural (PNL)?
- ¿De qué sirve un alumno constante?
- ¿Cómo utilizaría el aprendizaje automático para resolver este tipo de preguntas: 1 + 4 = 5, 2 + 5 = 12, 3 + 6 = 21, 8 + 11 =?
https: //pdfs.semanticscholar.org…
Es casi seguro que te equivocas. Las precisiones de detección de objetos todavía están significativamente por detrás de los niveles humanos. La clasificación de imágenes es donde los sistemas basados en CNN han comenzado a rivalizar con el rendimiento humano.
Aquí hay un trabajo que relaciona el procesamiento visual humano con las CNN profundas:
[1406.3284] Las redes neuronales profundas rivalizan con la representación de Primate IT Cortex para el reconocimiento de objetos visuales básicos