Como dijo Antonin, la magnitud del gradiente le dará una muy buena idea de cuánto “aprende” una red desde un punto de datos dado.
Dicho esto, esto no es particularmente interesante. La razón es que si ya tiene la etiqueta, entonces no hay nada en particular que desee cambiar sobre su enfoque de capacitación dado el hecho de que algunos ejemplos son más poderosos que otros.
Hay un área de aprendizaje automático que ha tenido bastantes éxitos con una variante dramáticamente más útil de este problema. Se llama aprendizaje activo y se trata de tratar de determinar qué puntos de datos cuando se etiquetan producirán la mejor mejora marginal en el rendimiento de la red.
- ¿Cómo debe prepararse para un programa de maestría / doctorado centrado en la inteligencia artificial?
- ¿Cuáles son algunos marcos de tiempo realistas para dominar diversas habilidades de programación, como el dominio de Python para la ciencia de datos, git, etc.?
- ¿Cuántos temas de matemáticas me mejorarán en el aprendizaje automático?
- ¿La red neuronal convolucional es básicamente un procesamiento previo de datos a través del núcleo más las redes neuronales? ¿Acaso Deep Learning no es solo redes neuronales con preprocesamiento para las selecciones de funciones automatizadas?
- ¿Puedes explicar el hashing de características de una manera fácil de entender?
Es algo muy bueno, un área realmente excelente de investigación actual, pero en la que personalmente no soy un experto. Si está interesado en aprender más, aquí hay un comienzo: aprendizaje activo (aprendizaje automático) – Wikipedia