¿Es posible determinar cuánto ‘aprende’ una red neuronal desde un punto de datos dado en el conjunto de entrenamiento?

Como dijo Antonin, la magnitud del gradiente le dará una muy buena idea de cuánto “aprende” una red desde un punto de datos dado.

Dicho esto, esto no es particularmente interesante. La razón es que si ya tiene la etiqueta, entonces no hay nada en particular que desee cambiar sobre su enfoque de capacitación dado el hecho de que algunos ejemplos son más poderosos que otros.

Hay un área de aprendizaje automático que ha tenido bastantes éxitos con una variante dramáticamente más útil de este problema. Se llama aprendizaje activo y se trata de tratar de determinar qué puntos de datos cuando se etiquetan producirán la mejor mejora marginal en el rendimiento de la red.

Es algo muy bueno, un área realmente excelente de investigación actual, pero en la que personalmente no soy un experto. Si está interesado en aprender más, aquí hay un comienzo: aprendizaje activo (aprendizaje automático) – Wikipedia

Sí, congelándolo y evaluando su precisión en un conjunto de prueba / validación.

More Interesting

¿Será la Universidad de Gotemburgo un buen lugar para estudiar el procesamiento del lenguaje natural con CLASP en camino?

¿Qué tan significativo es el artículo de FractalNet?

¿Cómo afectan la ciencia de datos, los grandes datos y el aprendizaje automático al campo de la economía?

Como científico de datos, ¿qué te inspiró a seguir una carrera en ciencia de datos?

¿Alguien siente que la programación de sistemas tradicionales es muy diferente del aprendizaje automático?

¿Cuáles son las características de un motor BS4?

¿Cuáles son las mejores universidades para estudiar visión artificial con un enfoque en aprendizaje profundo?

¿Qué aplicaciones prácticas ve para ejecutar los modelos TensorFlow en un teléfono inteligente?

¿Cómo debo comenzar a aprender 'Machine Learning usando Java'?

Cómo saber que un modelo de similitud de documentos puede lograr un alto rendimiento / mejor calidad que los otros modelos

¿AWS es bueno para ejecutar proyectos de aprendizaje profundo? ¿Qué tan rápido y costoso sería entrenar una red convolucional en aproximadamente 1 millón de imágenes?

¿Cuáles son algunos conjuntos de datos etiquetados disponibles públicamente que usan Kinect para su uso en la investigación de la visión por computadora?

¿Cómo 'Diagonal BiLSTM' calcula los estados diagonales a la vez y qué es diagonal?

¿Cuáles son algunos ejemplos del uso del aprendizaje automático en sistemas distribuidos?

Regularización: ¿Por qué se llaman así los SVM L1 y L2 cuando ambos miden la distancia a un hiperplano a lo largo de la proyección ortogonal?