¿Qué significa que una modelo se sobreajuste?

El sobreajuste significa que entrenamos un modelo para que coincida con su conjunto de entrenamiento tan bien que coincida muy bien con el conjunto de entrenamiento, pero puede hacer un mal trabajo de generalizar a más datos.

Fuente de imagen

Aquí hay un ejemplo simple. Tenemos un montón de datos de entrenamiento, representados por los puntos negros. También tenemos una línea de regresión lineal que se ajusta y generaliza muy bien los datos. Pero luego tenemos la predicción de nuestro modelo (línea roja). Como puede ver, la predicción del modelo se adapta perfectamente a cada elemento del conjunto de entrenamiento. Sin embargo, los pesos son tan altos que el modelo resultante probablemente hará un trabajo muy pobre al generalizar los datos. Esto es lo que se denomina sobreajuste.

Tenga en cuenta que el ajuste perfecto de un conjunto de datos no significa necesariamente que esté sobreajustando datos, el síntoma más grande es una generalización deficiente.

Aquí hay una demostración de sobreajuste:

http://playground.tensorflow.org

Simplemente haga clic en el botón de reproducción en la esquina superior izquierda. Verá el tren de la red neuronal para intentar ajustar los datos. A medida que la red entrena, observe el gráfico en la parte superior derecha que muestra el rendimiento (función de pérdida) tanto para los datos de entrenamiento como de prueba. A medida que el rendimiento de los datos de entrenamiento mejora (la pérdida disminuye), el rendimiento de los datos de prueba disminuye (la pérdida aumenta).