¿Qué significa que una modelo se sobreajuste?

El sobreajuste significa que entrenamos un modelo para que coincida con su conjunto de entrenamiento tan bien que coincida muy bien con el conjunto de entrenamiento, pero puede hacer un mal trabajo de generalizar a más datos.

Fuente de imagen

¿El aprendizaje automático permitirá a Google detectar contenido falso?
¿Cómo se puede usar una distribución como una característica para la clasificación en el aprendizaje automático?
Cómo guardar los pesos de los datos de entrenamiento de las pruebas MNIST en Tensorflow para uso futuro
¿Qué tan efectivamente se pueden usar las redes neuronales en la regresión? ¿Es posible alguna configuración que prediga un número que no se ve en los datos de entrenamiento?
¿Qué tan profundo es el aprendizaje profundo?

Aquí hay un ejemplo simple. Tenemos un montón de datos de entrenamiento, representados por los puntos negros. También tenemos una línea de regresión lineal que se ajusta y generaliza muy bien los datos. Pero luego tenemos la predicción de nuestro modelo (línea roja). Como puede ver, la predicción del modelo se adapta perfectamente a cada elemento del conjunto de entrenamiento. Sin embargo, los pesos son tan altos que el modelo resultante probablemente hará un trabajo muy pobre al generalizar los datos. Esto es lo que se denomina sobreajuste.

Tenga en cuenta que el ajuste perfecto de un conjunto de datos no significa necesariamente que esté sobreajustando datos, el síntoma más grande es una generalización deficiente.

Machine Learning

Related Content

¿Por qué las personas incrustan / envuelven código python en C / C ++?

¿Cuáles son los algoritmos utilizados en los sistemas de preguntas y respuestas en PNL?

¿Cuál es una buena manera de aprender acerca de los métodos bayesianos?

¿Cuáles son las innovaciones clave en el documento 'Evolución a gran escala de clasificadores de imágenes' de Google Brain?

¿Qué sucede cuando las computadoras aprenden a componer música mejor que los humanos?

¿Cuál es el mejor algoritmo para descubrir todos los nodos de la red y mantener esa red en tiempo real?

¿Crees que la tecnología ‘block chain’ es la próxima gran novedad en informática?

Aquí hay una demostración de sobreajuste:

http://playground.tensorflow.org …

Simplemente haga clic en el botón de reproducción en la esquina superior izquierda. Verá el tren de la red neuronal para intentar ajustar los datos. A medida que la red entrena, observe el gráfico en la parte superior derecha que muestra el rendimiento (función de pérdida) tanto para los datos de entrenamiento como de prueba. A medida que el rendimiento de los datos de entrenamiento mejora (la pérdida disminuye), el rendimiento de los datos de prueba disminuye (la pérdida aumenta).

Dan Waxman

More Interesting

¿Cuál es el principio del aprendizaje profundo?

Cómo detectar objetos superpuestos casi circulares en MATLAB

Después de las estructuras de datos y algoritmos (DSA), ¿qué debo aprender (ML, AI, ciencia de datos)? ¿O debería comenzar a hacer algunos proyectos sobre cosas que ya he aprendido?

¿Cómo se debe introducir el gobierno de máquinas?

Cómo comenzar una investigación independiente en aprendizaje profundo

¿Cómo funciona el texto predictivo?

¿Cuál sería un ejemplo de una función simple no convexa?

¿Cuáles son algunas características comunes utilizadas en la clasificación basada en audio?

¿Cuál es el tamaño mínimo de corpus para entrenar incrustaciones de palabras?

¿Por qué está disminuyendo el número de concursos públicos de Kaggle con premios en efectivo?

¿En qué debería concentrarme después de aprender el aprendizaje automático si no estoy interesado en el aprendizaje profundo?

¿Qué es una descripción general del aprendizaje de múltiples núcleos (MKL)?

¿Cómo detectar el sarcasmo en frases u oraciones mientras se extrae texto? ¿Hay alguna metodología utilizada?

¿Qué tipo de aumento de datos se puede usar para imágenes médicas?

¿Cuáles son algunas aplicaciones destacadas de los métodos de máxima verosimilitud?

Web Analytics