Se utiliza un algoritmo de aprendizaje automático para ajustar un modelo a los datos. El entrenamiento del modelo es como una infancia para los humanos … se presentan ejemplos al modelo y el modelo ajusta sus parámetros internos para comprender mejor los datos. Una vez que finaliza el entrenamiento, el modelo se libera sobre nuevos datos y luego usa lo que ha aprendido para explicar esos datos.
Ahora aquí es donde pueden surgir problemas. Si sobreentiende el modelo en los datos de entrenamiento, podrá identificar toda la información relevante en los datos de entrenamiento, pero fallará miserablemente cuando se le presenten los nuevos datos. Luego decimos que el modelo es incapaz de generalizar , o que está sobreajustando los datos de entrenamiento.
Aquí hay un gran ejemplo del fenómeno: modelar la felicidad en función de la riqueza.
En los tres diagramas superiores tenemos datos (x) y modelos (curvas discontinuas). De izquierda a derecha, los modelos se han entrenado cada vez más en los datos de entrenamiento. La curva de error de entrenamiento en el cuadro inferior muestra que el error de entrenamiento mejora cada vez más a medida que entrenamos más tiempo (aumentando la complejidad del modelo). Puedes pensar, genial! ¡Si entrenamos más, mejoraremos! Bueno, sí, pero solo mejor para describir los datos de entrenamiento. El cuadro superior derecho muestra un modelo muy complejo que alcanza todos los puntos de datos. Este modelo funciona muy bien en los datos de entrenamiento, pero cuando se presenta con nuevos datos (examine la curva de error de predicción en el cuadro inferior), lo hace abismalmente.
- ¿Cuándo sé que estoy listo para el aprendizaje automático?
- Con la inteligencia artificial y la robótica desarrollándose a tal ritmo, ¿qué profesiones podrían estar disponibles para mis hijos dentro de 20 años?
- ¿Por qué no hay estudios sobre el aspecto de gestión de proyectos de un proyecto de aprendizaje automático?
- ¿Cuáles son algunas buenas técnicas de aprendizaje automático para predecir valores en el intervalo [matemáticas] [0, 1] [/ matemáticas]?
- ¿Qué cambios traerá consigo la revolución del robot?
Entonces la lección aquí es esta. Para crear buenos modelos predictivos en el aprendizaje automático que sean capaces de generalizar, es necesario saber cuándo dejar de entrenar el modelo para que no se ajuste demasiado. Al igual que un padre, a veces un programador necesita saber cuándo echar a sus hijos de la casa y hacer que se vayan al mundo real. De lo contrario, sabrán todo sobre el sótano de sus padres y, sin embargo, serán incapaces de hacer algo productivo fuera de ese pequeño recinto. 😛