Durante el entrenamiento, el conjunto de datos normalmente se divide en tres grupos, los conjuntos de entrenamiento, validación y prueba en la proporción 65:20:15, por ejemplo. El número de épocas se puede establecer en un valor alto y luego, siempre que el error de validación y entrenamiento continúe disminuyendo, el entrenamiento debe continuar hasta el punto en que el error de validación y entrenamiento comience a desviarse. El entrenamiento debe terminar especialmente cuando la tasa de error de validación comienza a aumentar mientras la tasa de error de entrenamiento continúa disminuyendo, esto es un indicador de sobreajuste.
Por lo tanto, el número real de épocas no es tan significativo en comparación con los indicadores de rendimiento, como las tasas de error de capacitación y validación. Esas dos métricas de rendimiento ayudan a un investigador o ingeniero de ML a determinar cuándo terminar el proceso de aprendizaje, es por eso que las épocas de aprendizaje reales deben establecerse lo más alto posible y terminar el aprendizaje temprano en función de las tasas de error de capacitación y validación.
Espero que esto ayude.
- ¿La actual ola popular de preocupación por la IA y la robótica es simplemente un buen antropomorfismo, asignado a las máquinas?
- ¿Cómo funcionan los filtros Prisma?
- Richard Muller: ¿Crees que el nacimiento de la verdadera IA es el principio del fin de la humanidad?
- ¿Cuál crees que sería el futuro? cyborgs, inteligencia artificial u otra cosa?
- ¿Qué es un modelo de red neuronal?