El conjunto de entrenamiento debe estar separado del conjunto de prueba. La fase de entrenamiento consume el conjunto de entrenamiento, como lo han señalado otros, para encontrar un conjunto de valores de parámetros que minimicen una determinada función de costo en todo el conjunto de entrenamiento.
Mientras que el conjunto de prueba es para probar el modelo para verificar cómo funciona en nuevas versiones invisibles de las mismas clases. Al igual que en MNIST, puede usar todos los ejemplos de entrenamiento de 60k para entrenar un modelo. Luego, para determinar la precisión real del modelo, ejecute el modelo entrenado en el conjunto de prueba de 10k.
Entonces, si el modelo logra una precisión del 100% en el conjunto de entrenamiento, eso no significa que sea 100% preciso. Puede deberse a un sobreajuste, ruido de modelado o simplemente memorización. Por lo tanto, el conjunto de prueba que tiene las mismas clases pero con algunas condiciones variables, dará un mejor indicador de la capacidad de generalizar o la precisión real que uno espera del modelo en un entorno del mundo real. Por lo tanto, un modelo que alcanza un 99,5% de precisión en el conjunto de prueba, tiene una buena capacidad de generalización y, por lo tanto, se espera que funcione igual de bien en otros ejemplos invisibles.
- ¿Qué condiciones se deben cumplir para que el tiempo de ejecución se acelere al usar GPU para redes neuronales (NN)?
- ¿Cuáles son algunos de los mejores cursos de ML para una maestría en India?
- ¿Cuál es el mejor software de reconocimiento facial en el mercado?
- ¿Qué conocimiento previo es necesario para el aprendizaje automático?
- ¿Cuál es la mejor manera de estudiar IA y aprendizaje automático?
Puede dividir aún más el conjunto de entrenamiento en dos conjuntos, el conjunto de entrenamiento y el conjunto de validación. Digamos 50k de entrenamiento y 10k de validación. El conjunto de validación ayuda a encontrar un punto donde detener el entrenamiento, especialmente cuando la precisión del entrenamiento sigue disminuyendo mientras el error de validación comienza a aumentar, esto indica un sobreajuste.
Espero que esto ayude.