La razón principal por la que los investigadores separan una parte de los datos de entrenamiento como un conjunto de pruebas es porque pueden ver cómo su modelo entrenado puede generalizarse a los datos invisibles cuando se implementa.
Al utilizar el conjunto de pruebas para cualquier entrenamiento previo, está asumiendo que sus datos de entrenamiento capturan claramente todas las variaciones / irregularidades presentes en los datos del mundo real (es decir, los ejemplos para los que su modelo intentará hacer predicciones, después de que haya desplegado). Esta es una suposición que a menudo es incorrecta. Por lo tanto, puede verse como un ajuste excesivo. Es muy probable que su modelo tenga un mejor rendimiento en el entrenamiento, pero habría mucha incertidumbre sobre cómo funcionará el modelo después de la implementación. Cualquier error causado por esta incertidumbre podría ser desastroso (por ejemplo, predicciones de existencias)
Así que evite usar su conjunto de prueba hasta el final. Si cree que no tiene suficientes datos para dividirlos en Conjunto de trenes, válido y de prueba, realice la validación cruzada.
- ¿Qué es un sistema de 2 qubits y en qué se diferencia de un sistema de 3 qubits?
- ¿Es la mecánica cuántica una indicación de que podríamos estar viviendo en una simulación?
- ¿Qué es el determinismo cuántico?
- ¿Qué sucede si desarrollamos una computadora cuántica avanzada que de repente puede resolver y revelar tanta verdad y ciencia que ni siquiera sabemos cómo manejarla?
- ¿De qué manera el aprendizaje automático cuántico cambiará el juego?