Necesita un conjunto de pruebas para evaluar la fuerza y la utilidad de su modelo de aprendizaje automático.
Esencialmente, un conjunto de prueba son los datos que su modelo (o usted) no ha visto, mientras que el conjunto de entrenamiento son los datos en los que realiza el ajuste (regresión lineal, por ejemplo). Por lo general, su rendimiento en el conjunto de pruebas es una buena indicación de cómo se desempeñará su modelo en datos reales y desconocidos.
Por ejemplo, en esta demostración [1], tenga en cuenta las siguientes líneas:
- ¿Hay aplicaciones de IA en adquisiciones?
- ¿Existe algún programa que pueda ajustar computacionalmente funciones armónicas esféricas en un conjunto de datos?
- ¿Cuál es la diferencia entre la deserción y la normalización de lotes?
- ¿El filtrado colaborativo se considera aprendizaje automático?
- Cómo comenzar a leer trabajos de investigación sobre Machine Learning
# Divide los datos en conjuntos de entrenamiento / prueba
diabetes_X_train = diabetes_X [: – 20]
diabetes_X_test = diabetes_X [-20:]
# Divide los objetivos en conjuntos de entrenamiento / prueba
diabetes_y_train = diabetes.target [: – 20]
diabetes_y_test = diabetes.target [-20:]
¿Qué es un conjunto de datos de entrenamiento y un conjunto de datos de prueba en el aprendizaje automático? ¿Cuáles son las reglas para seleccionarlos?
Conjuntos de datos de entrenamiento y prueba
Tenga en cuenta que un conjunto de prueba es diferente del conjunto de validación. Un conjunto de validación sigue siendo parte del conjunto de entrenamiento, que usted usa para ajustar los parámetros de su modelo.
Notas al pie
[1] Ejemplo de regresión lineal