Esta respuesta supone una división de tren / validación / prueba como se hace generalmente en ML. Otros campos pueden nombrar los conjuntos de manera diferente.
Un conjunto de validación no es necesario si solo tiene un modelo para seleccionar (ya sea paramétrico o no paramétrico), tendría el mismo propósito que el conjunto de prueba.
Puede comprender intuitivamente que al observar que el conjunto de validación no ‘selecciona’ ningún modelo como si fuera a cambiar el conjunto de validación, ningún otro modelo sería / podría seleccionarse.
- Cómo aprender machine learning para construir startups
- Cómo detectar objetos superpuestos casi circulares en MATLAB
- ¿Qué tan profundo es el aprendizaje profundo?
- Procesamiento del lenguaje natural: ¿De qué maneras puedo probar el error de aplicar un modelo de tema a los tweets, dado que no hay un corpus conocido de etiquetas de temas?
- ¿Qué significa el siguiente pasaje de un documento de aprendizaje profundo sobre aprendizaje automático sobre representaciones distribuidas frente a representaciones no distribuidas?
Tenga en cuenta que aún sería necesario si selecciona modelos de diferentes familias, lo que no se incluiría en “ajuste de hiperparámetros”. Por ejemplo, podría comparar 5-NN, regresión logística con [matemática] L_2 [/ matemática] regularización y coeficiente de regularización [matemática] \ lambda = 10 ^ {- 2} [/ matemática] y una línea de base de clase máxima simple. Que serían tres modelos, todavía sería necesario un conjunto de validación (pequeño). El mejor desempeño en el conjunto de validación luego se evalúa en el conjunto de prueba para obtener una estimación de puntaje pesimista.
El modelo que implementa se ajusta a todos los datos.