Gracias por A2A.
Definitivamente tiene sentido tener un conjunto de validación para construir modelos, ya que de lo contrario su modelo podría sobreajustar los datos de entrenamiento y generalizarse mal en los datos de prueba. Las pruebas de rendimiento en los datos de validación nos dan cierta confianza en que el modelo se generalizaría bien en los datos de prueba (no vistos). Además, si evaluamos el conjunto de validación durante el entrenamiento, puede darnos algunos consejos sobre cómo proceder con el entrenamiento para evitar el sobreajuste; por ejemplo, en el entrenamiento de CNN, si el error de entrenamiento disminuye pero el error de validación aumenta, disminuimos la tasa de aprendizaje para contrarrestar el sobreajuste.
Ahora, en los casos en que no podemos tener un conjunto de validación, generalmente debido a la falta de buenas cantidades de datos anotados, hacemos validación cruzada.
- Soy un hombre de 25 años que estudió CS, aprendizaje automático y minería de datos para mi maestría. Mi verdadera pasión radica en la música y los viajes. He estado sin trabajo durante 7 a 8 meses, solicito un doctorado en ML y música, y mi papá quiere que consiga un trabajo. ¿Qué debo hacer?
- ¿Qué problemas actuales en robótica intentan resolver los investigadores con el aprendizaje automático?
- ¿Por qué los investigadores de sistemas informáticos no creen en la IA o la aplican a problemas en los 'sistemas informáticos'?
- ¿Qué tan efectivo es usar medidas simples de correlación en la selección de características?
- ¿Qué es la factorización de bajo rango y cuáles son sus aplicaciones en el aprendizaje automático?
¡Pero en caso de que podamos tener un conjunto de validación considerable como la mayoría de los conjuntos de datos de aprendizaje profundo, solo tenemos que probar el rendimiento en el conjunto de validación, sin encontrar ninguna validación cruzada!
Espero que ayude !!