¿Qué haces cuando tu modelo falla la validación cruzada?

Hay dos cosas que generalmente causan esto:

Está entrenando en exceso en su conjunto de datos de entrenamiento: necesita más datos de entrenamiento o un modelo más simple.
Su conjunto de validación no es representativo de sus datos de entrenamiento. Con el muestreo aleatorio, esto es raro: por lo general, solo veo que aparece con pequeños conjuntos de datos (en cuyo caso, probablemente el número 1 también saldrá).

“Si regresa y adapta el modelo hasta que funcione, ¿por qué molestarse en guardar datos?”

El conjunto de datos de validación es parte de sus datos de entrenamiento. Es una herramienta que usted, como modelador, utiliza para intentar simular un caso de prueba del mundo real mientras está construyendo el modelo: lo espera para encontrar (y solucionar) problemas como este. Pero sí, debe tener cuidado de no mentirse a sí mismo a través de su conjunto de validación ejecutándolo cientos de veces hasta que le cuente la historia que desea escuchar. Si sus datos son razonablemente grandes, es difícil incluso hacer esto.

¿Cuáles son algunos buenos currículums de Data Science?

¿Cómo juegan un papel los datos y el análisis en el negocio de un cliente?

¿Cuál es el mejor curso para Python en ciencia de datos?

¿Qué tipo de pruebas estadísticas se pueden realizar en modelos estadísticos versus conjuntos de datos?

¿Debería centrarme en la ciencia de datos, el desarrollo web o el desarrollo de iOS?

¿Cuál es una referencia para el truco del núcleo en los algoritmos de aprendizaje automático que es lo más matemáticamente detallado posible?

Su modelo está demasiado ajustado. Intente reducir las variables o comience nuevamente por análisis exploratorio para reafirmar sus objetivos.

La muestra fuera de tiempo representa la utilidad de sus modelos. Su objetivo en última instancia es predecir algo que no haya sucedido antes. No tiene sentido ser preciso acerca de predecir el pasado.

Anmol Mohan

Digamos que su modelo no tiene regularizador y funciona mal en el conjunto de prueba. Luego agrega un regularizador, y va y viene entre el entrenamiento y la validación cruzada para encontrar los hiperparámetros correctos para el regularizador, y finalmente, el modelo funciona en el conjunto de prueba. Incluso en este escenario, los parámetros reales del modelo no han utilizado los datos de validación, solo los hiperparámetros se deciden en función del rendimiento en el conjunto de validación. Los hiperparámetros son típicamente de muy pequeña dimensionalidad en comparación con los parámetros del modelo. No es posible que estos hiperparámetros “memoricen” el conjunto de validación. Por lo tanto, si un modelo funciona bien en el conjunto de validación después de múltiples rondas de validación cruzada, lo más probable es que el modelo no se ajuste demasiado al conjunto de entrenamiento, y también debería funcionar bien en el conjunto de prueba.

Anmol Mohan

More Interesting

¿Por qué LinkedIn separó a su equipo de ciencia de datos?

¿Debo aprender Hadoop o Python si quiero entrar en big data?

¿El éxito del aprendizaje profundo es una noticia falsa?

¿La ciencia de datos requiere más competencias que la ingeniería de software?

¿Cómo entró por primera vez en Machine Learning / Data Science?

Cómo usar Python para ciencia de datos

¿Cuáles son las mejores herramientas de software para trabajar con grandes conjuntos de datos financieros (> 50 gb), por ejemplo, datos de acciones de CRSP?

¿Por qué hay tantos científicos de datos falsos e ingenieros de aprendizaje automático?

¿Cuáles son las mejores herramientas para visualizar gráficos grandes?

¿Cuál es la diferencia entre la desigualdad de Hoeffding y el intervalo de confianza?