Durante la validación cruzada k-fold, ¿cuáles son algunas soluciones posibles cuando la varianza de las estimaciones de error de prueba es muy alta?

La respuesta de John Chen tiene valiosas sugerencias. Es posible que desee considerar estos puntos también:

  • Parece que su conjunto de datos tiene una distribución de clases objetivo desequilibrada, una cobertura de datos deficiente en algunas (o todas) clases, o una combinación de las anteriores. Adquirir más datos podría ser una solución.
  • Visualizar el conjunto de datos podría ser útil para comprender si alguna parte del espacio vectorial de entrada es escasa.
  • La deriva del concepto podría ser una posibilidad si estos datos se han recopilado en diferentes períodos de tiempo o si se trata de una instantánea de la transmisión de datos. Si se produce una deriva del concepto, entonces 2 vectores de entrada similares pueden tener etiquetas de destino diferentes. Si estos 2 vectores de entrada se dividen en diferentes pliegues en la validación cruzada, entonces se espera obtener puntajes de prueba / tren muy diferentes.
  • Por último, si la implementación de la validación k-fold selecciona instancias en orden (del conjunto de datos) en lugar de instancias elegidas al azar, entonces deberíamos esperar ver variaciones si la distribución de entradas a objetivos cambia de las instancias anteriores a las posteriores en el conjunto de datos

Si este es un caso en el que se utilizó una forma funcional incorrecta y el modelo está sobreajustando el conjunto de entrenamiento, entonces haría bien en encontrar una mejor función que sea más representativa del sistema. Alternativamente , puede tener el modelo correcto pero demasiado ruido en sus datos. En este caso, podría beneficiarse de la poda de sus datos después de descubrir qué es lo que el proceso de capacitación está recogiendo erróneamente.

A menudo es útil examinar la situación antes de elegir un enfoque . Puede probar diferentes formas funcionales al azar, con la esperanza de un mejor ajuste. Este es un enfoque válido si el costo / tiempo que lleva intentarlo es bajo, como cuando hay acceso a bibliotecas. Si se trata de una situación sencilla del tipo de tarea, las siguientes dos cosas generalmente lo ayudan a avanzar:
1) Visualizar los datos. Esto ayuda a validar sus hipótesis.
“Los datos siguen una distribución X, no Y (modelo incorrecto)”.

“Los parámetros A, B, D son predictores significativos, pero no el parámetro C (demasiado ruido)”

2) Sumérgete más en los datos. Puede intentar averiguar si el modelo se descompone de manera predecible ejecutando más pruebas de validación en los datos elegidos a mano. También hay conocimiento sobre el sistema que se puede obtener al examinar los datos subyacentes y pensar en ellos.
“Nuestro modelo se descompone catastróficamente para este grupo de puntos de datos, pero parece funcionar mejor en otros lugares”

“Hay muchas variables discretas en estos datos, tal vez pueda probar un modelo diferente”

Si este es un problema que no fue diseñado para ser fácil de resolver, aquí hay algunas diapositivas de una breve conferencia del entonces profesor de Stanford Andrew Ng sobre el diagnóstico de problemas y las formas de abordarlos.

http://cs229.stanford.edu/materi

Intente barajar sus datos antes de la validación cruzada para asegurarse de que cada pliegue tenga una representación uniforme de todas las partes de los datos.

More Interesting

Soy un ingeniero electrónico que conoce algoritmos de aprendizaje automático, big data, estadísticas, SQL, Matlab. ¿Puedo ser contratado como ingeniero de IA de nivel básico?

¿Cuál es el mejor método para presentar la idea de una red neuronal de convolución a un profano?

¿Cuáles son algunas aplicaciones de la vida real del aprendizaje automático además de las aplicaciones relacionadas con la web?

¿Cómo debería abordar el problema de segmentar el césped de una imagen?

¿Cómo se aplica el análisis tensorial al aprendizaje automático, en términos de contexto específico de aplicación?

¿Cuál es el alcance del aprendizaje automático en la verificación?

¿Alguien ha intentado utilizar motores de recomendación y alguna forma de filtrado colaborativo para destacar agujeros en el mercado y producir conceptos para un mayor desarrollo en los productos?

¿Qué es la estimación de contraste de ruido (NCE)?

¿Cuál es la tasa de error de trama (FER) en las tareas de reconocimiento de voz?

¿Cuáles son los algoritmos principales detrás de Google Translate?

¿Necesito almacenar los pesos en los pasos de tiempo anteriores además de las activaciones cuando uso la propagación hacia atrás a través del tiempo en redes neuronales recurrentes?

¿Vale la pena un doctorado en CS si no planea ingresar a la academia?

¿Puedo confiar en un modelo de clasificación con validación cruzada y precisión de prueba decentes incluso si el número de observaciones es menor que el de las características?

¿Cuál es su opinión sobre el lenguaje de programación Julia?

Cómo construir un modelo de regresión lineal en el aprendizaje automático