Escribí algunos documentos sobre la imposibilidad de estimar correctamente (es decir, de manera imparcial = correcto en promedio) la varianza de la validación cruzada. Esto surge porque los diferentes pliegues se superponen. Ver http://www.iro.umontreal.ca/~lis… y http://www.iro.umontreal.ca/~lis…. La incertidumbre en la medición proviene de dos fuentes: (a) la elección particular (aleatoria) de ejemplos de entrenamiento (de la distribución subyacente que los genera), y (b) la elección particular (aleatoria) de ejemplos de prueba (de la misma distribución , generalmente). Ambos (1) y (2) anteriores combinan ambas fuentes de variación. Si tiene un pequeño conjunto de datos y desea evaluar cómo el ALGORITMO DE APRENDIZAJE se generalizaría en OTROS datos de capacitación, entonces (a) puede ser importante. Por otro lado, si tiene muchos datos y desea saber cómo funcionaría su FUNCIÓN capacitada en otros datos de prueba, entonces es suficiente usar un conjunto de prueba extendido, en el que la verdadera variación del error medio de la prueba puede estimarse fácilmente si los ejemplos son iid (p. ej., tome la varianza empírica de los errores de prueba y divida por el número de ejemplos de prueba). En aplicaciones industriales, la última configuración es más común. En la investigación de Machine Learning, el primero puede ser el foco, y tenemos que conformarnos con una estimación de varianza insatisfactoria. Los documentos anteriores discuten el hecho de que algunos estimadores están sistemáticamente sesgados de manera incorrecta (subestimando la varianza).
¿Cuál es el significado / interpretación de la varianza de validación cruzada?
Related Content
Yoshua Bengio: ¿Será el aprendizaje profundo un paso hacia la IA consciente?
¿Qué requisitos previos debe tener para aprender la teoría de las redes neuronales artificiales?
More Interesting
¿Qué significa para una red neuronal ser entrenada de extremo a extremo?
Cómo entrenar Word2Vec en un conjunto de datos personalizado
¿Es Bayes jerárquico básicamente una introducción de hiperparámetros en el modelo?
¿Cuál es la diferencia entre alineación y deformación en visión artificial?
¿Cómo ganan dinero las startups de aprendizaje profundo o aprendizaje automático?
¿Cómo lidian las personas con visión artificial con el sobreajuste?
Cómo entrenar a una CNN con datos insuficientes y no tan buenos
¿Por qué los diseñadores o los PM deben aprender sobre el aprendizaje automático?