¿Cuál es el significado / interpretación de la varianza de validación cruzada?

Escribí algunos documentos sobre la imposibilidad de estimar correctamente (es decir, de manera imparcial = correcto en promedio) la varianza de la validación cruzada. Esto surge porque los diferentes pliegues se superponen. Ver http://www.iro.umontreal.ca/~lis… y http://www.iro.umontreal.ca/~lis…. La incertidumbre en la medición proviene de dos fuentes: (a) la elección particular (aleatoria) de ejemplos de entrenamiento (de la distribución subyacente que los genera), y (b) la elección particular (aleatoria) de ejemplos de prueba (de la misma distribución , generalmente). Ambos (1) y (2) anteriores combinan ambas fuentes de variación. Si tiene un pequeño conjunto de datos y desea evaluar cómo el ALGORITMO DE APRENDIZAJE se generalizaría en OTROS datos de capacitación, entonces (a) puede ser importante. Por otro lado, si tiene muchos datos y desea saber cómo funcionaría su FUNCIÓN capacitada en otros datos de prueba, entonces es suficiente usar un conjunto de prueba extendido, en el que la verdadera variación del error medio de la prueba puede estimarse fácilmente si los ejemplos son iid (p. ej., tome la varianza empírica de los errores de prueba y divida por el número de ejemplos de prueba). En aplicaciones industriales, la última configuración es más común. En la investigación de Machine Learning, el primero puede ser el foco, y tenemos que conformarnos con una estimación de varianza insatisfactoria. Los documentos anteriores discuten el hecho de que algunos estimadores están sistemáticamente sesgados de manera incorrecta (subestimando la varianza).

More Interesting

¿Qué significa para una red neuronal ser entrenada de extremo a extremo?

He estado aprendiendo la red neuronal de retroalimentación y la propagación hacia atrás durante 3 meses y todavía no puedo entenderlo, ¿qué debo hacer?

Cómo entrenar Word2Vec en un conjunto de datos personalizado

¿Es Bayes jerárquico básicamente una introducción de hiperparámetros en el modelo?

Podría ser el primer experto en aprendizaje automático en una empresa como consultor o a tiempo completo. En cualquier caso, ¿cuál debería ser mi tasa?

¿Qué funciona mejor, un ANN con miles de unidades por capa pero solo docenas de capas o uno con docenas de unidades por capa, pero cientos de capas?

¿Cuál es la diferencia entre alineación y deformación en visión artificial?

Will Naive Bayes dará un buen resultado si el conjunto de entrenamiento es mucho más pequeño que el no. de características en un clasificador de aprendizaje automático?

¿Tiene sentido la regularización (L2, abandono, etc.) alguna vez para datos muy ruidosos, pero también abundantes, como series de tiempo financieras?

Redes neuronales convolucionales: ¿Qué están haciendo los regresores de cuadro delimitador en Fast-RCNN?

¿Cómo ganan dinero las startups de aprendizaje profundo o aprendizaje automático?

¿Cómo lidian las personas con visión artificial con el sobreajuste?

Cómo entrenar a una CNN con datos insuficientes y no tan buenos

¿Por qué los diseñadores o los PM deben aprender sobre el aprendizaje automático?

He completado el curso para el aprendizaje automático. Quiero hacer un proyecto corto sobre aprendizaje automático. Actualmente estoy haciendo BE en CS. ¿Qué materia debo elegir?