¿Cómo determinaría si el error de cuando ejecuta su algoritmo de aprendizaje automático es de alto sesgo o alta varianza (también conocido como corte o sobreajuste)?

Según lo sugerido por Dean, puede comparar el rendimiento de su modelo en el conjunto de entrenamiento y un conjunto retenido (también llamado conjunto de validación). Para hacer esto, trace el error del conjunto de entrenamiento y validación contra el tamaño del conjunto de entrenamiento. [el error de validación proporciona una estimación del error de prueba. ]

Si ve una gráfica como esta, representa un alto sesgo, porque la validación cruzada y el error de entrenamiento son altos

Si ve un gráfico como este, representa una gran varianza, porque hay una gran brecha entre el error de entrenamiento y el error de validación cruzada

Para comprender los detalles, consulte el curso de aprendizaje automático Prof. Andrew Ng.

Todas las notas se resumen aquí: 10_Advice_for_applying_machine_learning

Compare el rendimiento de su modelo en el conjunto de entrenamiento y un conjunto extendido. Si el rendimiento en el conjunto de entrenamiento es alto pero es bajo en el conjunto retenido, está sobreajustado. Si el rendimiento en el conjunto de entrenamiento es bajo y es bajo en el conjunto retenido, está en falta de equipamiento.

More Interesting

¿Cómo asociaría un producto con una categoría y subcategoría basada en la descripción de texto del producto?

¿Cómo se ha desviado Grok Solutions de la visión de Numenta?

¿Qué libros o recursos de probabilidad y estadística debo consultar antes de sumergirme en Machine Learning, PNL, minería de datos, etc.? Soy un completo principiante.

¿Cómo se evalúa si uno tiene una buena palabra incrustada?

¿Cuál es la forma óptima de almacenar y cargar un gran conjunto de datos de imágenes?

¿Cuál es la diferencia entre un conjunto de entrenamiento y un conjunto de prueba?

Cómo usar el aprendizaje automático para unir un patrón a partir de valores CSV

¿Cómo escribirías un programa de aprendizaje automático desde cero?

He completado la clase Coursera de Andrew Ng sobre aprendizaje automático. ¿Qué debería hacer después? ¿Qué puedo hacer a continuación?

Cómo configurar datos de entrenamiento para una red neuronal para generar valores de joystick basados ​​en una entrada de imagen

Cómo diseñar una red neuronal para predecir la rutina diaria de un usuario

¿Cuál es la mejor manera para que un principiante completo aprenda el aprendizaje automático?

¿Son las redes neuronales artificiales la única forma de establecer un aprendizaje profundo?

Como principiante en Deep Learning hoy, ¿qué marco debo usar?

¿Puede una red neuronal LSTM aprender a reescribir un código C en C ++ sabiendo que lo entrené con un conjunto de datos equivalente a la instrucción C / C ++?