¿Qué criterios deberían ser apropiados para terminar el entrenamiento codicioso no supervisado de autoencoder por capas?

Con una capacitación no supervisada, creo que un conjunto de validación no siempre es necesario. Uno mantiene un conjunto de validación durante la capacitación supervisada porque le importan los errores de generalización: lo que importa no es qué tan bien se desempeña su modelo en los datos de capacitación, sino qué tan bien se desempeña en los datos de prueba (sin etiqueta). Con un entrenamiento no supervisado, los datos de prueba sin etiquetar pueden ser parte de su conjunto de entrenamiento.

De cualquier manera, el criterio de detención es el mismo: controla la pérdida y deja de entrenar cuando ya no mejore. Es posible quedar atrapado en una meseta de la que podría salir, así que no se detenga de inmediato (a menos que la pérdida esté empeorando). También considere disminuir la tasa de aprendizaje cuando la pérdida deje de mejorar; a veces puede mejorar aún más con una tasa de aprendizaje menor

Related Content

¿Cuáles son mis próximos pasos en el aprendizaje automático después de aprender estadísticas y álgebra lineal?

¿Por qué los investigadores de sistemas informáticos no creen en la IA o la aplican a problemas en los 'sistemas informáticos'?

En el procesamiento del lenguaje natural para realizar análisis semántico, ¿es útil y necesario generar un árbol de análisis?

¿De qué manera la empresa promedio utilizará tecnologías de visión por computadora dentro de 20 años?

¿Se ha resuelto el problema de reconocimiento de caracteres escritos a mano?

¿Cuánto del aprendizaje automático es en realidad solo optimización?

¿Qué es el análisis de componentes principales en términos de super laicos?

Normalmente usan la Detención temprana: mantenga un conjunto de validación (algunos datos que no usará para la capacitación, sino para diagnosticar el progreso de su sistema)

Al igual que rastrea el error de entrenamiento, también siga rastreando el error en este conjunto de validación, cuando descubra que el error de validación comienza a aumentar (incluso si el error de entrenamiento no aumenta), lo que hace debido al sobreajuste, detenga el entrenamiento. Esto se puede hacer para cada capa.

Aniket Singh

More Interesting

¿Por qué la normalización media ayuda en el descenso del gradiente?

¿Hay alguna diferencia entre el modelado de temas y el clúster?

¿Las redes de confrontación generativas funcionan para la detección de valores atípicos?

¿Cómo podría el posmodernismo cambiar el aprendizaje automático?

¿Cómo podría usarse el aprendizaje automático para ayudar a las personas enfermas en los países del tercer mundo?

¿Cómo se puede diseñar la topología de una red neuronal artificial con una capa oculta para lograr efectivamente la reducción de la dimensionalidad?

¿Cuántos selfies debe leer un Machine Learning antes de poder discernir el origen étnico?

¿Cuáles son algunos proyectos interesantes de minería de texto en análisis político?

¿Por qué la longitud desigual del texto es un problema en el procesamiento del lenguaje natural?

Cómo mejorar mi escritura para pasante de aprendizaje automático

¿Qué enfoques utilizaron los participantes en Quora ML CodeSprint 2013?

¿Qué matemáticas se necesitan para este curso de aprendizaje automático?

¿Cuál es el significado de la optimización convexa en el aprendizaje automático?

¿Qué excelente proyecto universitario podemos construir usando Machine Learning para obtener una gran exposición?

¿Cuál es el mejor marco de recomendación para mi primer sistema de recomendación?

Web Analytics