La deserción es una técnica de regularización para evitar el sobreajuste en grandes redes neuronales. Es algo análogo a un conjunto, pero realmente está entrenando a un modelo único. Usaría el abandono además de un método de aprendizaje de conjunto real.
Para aprender un conjunto, recomendaría la opción # 3: crear un conjunto de modelos con diferentes estructuras o configuraciones de parámetros. Desea que estos modelos tengan sesgos algo diferentes para que cometan errores diferentes y puedan corregirse entre sí. El premio de Netflix se ganó con un conjunto de muchos tipos diferentes de modelos.
El refuerzo está diseñado para estudiantes débiles, y las redes neuronales (especialmente las profundas) son muy poderosas. Si una sola red neuronal puede obtener una precisión perfecta en los datos de entrenamiento, entonces no queda nada por impulsar.
- Si existieran interfaces neuronales, ¿cuáles serían las aplicaciones civiles? ¿Cuántos tendría, por qué?
- Cómo decidir si usar modelos de aprendizaje automático supervisados o de refuerzo
- Para evaluar qué tan bueno es un hiperparámetro de red (por ejemplo, la tasa de deserción), ¿debo esperar a la convergencia?
- ¿Se pueden usar las redes de confrontación generativas para casos no supervisados?
- ¿Cuáles son algunas buenas ideas de proyectos o ejemplos para un proyecto de curso de Visión de Computadora basado en Aprendizaje Automático?
El empaquetamiento podría ayudar a algunos, pero creo que obtendría más millaje al variar la estructura de la red que al variar sus datos de entrenamiento.
Pero, ¿por qué no probar varios de estos enfoques y compararlos con datos de validación retenidos? La respuesta correcta podría depender del conjunto de datos e incluso podría ser una combinación de varios métodos.