¿Por qué el algoritmo de refuerzo es robusto para sobreajustar?

Hay una suposición incorrecta en la pregunta. El algoritmo de refuerzo se sobreajusta. De hecho, como ejemplo, se sabe que los árboles de decisión potenciados por gradientes, que utilizan el refuerzo, se sobreajustan más que los bosques aleatorios, que utilizan el embolsado. Esto realmente nos acerca a entender lo que está sucediendo. Como se explica en The Boosting Margin, o Why Boosting Doesn’t Overfit (gracias Shehroz Khan por el enlace), la improbabilidad de sobreajustar no es una propiedad de impulsar, sino de conjuntos o esquemas de votación per se. Puede comprender esto simplemente pensando en el hecho de que es más fácil engañar a un solo experto por la falta de datos suficientes que engañar a varios expertos, incluso si esos no son tan buenos como el original.

Entonces, sí, impulsar, como la mayoría de los otros métodos de conjunto, reduce la probabilidad de sobreajuste. Pero, todavía puede sobreajustar, y en algunos casos lo hace más que los enfoques alternativos.

Shehroz Khan dio una muy buena respuesta, con una serie de buenos consejos. Para más detalles, deberías ir a leer el suyo.

AlgoritmosAprendizaje automático

Related Content

Cómo insertar datos de matriz en una base de datos

¿Cómo podemos resolver el problema mencionado a continuación?

¿Qué es una explicación intuitiva de bosques aleatorios?

¿Por qué Python es realmente más lento en algunos cálculos que Java? Las profundidades recursivas también son limitadas.

Cómo resolver este problema de integración definitiva

¿Cuáles son algunas consideraciones al planificar una migración de AWS?

¿Cuál es el tiempo de ejecución del método sort () en la biblioteca de Colecciones?

Los algoritmos de refuerzo aún pueden sobreajustar; por lo tanto, el proceso de iteración debe detenerse para evitarlo [1]. Sin embargo, el algoritmo AdaBoost es bastante resistente al sobreajuste (comportamiento de sobreajuste lento) al aumentar el número de iteraciones. Este parámetro puede deducirse mediante validación cruzada o de otra manera. Las siguientes podrían ser las razones para impulsar para evitar el sobreajuste [2]:

A medida que avanzan las iteraciones, el impacto del cambio se localiza.
Los parámetros no se optimizan conjuntamente: la estimación por etapas ralentiza el proceso de aprendizaje.
Los clasificadores se ven menos afectados por el sobreajuste

Otras lecturas

El margen de aumento, o por qué no aumenta demasiado
¿El ensamblaje (refuerzo) causa un sobreajuste?
¿AdaBoost es menos o más propenso al sobreajuste?

Notas al pie

[1] https://web.stanford.edu/~hastie …

[2] http://web.stanford.edu/~hastie/ …

David Gruzman

Tengo entendido que no debemos considerar todos los modelos detrás del impulso como un gran modelo. Deberíamos verlo como un promedio inteligente de modelos simples. Esos modelos simples no tienden a sobreajustarse porque son simples …

Otra suposición es que se ajustan de manera diferente y, por lo tanto, se cancelan entre sí por sobre ajuste.

David Gruzman

Impulsar no es un remedio para el sobreajuste. Aumenta los alumnos débiles a un alumno fuerte, y reducirá el BIAS de la hipótesis. El refuerzo se puede utilizar para superar la falta de equipamiento.

En caso de sobreajuste, debe usar Bagging.

David Gruzman

More Interesting

¿Cuál es el algoritmo de cifrado más complejo?

En este algoritmo de clasificación de radix, ¿qué representa cada variable? (Java)

¿Cuáles son los algoritmos comunes que uno debe conocer?

¿Cuáles son los diferentes tipos de algoritmos?

¿Cuál es la complejidad del algoritmo de Horner si encontramos P (x) calculando cada término del polinomio desde cero?

¿Cuál es el orden cronológico de los algoritmos de reconocimiento facial?

¿Cuál es un ejemplo de un bucle infinito?

¿Qué es un algoritmo para programar un torneo para que termine en el menor tiempo posible, dado un torneo round robin (donde cada jugador juega entre sí) entre n jugadores (n es par) que puede representarse con un gráfico completo?

¿Cuáles son los algoritmos para determinar si un punto está dentro de una forma cerrada arbitraria o no?

Cómo agregar números de dos listas vinculadas

¿Hay alguien que enseñe estructuras de datos y algoritmos aquí en Hyderabad?

¿Puedo colaborar con R y Python en la misma página web?

¿Cuáles son algunos algoritmos de redes neuronales artificiales?

¿Cómo podemos encontrar la segunda ruta más pequeña entre dos nodos en un gráfico ponderado / no ponderado de manera eficiente?

¿Qué es recursivo en matemáticas?

Web Analytics