No está especificando de qué modelo está hablando: hay múltiples módulos de conjunto, con árboles impulsados por gradientes y bosques aleatorios que son los primeros que se me ocurren.
En general, si el número de árboles es demasiado pequeño, debe tener un ajuste insuficiente, es decir, no exprimir todo el rendimiento que pueda. Por el contrario, por supuesto, tener demasiados resultados en el sobreajuste.
Dicho esto, los bosques aleatorios votan por lo que son bastante resistentes al sobreajuste (y muchas implementaciones de árboles potenciados en gradiente realizarán una validación cruzada antes de decidir si agregar un nuevo árbol al conjunto o no). En la práctica, es mejor tratarlo como otro parámetro más en el modelo: tenga listo un conjunto de validación y úselo para decidir cuántos árboles y qué altura. La teoría puede decirle que puede ser de alguna manera agresivo en el número de árboles, pero cualquier estimación del número real que no proviene de su conjunto de datos específico estaría sesgado 🙂
- ¿Puede un desarrollador de aprendizaje profundo atrapar criminales que abusan de niños?
- ¿Existe alguna justificación para usar características explícitas de usuario / elemento en la recomendación de MF?
- ¿Por qué se requieren conocimientos de aprendizaje automático para un periodista de datos? ¿Por qué la exploración y visualización de datos por sí sola no es suficiente para el periodismo de datos?
- ¿Cuál es una buena manera de codificar la geolocalización como una característica?
- ¿Cómo se explica el aprendizaje automático y la inteligencia artificial a un niño de 5 años?