¿Cuál es el número mínimo de árboles que debo usar en un bosque aleatorio?

Si no tiene ninguna preocupación con respecto a los tiempos de cálculo, cuantos más árboles tenga, mejores estimaciones (confiables) obtendrá de las predicciones de fábrica. Puede usar la tasa de error OOB para determinar la cantidad de árboles.

Por otro lado, si tiene problemas con el desequilibrio de clases o tiene variables que tienen un gran número de niveles (es decir, continuo) versus pequeños (es decir, categórico), es posible que desee tener cuidado con la configuración de los parámetros de RF. Hay ciertas formas de manejar el problema de desequilibrio de clase (es decir, el embolsado se puede hacer teniendo en cuenta la distribución de la clase). El sesgo hacia la selección de predictores continuos puede evitarse mediante mecanismos especiales (el bosque aleatorio condicional -> cforest) es una de las posibles soluciones).

Para resumir, RF es un método muy fuerte, pero el rendimiento inferior puede ser el resultado de las características de los datos.

More Interesting

¿Cuántos datos necesitamos para pensar siquiera en aplicar el aprendizaje profundo?

¿Cuál es el algoritmo detrás de LinkedIn Pulse?

¿Qué algoritmo de recomendaciones es más efectivo para desarrollar un entorno de crowdsourcing y qué lenguaje de programación sugiere?

Después de las estructuras de datos y algoritmos (DSA), ¿qué debo aprender (ML, AI, ciencia de datos)? ¿O debería comenzar a hacer algunos proyectos sobre cosas que ya he aprendido?

¿Qué matemática debería revisar / aprender si quiero comprender a fondo el modelado de efectos mixtos / modelado de regresión?

¿Alguien ha intentado sitios web de IA que se diseñen ellos mismos? ¿Cuál es la diferencia entre los sitios web creados por humanos y por IA?

¿Cuáles son algunos paquetes de software populares para modelos gráficos?

¿Es un SVM o un clasificador MaxEnt apropiado para este escenario de clasificación de texto y por qué?

¿Una máquina de máquina virtual de big data ayuda a analizar archivos grandes?

¿Aprendizaje automático para predecir valores para t + 1?

¿Cuántos selfies debe leer un Machine Learning antes de poder discernir el origen étnico?

¿Debo aprender el aprendizaje automático (supervisado) antes del aprendizaje profundo (sin supervisión)? Solo tengo una computadora portátil en casa, entonces, ¿será suficiente la potencia informática?

¿Qué es el LSTM?

¿Por qué Intel Xeon Phi no se usa mucho para acelerar el entrenamiento de aprendizaje profundo?

Cómo usar mel-spectrogram como entrada de una CNN