Así no es como funciona un bosque aleatorio.
La idea de un bosque aleatorio no es recoger un árbol al azar, sino usar todos los árboles generados al azar al mismo tiempo.
Sabemos que algunos datos en el conjunto de capacitación son más importantes que otros datos en términos de poder predictivo, pero no sabemos cómo identificar esos registros. También sabemos que algunos atributos pueden tener más poder predictivo que otros, pero tampoco los conocemos.
- ¿Cómo podría el aprendizaje automático o la IA en general ayudar a la agricultura?
- ¿Es la informática fotónica el futuro?
- ¿Qué precauciones podemos tomar para limitar el poder de la inteligencia artificial?
- ¿Cuáles son las unidades de medida más comunes en informática y qué miden?
- ¿Qué hay de nuevo en la tecnología informática?
En un bosque aleatorio, cada árbol utiliza un subconjunto diferente de datos y un conjunto diferente de atributos. La idea es que algunos de estos árboles serán “afortunados” y obtendrán buenas predicciones, mientras que otros árboles no funcionarán tan bien. Lo interesante es que todos juntos generalmente funcionan mejor que cualquier árbol aislado. La razón es que para que un solo árbol supere al conjunto, debe poder elegir perfectamente qué registros usar como conjunto de entrenamiento y qué atributos.
Se ha mencionado que un Bosque aleatorio también evita el sobreajuste, pero no creo que ese sea el espíritu de la pregunta, la respuesta simple a la pregunta es que “muchos árboles son mejores que solo uno a menos que tenga mucha suerte”.