Bueno, comencemos con una breve comprensión del algoritmo Random Forest. Funciona como una gran colección de árboles de decisión relacionados con la decoración.
Los árboles de decisión se utilizan para la clasificación.
Por ejemplo, tenemos esta matriz aquí:
Tenemos características como la función fA1 para la primera muestra de la clase de entrenamiento.
Quizás, el objetivo aquí es tener un bosque aleatorio para clasificar el conjunto de muestras.
- ¿Las IA modernas utilizan el aprendizaje profundo más como algoritmos o cajas negras?
- ¿Cuáles son algunos buenos recursos para aprender sobre algoritmos genéticos y evolutivos?
- ¿Quién es pionero actualmente en el campo de la IA? ¿Cuándo podemos esperar un gran avance?
- ¿Los robots se harán cargo de Quora?
- ¿Cuáles son las diferencias entre un algoritmo AI y un algoritmo computacional regular o qué hace que un algoritmo califique para ser AI?
A partir del conjunto de muestras, los subconjuntos se calculan para encontrar un DT1 a DTn:
Muchos árboles de decisión> bosque? Ja! ¡Viste lo que hicieron ahí!
De los árboles de decisión se crea una clasificación y, por lo tanto, sale la predicción de clase.
El uso de funciones relevantes ayuda a encontrar datos adecuados. Leer aquí:
ŷhat | Bosques al azar en Python
El bosque aleatorio es capaz de regresión y clasificación. Puede manejar una gran cantidad de características, y es útil para estimar cuáles o sus variables son importantes en los datos subyacentes que se modelan.
Una forma de sobreajustar es usar solo características realmente relevantes en su modelo. Si bien esto no siempre se corta y se seca, el uso de una técnica de selección de funciones (como la mencionada anteriormente) puede hacer que sea mucho más fácil.
Fuente: ŷhat | Bosques al azar en Python