Tiene sentido si el tamaño de su función es lo suficientemente grande. Si tiene tantas funciones, siempre debe optar por un método de selección de funciones sin supervisión y ver qué cambios ofrece.
Sin embargo, Random Forest es un algoritmo muy poderoso cuando se usa con hiper-parametrización adecuada (optimizando tanto el número de tress como el número de características en cada nodo). Además, es propenso a un ajuste excesivo, a diferencia de los algoritmos de aumento de gradiente. Entonces, ten cuidado con eso.
Si usa el método de búsqueda de cuadrícula y el tamaño de su función no es tan grande, la selección de funciones no es necesaria, en mi opinión. Seleccionará automáticamente las mejores características en cada nodo de los árboles de conjunto.
- ¿Se utiliza XGBoost en productos?
- Diseño de vectores de características para algoritmos de aprendizaje automático. ¿Debo poner características de diferentes dominios en el mismo vector?
- ¿Cómo podemos usar la herramienta Weka para crear un sistema de recomendación?
- ¿Qué son los componentes del procesamiento del lenguaje natural?
- ¿Cuáles son las falacias comunes de minería de datos?
Pero, sugeriría experimentar con diferentes cosas y ver qué sucede usted mismo. Así es como realmente obtienes el mejor modelo.