Respuesta corta: sí, vea los documentos de lo que sea que esté usando para el software. Pero mira la advertencia.
Respuesta más larga a la segunda parte:
Los bosques aleatorios están hechos de árboles con variables elegidas al azar en las divisiones (nodos interiores del árbol). Cualquier árbol puede darle importancias variables para un conjunto de datos dado, medido por la disminución de la impureza promediada en todas las veces que esa variable se usa para hacer una división. Los bosques aleatorios, por su naturaleza, otorgan características de características más robustas (no tengo tiempo para repasar las matemáticas ahora, pero si eres atrevido o matemático, puedes mirar el artículo de Breiman sobre bosques aleatorios; de lo contrario, podrías mirar para tutoriales sobre bosques aleatorios). Ahora, lea la advertencia.
- ¿Por qué las redes neuronales artificiales se usan ampliamente en la clasificación de imágenes?
- ¿Por qué el submuestreo de características u observaciones mejora el rendimiento de GBM?
- ¿Cómo se aplica el aprendizaje profundo en la industria?
- ¿Cuáles son algunas aplicaciones de muestreo de importancia en Deep Learning?
- ¿Cuáles son las principales conferencias sobre inteligencia artificial, procesamiento del lenguaje natural y aprendizaje automático?
Advertencia
Usar variables / características importantes de un bosque aleatorio para, por ejemplo, un modelo lineal, a menudo es una muy mala idea . Los árboles y, por lo tanto, los bosques, suponen que la ‘mejor’ forma de clasificar o retroceder es dividiendo el espacio de características en hiper-rectángulos . Los modelos lineales, como OLS o regresión logística, obviamente no hacen esta suposición , ni muchos otros clasificadores / regresores (lineales o no lineales).