¿Tiene sentido usar la selección de características antes de Random Forest?

Tiene sentido si el tamaño de su función es lo suficientemente grande. Si tiene tantas funciones, siempre debe optar por un método de selección de funciones sin supervisión y ver qué cambios ofrece.

Sin embargo, Random Forest es un algoritmo muy poderoso cuando se usa con hiper-parametrización adecuada (optimizando tanto el número de tress como el número de características en cada nodo). Además, es propenso a un ajuste excesivo, a diferencia de los algoritmos de aumento de gradiente. Entonces, ten cuidado con eso.

Si usa el método de búsqueda de cuadrícula y el tamaño de su función no es tan grande, la selección de funciones no es necesaria, en mi opinión. Seleccionará automáticamente las mejores características en cada nodo de los árboles de conjunto.

Pero, sugeriría experimentar con diferentes cosas y ver qué sucede usted mismo. Así es como realmente obtienes el mejor modelo.

Aprendizaje automáticoautomáticoBosques aleatoriosClasificación de

Related Content

¿Existe un sistema de IA más eficiente que el Watson de IBM?

Si, en el futuro, los robots / IA se vuelven comunes en los hogares, ¿cuál es el lenguaje de programación más probable en el que se escribirán?

¿Por qué son importantes las redes de confrontación generativas?

¿Qué es el aprendizaje profundo en los puntos de vista sociológicos?

¿Debo comenzar a aprender Python y el aprendizaje automático al mismo tiempo?

¿Por qué se usan CNN para PNL?

¿Cuál es la diferencia entre los sitios web de WordPress y el sitio web normal?

Depende de la cantidad de predictores. Si hay muchas características que pueden presentar problemas computacionales, definitivamente use la selección de características; si no, probablemente estés bien como está. Un ejemplo común es usar PLINK para encontrar genes importantes en un estudio de asociación de todo el genoma, luego ingresarlos en un modelo de bosque aleatorio.

Tengo una descripción general aquí: https://www.slideshare.net/Colle …

Colleen Farrelly

Si tiene muchas características, ¿por qué no?

Tan rápido como entrenarán los Bosques Aleatorios, siguen siendo lentos si tienes unas 6000 características y 100000 ejemplos (números elegidos arbitrariamente).

Colleen Farrelly

Siempre puede modelar antes y después de la selección de características y comparar.

Colleen Farrelly

More Interesting

¿Cómo identificar el contexto basado en la oración?

¿Cómo difiere un sistema de clasificación artificial de una clasificación de sistema natural?

¿Alguien puede proporcionar ejemplos sobre cómo usar la biblioteca Shogun para modelos de Markov ocultos?

¿Será posible usar una red neuronal para determinar si algo está en el Valle Uncanny?

¿Qué es el procesamiento del lenguaje natural en términos simples?

¿Cómo puede un estudiante graduado de primer año en ciencias de la computación encontrar un trabajo en minería y análisis de datos después de graduarse?

¿Cuáles son las desventajas de usar un árbol de decisión para la clasificación?

¿Cuál es la posibilidad de que un humano gane el juego de entropía?

¿Cuál es un resumen del trabajo de Jordan Boyd-Graber sobre la Respuesta incremental interactiva a preguntas que le valió el Premio a la Demostración Excepcional de NIPS?

Cómo elegir un tema de tesis doctoral en aprendizaje profundo

¿La topografía emocional es relevante para IR?

Si no tengo experiencia en aprendizaje automático o investigación computacional, pero tengo antecedentes estadísticos, ¿es posible hacer investigación en esta área en la escuela de posgrado o hacer una pasantía?

¿Qué opinas del TensorFlow Eager en comparación con Pytorch?

Cómo implementar Inteligencia Artificial en un Proyecto Arduino

¿Cómo agrega Quora el aprendizaje automático a su aplicación web?

Web Analytics