¿Es posible hacer una selección de características para las tareas de regresión por XGBoost?

Como un heurístico sí, es posible con pequeños trucos. Realice la importancia variable de xgboost, tome las variables con un peso mayor que 0, pero agregue las 10 interacciones de características principales como una característica y aplique la transformación logarítmica / winorización univariada si es necesario.

Respuesta larga: el autor de la pregunta quiere transferir los resultados de un xgboost al modelo de regresión, por ejemplo, red elástica. Por mucho que funcionó bien, al abordar tres diferencias principales de los algoritmos con pequeños trucos.

En primer lugar, Xgboost es un algoritmo basado en un árbol, por lo tanto, es inmune a la transformación lineal de las variables y absoluta, la regresión no lo es. Por lo tanto, aplique un análisis univariado o agrupamiento en las variables principales cuando el resultado de un método de regresión sea mucho peor.

En segundo lugar, se sabe que Xgboost detecta interacciones de pozo y es robusto al problema de las variables correlacionadas, ya que para cada árbol las variables se retocan de una nueva manera. Los modelos de regresión manejan las interacciones de manera diferente. Aquí, agregar Interacciones de las 10 principales variables ayuda a menudo.

El último punto, empaquetar el Método de Regresión, por ejemplo, 30 veces, podría ayudar aún más si la Aplicación de los Primeros 2 trucos no fue capaz de eliminar la Brecha entre los dos métodos.

Finalmente obtuve el puntaje de las características de regresión de la siguiente manera:

model.booster (). get_score (importancia_tipo = ‘peso’)

podemos trazar sus resultados usando:

plot_importance (modelo)

More Interesting

¿Qué puede ayudar a averiguar si una función de pérdida es sensible al ruido o no?

¿Qué es el aprendizaje automático y cuál es su futuro?

¿Cuáles fueron los 10 problemas principales en Machine Learning para 2013?

¿Cómo debería abordar el problema de segmentar el césped de una imagen?

¿Qué criterios deberían ser apropiados para terminar el entrenamiento codicioso no supervisado de autoencoder por capas?

¿Debería considerarse un experto en aprendizaje automático después de completar la clase de ML del profesor Andrew en Coursera?

¿Se utilizan algoritmos básicos de CS en el aprendizaje automático?

¿Hay abandonos universitarios que trabajan como científicos de datos o especialistas en aprendizaje automático?

¿Existe una definición matemática para una máquina de vectores de soporte?

¿Cuál es el enfoque más eficiente para los sistemas de recomendación?

¿Cuántas de las noticias sobre IA y DL en este momento son sobre nuevas innovaciones y cuánto sobre aplicaciones? ¿Cuánto de eso es bombo? ¿Habrá una meseta pronto?

¿Existe alguna directriz para diseñar redes neuronales en términos de número de capas ocultas, número de unidades ocultas, tamaño de filtro (CNN) y paso de tiempo (RNN)?

¿Cuáles son algunos de los usos del aprendizaje automático en los motores de búsqueda?

¿De dónde obtienen los sistemas de conducción autónomos sus datos de entrenamiento?

¿Es necesario un MS o PhD en Machine Learning para trabajar en este campo en alguna empresa?