Como un heurístico sí, es posible con pequeños trucos. Realice la importancia variable de xgboost, tome las variables con un peso mayor que 0, pero agregue las 10 interacciones de características principales como una característica y aplique la transformación logarítmica / winorización univariada si es necesario.
Respuesta larga: el autor de la pregunta quiere transferir los resultados de un xgboost al modelo de regresión, por ejemplo, red elástica. Por mucho que funcionó bien, al abordar tres diferencias principales de los algoritmos con pequeños trucos.
En primer lugar, Xgboost es un algoritmo basado en un árbol, por lo tanto, es inmune a la transformación lineal de las variables y absoluta, la regresión no lo es. Por lo tanto, aplique un análisis univariado o agrupamiento en las variables principales cuando el resultado de un método de regresión sea mucho peor.
- ¿Cómo pudo la policía de Arizona llegar a una conclusión tan rápida que el auto Uber que se volcó no fue el culpable?
- Cómo usar mel-spectrogram como entrada de una CNN
- ¿Cuál es la diferencia entre análisis de datos, ciencia de datos, big data y aprendizaje automático?
- ¿Cuáles son las mejores medidas al validar de forma cruzada un modelo para determinar qué tan bueno es el modelo y cómo funcionará en situaciones reales?
- Al predecir un resultado binario, ¿cómo toman en cuenta las personas el orden en que ocurren las entradas?
En segundo lugar, se sabe que Xgboost detecta interacciones de pozo y es robusto al problema de las variables correlacionadas, ya que para cada árbol las variables se retocan de una nueva manera. Los modelos de regresión manejan las interacciones de manera diferente. Aquí, agregar Interacciones de las 10 principales variables ayuda a menudo.
El último punto, empaquetar el Método de Regresión, por ejemplo, 30 veces, podría ayudar aún más si la Aplicación de los Primeros 2 trucos no fue capaz de eliminar la Brecha entre los dos métodos.