O algo va mal con la forma en que usa la implementación (no estoy familiarizado con esa en particular), o puede haber otro problema.
Muchos algoritmos de aprendizaje de árboles son algoritmos miopes y codiciosos. Seleccionan un solo nodo que reduce más la función de error, y luego continúa este proceso en cada una de las hojas. Esto, por supuesto, supone que hay un solo nodo que puede reducir el costo en una cantidad mayor que algún umbral. Las pruebas estadísticas se utilizan para asegurarse de que esto no se deba solo a las estadísticas ( cualquier nodo reducirá el error en cierta medida, pero eso no es lo que queremos, queremos una reducción estadísticamente significativa).
Sin embargo, si ninguna prueba individual puede mejorar el resultado en una cantidad estadísticamente significativa, esto implica que existen fuertes interacciones entre las variables (lo que significa que necesita algún tipo de anticipación, seleccionando varios nodos al mismo tiempo). tiempo) o que el valor objetivo es inherentemente ruidoso, y los árboles de decisión podrían no ser el mejor modelo.
- ¿Podemos usar un algoritmo no supervisado para realizar análisis de sentimientos?
- ¿Los ingenieros de aprendizaje automático en Google tienden a publicar artículos?
- ¿Cuáles son los lenguajes de programación básicos para aprendizaje automático, inteligencia artificial y big data?
- ¿Puede el aprendizaje automático ayudar con la ciencia del clima?
- ¿Cuál es la mejor manera de aprender a usar LDA (asignación de dirichlet latente) con Python?
Primero, verifique la implementación y asegúrese de usarla correctamente. Luego, mire sus datos para ver si espera interacciones fuertes entre las variables y si puede usar algún tipo de anticipación.