¿Cuáles son las ventajas y desventajas de utilizar una combinación de impulso + árboles de decisión frente a algún otro enfoque en un problema de clasificación?

Los árboles de decisión impulsados por gradientes se encuentran entre los mejores métodos de aprendizaje supervisados disponibles en el mercado. Lograr una excelente precisión con solo modestos requisitos de memoria y tiempo de ejecución para realizar la predicción, una vez que el modelo ha sido entrenado.

Algunas de las principales aplicaciones comerciales del aprendizaje automático se han basado en árboles de decisión impulsados por gradientes.

Al igual que otros métodos de aprendizaje basados en el árbol de decisión, no es necesario aplicar el escalado de características para que el algoritmo funcione bien. Y los futuros pueden ser una mezcla de tipos binarios, categóricos y continuos.

Los árboles de decisión potenciados tienen varios inconvenientes. Entonces, como los bosques aleatorios, los conjuntos de árboles son muy difíciles de interpretar para las personas, en comparación con los árboles de decisión individuales. Sin embargo, esto a menudo puede no importar para muchas aplicaciones donde la precisión de la predicción es el objetivo más importante.

Los métodos potenciados por gradiente pueden requerir un ajuste cuidadoso de la tasa de aprendizaje y otros parámetros, y el proceso de capacitación puede requerir muchos cálculos.

Cuando el espacio destacado tiene miles de características con valores dispersos, generalmente no es una buena opción por razones de precisión y costo computacional.

Aprendizaje automáticoÁrboles de decisiónClasificaciónPros y contras

Related Content

¿Cómo afectaría la homo / heteroscedasticidad al análisis de regresión?

¿Cuál es la relación entre IA, aprendizaje automático y ciencias de la computación? ¿Hay especializaciones en IA o aprendizaje automático, o son especializaciones en informática?

¿Dónde estará (o podría) estar el Aprendizaje Profundo si la Ley de Moore continúa por otros 10-20 años?

¿Cuándo es un bosque aleatorio una mala elección en relación con otros algoritmos?

¿Cómo se puede utilizar el aprendizaje automático para mejorar el software de gestión de proyectos?

¿Por qué el impulso ayuda a entrenar una red neuronal?

¿Qué se necesitaría para escribir un algoritmo de inteligencia artificial que le dé a una máquina una oración verdadera?

Gradient Boosting Trees son muy buenos modelos. Según mi negocio y la experiencia de Kaggle, generalmente es difícil encontrar un solo clasificador que supere a los GBM.

Los inconvenientes son:
1) Más difícil de ajustar que otros modelos, porque tienes tantos hiperparámetros y puedes sobreajustarlos fácilmente.
2) Falta de interpretabilidad, en comparación con los clasificadores lineales. Todo lo que obtienes son estadísticas de “importancia variable”, pero no tienes una forma directa de estudiar cómo interactúan las variables y contribuyen a la predicción final.
3) No es muy rápido para entrenar o anotar.

Giuliano Janson

More Interesting

¿Qué es la regresión de Ridge en términos simples?

Para un problema de clasificación (dos clases), ¿es mejor usar dos salidas con softmax o una salida con entropía cruzada binaria?

¿Cuándo harán las máquinas la física y volverán a aprender las características de los datos de observación y luego reemplazarán aquellas como masa, giro, color o carga?

¿Qué compañías con sede en Dallas están desarrollando y / o invirtiendo en tecnologías de Inteligencia Artificial / Aprendizaje Automático?

¿Cuál es la diferencia entre ML y NLP?

¿Los humanos son actualizadores bayesianos?

¿Cuál es la diferencia entre minería de datos, aprendizaje automático y reconocimiento de patrones?

¿Puede word2vec considerarse aprendizaje profundo?

Cómo usar KNN para datos mixtos (categóricos y numéricos)

¿Qué es más robusto para datos ruidosos, un árbol de decisión o Naive Bayes?

¿Puedo usar algoritmos y bibliotecas ML para empresas?

Cómo predecir una variable de salida a partir de entradas dadas si la variable de salida y la variable de entrada se muestrean en diferentes intervalos de tiempo

¿Por qué utilizamos la política codiciosa de epsilon para la evaluación en el aprendizaje por refuerzo?

¿Cómo puedo comenzar a usar métodos de "generalización apilada" en Python para las competencias de Kaggle?

¿Cómo debo combinar la retroalimentación implícita y explícita en el filtrado colaborativo?

Web Analytics