¿Cuándo es preferible usar árboles de regresión en el aprendizaje automático?

Si tiene un modelo realmente bueno de un sistema, uno donde hay muy poca área gris, y ha confirmado que los resultados de la predicción son claramente jerárquicos, entonces los árboles de decisión pueden funcionar realmente bien.

Un ejemplo trivial:

Caso trivial

Consdier estaba analizando los patrones de conducción de seres humanos desde el espacio exterior e intentando predecir cuántas veces al año pasan por una intersección de calles sin detenerse. Podrías notar que, si un humano está en una intersección, hay dos tipos de autos, autos de policía y autos civiles.

No importa el automóvil, una luz verde siempre predice que un automóvil se irá.
No importa el automóvil, una luz roja predice que se detendrá.
A menos que sea un auto de policía, en cuyo caso, no se puede predecir, porque los policías a veces pueden pasar las luces rojas si se dedican a la persecución.

Caso no trivial

En un caso más trivial, puede comenzar con un árbol de regresión simple para una aplicación, con la intención de evolucionarlo hacia un modelo más avanzado (es decir, un bosque de decisión) más adelante. Los bosques de decisión son una forma de combinar varios modelos simples en uno más sofisticado. Por ejemplo, después de observar muchos casos, puede encontrar que el 10% del tiempo, ciertos controladores pasarán una luz roja. Un bosque de decisión puede incluir muchos árboles, algunos de los cuales expresan ese patrón. Sin embargo, inicialmente puede implementar su algoritmo en una aplicación como un algoritmo de árbol de decisión, con el entendimiento de que eventualmente contratará a un científico de datos para implementar un proceso de decisión más sofisticado más adelante.