El método Extra-Tree (que representa los árboles abstractos) se propuso en [GEW06], con el objetivo principal de aleatorizar aún más la construcción de árboles en el contexto de las características de entrada numérica, donde la elección del punto de corte óptimo es responsable para una gran proporción de la varianza del árbol inducido.
Con respecto a los bosques aleatorios, el método deja caer la idea de usar copias de arranque de la muestra de aprendizaje y, en lugar de tratar de encontrar un punto de corte óptimo para cada una de las K características elegidas al azar en cada nodo, selecciona un punto de corte al azar.
Esta idea es bastante productiva en el contexto de muchos problemas caracterizados por una gran cantidad de características numéricas que varían más o menos continuamente: a menudo conduce a una mayor precisión gracias a su suavizado y al mismo tiempo reduce significativamente las cargas computacionales vinculadas a la determinación de la óptima puntos de corte en árboles estándar y en bosques aleatorios.
- ¿Cuáles son las aplicaciones en tiempo real del algoritmo de Dijkstra?
- ¿Es cierto que no debería importarme tanto aprender lenguajes de programación sino construir una gran base de estructuras de datos y algoritmos?
- Dados N cajas grandes y M cajas pequeñas de diferentes tamaños, ¿cómo elegir una caja grande óptima para empacar todas las cajas más pequeñas?
- ¿Por qué es imposible tener un tipo de comparación mejor que el tiempo O (nlogn)?
- ¿Por qué no usar Dijkstra o Bellman-Ford para encontrar el camino más corto entre dos personas en Facebook y por qué no usar BFS bidireccional en DVR o LSR?
Desde un punto de vista estadístico, abandonar la idea de arranque lleva a una ventaja en términos de sesgo, mientras que la aleatorización de punto de corte a menudo tiene un excelente efecto de reducción de varianza. Este método ha arrojado resultados de vanguardia en varios problemas complejos de alta dimensión.
Desde un punto de vista funcional, el método Extra-Tree produce aproximaciones multilineales por partes, en lugar de las constantes por partes de bosques aleatorios [GEW06].
[GEW06] – Árboles extremadamente aleatorios – Geurts Pierre