¿Cuál es el algoritmo de árboles extra en el aprendizaje automático?

El método Extra-Tree (que representa los árboles abstractos) se propuso en [GEW06], con el objetivo principal de aleatorizar aún más la construcción de árboles en el contexto de las características de entrada numérica, donde la elección del punto de corte óptimo es responsable para una gran proporción de la varianza del árbol inducido.

Con respecto a los bosques aleatorios, el método deja caer la idea de usar copias de arranque de la muestra de aprendizaje y, en lugar de tratar de encontrar un punto de corte óptimo para cada una de las K características elegidas al azar en cada nodo, selecciona un punto de corte al azar.

Esta idea es bastante productiva en el contexto de muchos problemas caracterizados por una gran cantidad de características numéricas que varían más o menos continuamente: a menudo conduce a una mayor precisión gracias a su suavizado y al mismo tiempo reduce significativamente las cargas computacionales vinculadas a la determinación de la óptima puntos de corte en árboles estándar y en bosques aleatorios.

Desde un punto de vista estadístico, abandonar la idea de arranque lleva a una ventaja en términos de sesgo, mientras que la aleatorización de punto de corte a menudo tiene un excelente efecto de reducción de varianza. Este método ha arrojado resultados de vanguardia en varios problemas complejos de alta dimensión.

Desde un punto de vista funcional, el método Extra-Tree produce aproximaciones multilineales por partes, en lugar de las constantes por partes de bosques aleatorios [GEW06].

[GEW06] – Árboles extremadamente aleatorios – Geurts Pierre

Related Content

¿Qué tipo de datos debo usar en C para almacenar datos como a1b2c3? ¿Podría usar una matriz de caracteres para almacenar esto como una cadena?

¿Cuáles son los algoritmos populares de aprendizaje automático en línea y sus casos de uso típicos?

¿Cuál es el mejor algoritmo para ocultar datos en texto?

¿Hay algún proceso o conjunto de preguntas que uno debería hacer al resolver problemas tácticos de ajedrez?

¿Cuál es el enfoque algorítmico para encontrar el primer entero positivo que falta si se proporciona una matriz entera sin clasificar en O (n) complejidad de tiempo y espacio constante?

¿Son las acusaciones suficiente causa probable para obtener una orden de arresto para redes sociales, proveedores de Internet, registros de teléfonos celulares o búsqueda de viviendas?

¿Cómo convertirse en un experto en ciencia de datos (aprendizaje automático) que tiene una idea básica de la programación C / C ++? ¿Cuáles son algunos cursos o libros disponibles gratis o baratos?

Supongo que te encontraste con esto en el contexto de scikit-learn, tal vez mientras buscabas bosques al azar.

Un clasificador de “árboles extra”, también conocido como clasificador de “árboles extremadamente aleatorios”, es una variante de un bosque aleatorio. A diferencia de un bosque aleatorio, en cada paso se usa la muestra completa y los límites de decisión se seleccionan al azar, en lugar del mejor. En casos del mundo real, el rendimiento es comparable a un bosque aleatorio ordinario, a veces un poco mejor.

En caso de que quiera aprender más, aquí hay un enlace al documento en el que se presentaron.

Piotr Płoński

Aquí tiene un documento http://citeseerx.ist.psu.edu/vie … El algoritmo ET es bastante similar al Bosque aleatorio, pero las divisiones se seleccionan al azar en lugar de utilizar algunos criterios. Son bastante poderosos. También están disponibles en la plataforma MLJAR para construir modelos de Machine Learning

Piotr Płoński

More Interesting

¿Cuáles son algunos buenos libros para aprender y practicar estructuras de datos y algoritmos?

Un hombre llega a su oficina en 2 horas y regresa en 3 horas. La ruta a su oficina incluye un sendero inclinado hacia arriba, 8 km y senderos inclinados hacia abajo. Cada vez que viaja hacia arriba, su velocidad es de 60 km / h, mientras que en un plano de 80 km / h, y cubre hacia abajo a una velocidad de 100 km / h. ¿A qué distancia está su oficina?

¿Cómo lidiar con la gestión eficiente de versiones y la compresión de múltiples versiones para bases de datos científicas?

¿Qué tipo de algoritmo SLAM utiliza Teslas? ¿O incluso están usando algoritmos SLAM?

¿Cómo debo tomar una entrada de orden 10 ^ 250 usando una matriz de caracteres en C?

¿Qué algoritmos usa Google en la geocodificación y búsqueda?

Cómo implementar el algoritmo de similitud de oraciones

¿Cómo se almacenan los datos en un árbol binario?

¿Abusaron los escritores de los límites de la ecuación 3.10 del CLRS?

¿Cuál es la forma correcta de escribir un algoritmo? ¿Podemos usar la sintaxis del lenguaje en el que estamos escribiendo?

¿Las secuencias y series son importantes para el aprendizaje de algoritmos?

¿Qué es un algoritmo recursivo (pseudocódigo) que calcula la suma de los primeros enteros positivos impares?

¿Qué patrones iterativos y recursivos se pueden expresar como O (1), O (log2n), O (n) u O (n2) en notación O grande?

¿Estamos utilizando los mismos algoritmos de inteligencia artificial de los años 90 con mejores procesadores?

¿Tengo que aprender estructuras de datos antes de aprender algún lenguaje de programación?

Web Analytics