En el algoritmo de bosque aleatorio, ¿por qué el árbol seleccionado al azar supera al árbol de decisión de mejor pensamiento?

Así no es como funciona un bosque aleatorio.

La idea de un bosque aleatorio no es recoger un árbol al azar, sino usar todos los árboles generados al azar al mismo tiempo.

Sabemos que algunos datos en el conjunto de capacitación son más importantes que otros datos en términos de poder predictivo, pero no sabemos cómo identificar esos registros. También sabemos que algunos atributos pueden tener más poder predictivo que otros, pero tampoco los conocemos.

En un bosque aleatorio, cada árbol utiliza un subconjunto diferente de datos y un conjunto diferente de atributos. La idea es que algunos de estos árboles serán “afortunados” y obtendrán buenas predicciones, mientras que otros árboles no funcionarán tan bien. Lo interesante es que todos juntos generalmente funcionan mejor que cualquier árbol aislado. La razón es que para que un solo árbol supere al conjunto, debe poder elegir perfectamente qué registros usar como conjunto de entrenamiento y qué atributos.

Se ha mencionado que un Bosque aleatorio también evita el sobreajuste, pero no creo que ese sea el espíritu de la pregunta, la respuesta simple a la pregunta es que “muchos árboles son mejores que solo uno a menos que tenga mucha suerte”.

No lo haría Incluso un bosque aleatorio no puede realizar un árbol “Oracle”.

Nadie dice que la aleatorización per se te da nada. La aleatorización ayuda a evitar el sobreajuste cuando no tienes suficientes datos de entrenamiento.

Entonces, si sabe cómo se generan los datos (o tiene conocimiento previo sobre los datos), entonces, por todos los medios, continúe y codifique ese conocimiento en un árbol de decisión hecho a mano. Dependiendo del problema, es posible que siempre obtenga una precisión del 100%.

Sin embargo, si está aprendiendo completamente de los datos y es una función complicada y, en consecuencia, no tiene suficientes datos de entrenamiento, entonces los conjuntos de árboles de decisión aleatorios funcionan bastante bien. Hay pruebas matemáticas que muestran los beneficios del embolsado.

Al aprender de los datos, si tiene toneladas de datos, por lo que esa variación no es un problema, podría valer la pena hacer una búsqueda exhaustiva, simultáneamente para la estructura de árbol y conjuntamente todos los nodos de decisión, si tiene suficiente recursos disponibles para construir un “árbol de decisión de mejor pensamiento”. Nadie se sorprenderá si dicho árbol supera (bosques de) árboles aleatorizados, es decir, aquellos que están optimizados con avidez para decisiones de nodo individuales. Pero hacer esa búsqueda (para aprender el árbol óptimo) es combinatoriamente costoso y se sale de control muy rápidamente, aún más en espacios de alta dimensión.

Los bosques aleatorios son un conjunto de árboles de clasificación individuales. Cada árbol da una clasificación, y decimos que el árbol “vota” para esa clase. El bosque elige la clasificación que tiene más votos (sobre todos los árboles en el bosque). Reduce la posibilidad de un ajuste excesivo. Con un solo árbol, podría ser propenso a un ajuste excesivo. No es universalmente cierto que los modelos de conjunto sean mejores que sus homólogos individuales. Solo funciona cuando los modelos individuales sufren de inestabilidad. Si todos los modelos individuales ya son estables, un modelo de bosque aleatorio puede reemplazarse fácilmente con un modelo único. Es aconsejable probar ambos en el conjunto de prueba. Verás victorias aleatorias de Bosques en la mayoría de los casos.

Eso no es lo que es el bosque al azar. Es un método de conjunto en el que los árboles se cultivan a partir de muestras de arranque de los datos. La diversidad de estas muestras da como resultado un sesgo y una varianza más bajos en todo el conjunto.

More Interesting

¿Cuál es la diferencia entre IIT y IIIT? Si estoy interesado en informática (programación, etc.), ¿en cuál debería estar interesado?

¿Es posible hackear los mercados financieros y eliminar la deuda estudiantil de todos?

¿Cuál es la verdadera definición de piratería?

¿Cuál es la mejor respuesta de columna o línea tabular que daría para diferenciar y explicar varias licencias de software?

Si el mundo tal como lo observamos fuera realmente una simulación interactiva (como se sugiere en ciertas películas de ciencia ficción), ¿qué tipo de potencia informática se necesitaría para ejecutarlo? ¿Cuánto poder dibujaría?

¿Cómo gestionar modelos de aprendizaje automático? ¿Cómo realiza un seguimiento de los modelos de aprendizaje automático mientras los itera? ¿Cómo se compara el rendimiento de diferentes modelos / conjuntos de datos? ¿Cuáles son algunos puntos débiles en su flujo de trabajo?

¿Cómo se distribuye internet?

Informática teórica: estadísticamente, ¿Harvard es el lugar más difícil para convertirse en estudiante de doctorado para estudiante de teoría de CS?

Si tengo una aplicación en la nube para resolver cualquier problema NP completo en P (N ^ 3). ¿Cuál es el tamaño del mercado para dicha aplicación y qué industrias estarán interesadas?

¿Cuáles son los problemas abiertos en el sistema de traducción basado en el aprendizaje automático?

¿Por qué existe la relación de aspecto 16: 9?

¿Cómo se estudia una asignatura como Física / Matemática / Informática (que es tan abstracta) y se desconecta del mundo y, sin embargo, se aplica para resolver (con éxito) problemas del mundo real? (Como Elon Musk, por ejemplo)

¿Cuál es el mejor dispositivo de almacenamiento inalámbrico portátil compatible con iOS, Android, Mac y PC?

¿Qué son las máquinas profundas de Boltzmann?

¿Ves inteligencia artificial siendo utilizada en una futura misión espacial por la NASA, SpaceX o un equivalente?