Supongamos que quiere saber si mañana será soleado, lluvioso o nublado en función de varias mediciones del día anterior, como temperatura, punto de rocío, nubosidad, humedad, etc.
Imagine que tiene muchas medidas, digamos 50.
Desea crear un árbol de decisión para decidir el pronóstico del tiempo, por ejemplo, si la temperatura del día anterior> 60 y la capa de nubes <20%, entonces soleado.
Pero no sabes qué funciones usar, tienes muchas.
- ¿Qué es un programa Java bueno y simple para ordenar números en orden ascendente?
- ¿Cuál es la altura, el tamaño y la profundidad de un árbol binario?
- El algoritmo de primer ajuste sin clasificar por problema de embalaje de la papelera se considera no solución. ¿Cuándo es útil este algoritmo?
- ¿Has visto algún trabajo hacia el cierre transitivo de la alineación de secuencias y las matrices de sustitución?
- ¿Qué estructuras de datos usa MS Word para almacenar elementos del documento en la memoria?
Por lo tanto, toma un conjunto aleatorio de medidas y una muestra aleatoria de su conjunto de entrenamiento (días con mediciones y perspectivas climáticas conocidas) y construye un árbol de decisión. Luego, hace lo mismo muchas veces utilizando un conjunto aleatorio diferente de mediciones y una muestra aleatoria de datos cada vez.
Al final, tiene muchos árboles de decisión, utiliza cada uno de ellos para pronosticar el clima y luego decide el pronóstico final en función de una mayoría simple.
Espero que esta analogía sea clara de entender, tenga en cuenta los errores tipográficos ya que estoy en un teléfono.