¿Cómo funciona el refuerzo con los algoritmos de clasificación del árbol de decisión?

Hay dos formas de hacerlo con los árboles de decisión, una que requiere modificaciones en el algoritmo del árbol de decisión y otra que no. Ambos se basan en el hecho de que uno de los resultados del aumento es un nuevo peso para cada instancia, con las instancias de entrenamiento que se clasificaron incorrectamente en peso y todas las demás disminuyeron en peso. Entonces, por ejemplo, podría terminar con una instancia con un peso de 1.8 y otra con un peso de 0.7.

Reponderación

En este enfoque, modifica sus criterios de ganancia de información (o índice de ganancia o coeficiente de Gini o cualquiera que sea su criterio de división favorito) para incluir los pesos de la instancia en el cálculo. Esto suele ser relativamente, ya que volver a pesar para un peso, digamos, es esencialmente lo mismo que tener w copias de la misma instancia (aunque no puede tener 1.8 copias, las matemáticas no se preocupan por copias parciales).

Remuestreo

Si su algoritmo es un cuadro negro, entonces muestra aleatoriamente con reemplazo basado en los pesos. Luego se introduce esto en el clasificador del árbol de decisión. Entonces, por ejemplo, la instancia con un peso de 1.8 es 1.8 / 0.7 = 2.6 veces más probable que se incluya en el conjunto de entrenamiento que le da al clasificador para construir el siguiente nivel.

En general, se prefiere volver a pesar, porque tiene una varianza más baja.

More Interesting

¿Cuáles son algunos buenos proyectos de aprendizaje automático que implican el uso de estructuras de datos y tienen aplicaciones de la vida real y se pueden hacer en 2-3 semanas?

¿Se puede usar un C ++ para el aprendizaje automático? Si es así, ¿qué tan bueno es en comparación con Python y R?

¿Qué hace que una red neuronal convolucional sea excelente?

¿Existe una relación entre el aprendizaje automático y los procesos estocásticos?

¿Hay alguna API basada en la nube para agrupar Tweets?

¿Cuáles son algunos marcos de tiempo realistas para dominar diversas habilidades de programación, como el dominio de Python para la ciencia de datos, git, etc.?

¿Cuál es el significado de la optimización convexa en el aprendizaje automático?

Cómo estructurar sus proyectos de aprendizaje automático

¿La validación cruzada más pequeña siempre es un indicador de un mejor modelo predictivo incluso si un modelo predictivo tiene una gran cantidad de parámetros?

¿Cuál es el propósito de usar un parámetro de penalización [matemática] C [/ matemática] en SVM?

¿Cuáles son las habilidades requeridas para un ingeniero de aprendizaje automático / aprendizaje profundo de nivel básico?

¿Cuál es la diferencia entre lógica difusa y aprendizaje automático?

Cómo hacer clustering de tipos de datos mixtos en Python

¿Cómo manejo tanto la programación como la investigación en el área de redes neuronales y redes neuronales profundas?

¿Cómo cambiará el aprendizaje automático la sociología?