Cuando un algoritmo de árbol de decisión se enfrenta a dos atributos que producen divisiones igualmente buenas en un árbol, ¿cómo eligen uno sobre otro?

Respuesta corta:

No habrá diferencia al seleccionar atributos con el mismo IG. rpart selecciona la primera y mejor columna variable en el marco / matriz de datos. Solo si algún atributo tiene una mejor ganancia de información, se guardará; de lo contrario, se mostrará la primera columna.

CARRITO: ¿Selección del mejor predictor para dividir cuando las ganancias en la disminución de impurezas son iguales?

Otros casos

Si se trata de un pequeño árbol de decisión, puede ver la ganancia de información después de la división de cada atributo (alogoritmo basado en anticipación), construir el árbol y, según su comprensión teórica de los datos, elija un atributo. De lo contrario, puede construir los dos árboles y hacer una prueba de validación.
Si se trata de una clasificación de texto, el árbol de decisión verificará el orden alfabético de los atributos. Por ejemplo, si Lovely = 0.5 y Ugly = 0.5, elegirá Lovely.
Como el paso 2 es costoso y generalmente usa el aprendizaje automático cuando no está seguro de la relación entre las variables, puede intentar usar otros modelos.
El algoritmo se detiene cuando la división no conduce a ninguna mejora en IG para todos los nodos.

AlgoritmosAprendizaje automáticoÁrboles de decisión

Related Content

¿Cuál es la mejor práctica y estructura de datos para la aplicación de autocompletado multilingüe?

Cómo implementar un algoritmo usando la recursividad para encontrar el módulo de esta serie

Cómo demostrar que el algoritmo de búsqueda uniforme de costos siempre genera una ruta óptima

¿Hay algún campo de arranque en EE. UU. Que se centre en C ++ y algoritmos?

¿Qué enunciado describe mejor por qué la notación Big-O es una forma muy útil de analizar la complejidad del algoritmo?

¿Puede algún cuerpo recomendarme una buena computadora?

¿Cuál es la mejor manera de aprender el comercio algorítmico en Python y probar modelos?

More Interesting

Cómo hacer un sistema de filtrado colaborativo con Django como back-end

Cómo mejorar mis estructuras de datos y algoritmo desde el nivel básico

¿Pueden los algoritmos de aprendizaje automático predecir el precio de las acciones en los mercados de valores?

¿Cuáles son algunos algoritmos inesperados que se usan en física y ciencia de materiales?

¿Cuál es el inverso matemático de 2 ^ N?

¿Qué es un algoritmo para generar todas las combinaciones posibles de un conjunto dado de letras (por ejemplo, 'a', 'b', 'c', 'd', 'e')?

¿Por qué usamos algoritmos genéticos?

Cómo reducir los componentes fuertemente conectados en nodos únicos de manera eficiente si estoy usando una representación de lista de adyacencia

¿Hay algún algoritmo fijo para resolver el cubo de Rubik? Si es así, ¿qué es?

¿Qué algoritmo en aprendizaje automático es el más adecuado para unir los datos entrantes nuevos con los datos existentes en la base de datos SQLite?

¿Qué plataforma / herramienta / idioma debería ser bueno para la minería de texto?

Cómo analizar la complejidad del tiempo de ejecución del algoritmo de búsqueda binaria recursiva

Cómo probar si un algoritmo es el mejor en complejidad de tiempo de ejecución para un problema dado

¿Cuál es un buen algoritmo para una tabla de clasificación rodante?

¿Qué opinas de una educación en informática donde el profesor de 'algoritmos y programación' ni siquiera sabe acerca de la notación Big O?

Web Analytics