Interpretación: Los árboles de decisión nunca le darán la respuesta correcta, le darán muchas respuestas posibles. Cambie el nodo raíz del árbol para comenzar con una variable diferente y probablemente obtendrá un árbol diferente. ¿Cuál es el correcto?
Importancia: Cambie el nivel de significancia (aunque sea un poco), o el tamaño de los contenedores y obtendrá diferentes árboles. Cambia la semilla aleatoria y también cambia. Repita el proceso para otra muestra (o incluso submuestra) y obtendrá otro árbol. ¡Haz suficientes permutaciones por tu cuenta y obtendrás el árbol que deseas!
Comparaciones múltiples: los algoritmos de árbol generalmente usan la prueba de chi-cuadrado para determinar la importancia de cualquier división en particular. Pero incluso antes de que se haya determinado eso, el algoritmo ha intentado muchas combinaciones de variables para obtener la “mejor” división. Eso, junto con un árbol con muchos niveles y ramas puede conducir a un resultado demasiado optimizado, o muchos falsos positivos debido a la comparación múltiple:
- ¿Cómo 'Diagonal BiLSTM' calcula los estados diagonales a la vez y qué es diagonal?
- ¿Cuál es la diferencia entre el análisis factorial y las técnicas de selección de características, como el análisis de componentes principales y la asignación de dirichlet latente?
- ¿A qué se refiere el concepto de sesgo de presentación-retroalimentación en el contexto del aprendizaje automático?
- Soy Editor de Adquisiciones y para obtener conocimiento y autoaprendizaje de análisis de datos y habilidades de aprendizaje automático. ¿Alguien podría ayudarme a trazar un plan?
- ¿Son el aprendizaje automático / aprendizaje profundo / ciencia de datos, realmente ciencia espacial para que un tipo promedio entienda e implemente?
http://en.wikipedia.org/wiki/Mul…