¿Cuáles son algunos de los buenos libros sobre Algoritmos de aprendizaje automático de árbol de decisión?

Interesante ver tantas perspectivas diferentes. El libro de aprendizaje automático con árboles de decisión ha sido mi experiencia de que nunca podemos conocer realmente la realidad subyacente. ¿Cómo se puede saber si los límites de decisión son realmente paralelos en un espacio multidimensional? Puedo estar limitado en mi conocimiento cuando hago esta declaración.

Sigo un enfoque empírico. Ejecute varios tipos de modelos (debe tener una forma automatizada de hacer el trabajo duro como análisis bi-variado, tratamiento atípico, de lo contrario, las cosas pueden salirse de control) Elija el que funcione bien en un conjunto de datos de prueba. Incluso puede usar una combinación de los modelos en lugar de uno. Y sí, no olvide probar la salida de combinación en un conjunto de datos de prueba para ver que realmente funciona mejor que los modelos individuales.

El conjunto de datos de prueba no debería haberse utilizado en absoluto en el proceso de modelado. Todos los hiperparámetros, incluidos los pesos de diferentes modelos en el modelo de combinación, se establecerán en función de un conjunto de validación o validación cruzada.

Uno de los mejores libros es C4.5: Programas para el aprendizaje automático (serie Morgan Kaufmann en aprendizaje automático): J. Ross Quinlan

Ross escribió C4.5, que fue el primer algoritmo de creación de árbol de decisión muy popular. No solo explica la teoría de los árboles de decisión con todo detalle, sino que también incluye el código fuente y lo guía a través de cómo funciona.

Está increíblemente bien escrito y es uno de mis textos académicos favoritos.

Descargo de responsabilidad : trabajé un poco con Ross a fines de la década de 1990, por lo que quizás soy parcial. En ese momento, aunque era considerado como uno de los investigadores de aprendizaje automático más importantes del mundo.

Aunque aún no lo he leído, aquí hay uno que parece bastante prometedor según las reseñas:

https://www.amazon.com/Machine-L

More Interesting

¿Existe una estructura de datos ordenada que se pueda insertar en O (logn) y buscar en O (1)?

¿Cuáles son los factores que afectan la tasa de error en el algoritmo KNN?

¿En qué situaciones alguien usaría Dijkstra sin un montón sobre Dijkstra con un montón?

¿Existe un algoritmo ML para verificar qué tan bien coinciden 3 objetos de diferentes tipos?

¿Cómo dirigen los sistemas de guía del vehículo de lanzamiento la carga útil hacia órbitas tan precisas?

¿Qué es lo más importante para las empresas de software: código abierto, proyectos extracurriculares o habilidades algorítmicas (habilidades de programación competitiva)?

Suponiendo que todos estos algoritmos resuelven el mismo tipo de problema, ¿cuál se recomienda? ¿Y por qué?

¿Cómo funciona Git Merge?

¿Cómo creo más interés en la programación y soy un buen programador en algoritmos?

¿Es útil leer 5 o más libros para algoritmos, o debería leer solo uno o dos y usar los otros como referencia para algún algoritmo en particular?

¿Cómo un programa de razonamiento poco preciso asigna 8 gb de memoria en 3 segundos?

¿Qué temas de geometría y álgebra son importantes para concursos de programación como ICPC?

¿La programación genética y los algoritmos genéticos son iguales?

¿Cuáles son los mejores algoritmos de agrupamiento para puntos de datos numéricos multidimensionales?

¿Cómo podemos revertir una pila usando solo las operaciones push () y pop () sin usar ningún DS secundario?