MMDS se centra específicamente en los aspectos prácticos de la minería de conjuntos de datos muy grandes. El MOOC y el texto carecen de buenas explicaciones teóricas, pero son útiles para obtener una comprensión rápida de varios algoritmos y técnicas para manejar una gran variedad de tareas de minería, como la agrupación, el análisis en tiempo real y la reducción de mapas. Además, el libro es un poco difícil (opinión personal) de entender sin los videos MOOC que lo acompañan.
Por otro lado, el texto de Minería de datos de Han y Kamber es un curso casi completo en Minería de datos. Se recomienda en muchas universidades y tiene buenas explicaciones teóricas, así como ejemplos prácticos. Cubre más temas de minería de datos y ofrece una visión general completa del tema en sí.
Te sugiero que leas a Han y Kamber, y que estudies MMDS (con los videos MOOC) después. Probablemente esto te conducirá a una menor confusión al principio en mi humilde opinión. YMMV.
- ¿Cuáles son las mejores bibliotecas y paquetes de Python para la ciencia de datos?
- ¿El comercio de alta frecuencia y la ciencia de datos comparten muchas similitudes?
- ¿Qué tipo de datos predice con precisión el aprendizaje automático?
- ¿Hay algún beneficio al agregar las características originales junto con las reducidas por PCA?
- ¿Qué credencial de ciencia de datos es más valiosa, un certificado en línea de la escuela de extensión de Harvard o un MSC en línea del Data Science Tech Institute (París)?