El material recomendado depende de su definición de minería de datos. La minería de datos, el análisis de datos y la ciencia de datos a menudo son términos confusos. La minería de datos en sí tiene dos definiciones.
Primero, muchas personas interpretan que la minería de datos se centra exclusivamente en la recuperación, limpieza, formateo y preparación de datos para el modelado. Esto implicaría que el minero de datos pasaría su tiempo en la base de datos relacional o en un entorno sin SQL extrayendo toneladas de datos. Esta definición es incompleta de lo que se supone que es la minería de datos.
En segundo lugar, la minería de datos realmente tiene como objetivo centrarse en descubrir patrones en los datos mediante el uso de una combinación de aprendizaje automático, estadísticas e inteligencia artificial (minería de datos – Wikipedia). Esta definición es muy similar a la de un científico de datos con menos énfasis en el desarrollo y programación de productos. Cuando se trata de esto, la minería de datos y la ciencia de datos están estrechamente relacionados, si no son sinónimos.
- ¿La ciencia de datos requiere más competencias que la ingeniería de software?
- ¿Cuáles son las predicciones de resultados de las elecciones UP 2017 según el estudio de la ciencia de datos o el modelo de análisis predictivo?
- Cómo engañar a los algoritmos de 'Big Data' para evitar el perfil y la orientación precisos de mí mismo
- Para los científicos de datos, ¿qué lenguaje es más exigente, R o Python?
- ¿En qué se diferencia el desarrollo de software de aprendizaje automático industrial orientado a productos de la investigación académica de aprendizaje automático o el desarrollo de prototipos de investigación industrial?
Suponiendo que está buscando recursos para la segunda definición aquí (estrechamente relacionada con la ciencia de datos), puedo recomendarle recursos de O’Reilly Media: libros de tecnología, conferencias tecnológicas, cursos de TI, noticias. Estas son mis referencias a referencias. Estos son los temas en los que recomendaría encontrar escritos:
- Ciencia de datos / minería de datos en general: los ejemplos incluyen “Dominar la minería de datos en Python” de Megan Squire, “Aprender la minería de datos con R” de Bater Makhabel, “Dominar la pitón para la ciencia de datos” de Samir Madhavan. Hay muchas opciones. Tiendo a preferir escritos que explican conceptos en mi lenguaje de programación de elección. Estos escritos tienen muchos ejemplos con los que puede trabajar.
- Aprendizaje automático: los ejemplos incluyen “Aprendizaje automático de Python” de Sebastian Raschka y “Aprendizaje automático de R” de Brent Lantz, “Elementos de aprendizaje estadístico” de Hastie, Tibshirani y Friedman (siempre hago referencia a este texto). Desea algunos libros específicos de aprendizaje automático para ayudar con este tema.
- Texto de estadísticas: un buen ejemplo es “Modelos lineales con R” de Julian Faraway.
¡Estos temas le darán un buen punto de partida para expandir su conocimiento de minería de datos y ciencia de datos! ¡Este debe ser un punto de partida y de ninguna manera completo!
¡También ofrecemos contenido sobre ciencia de datos y estamos trabajando para expandir nuestro contenido rápidamente a través de publicaciones de blog, seminarios web, libros electrónicos y seminarios! ¡Visite nuestro sitio web en Bienvenido e inscríbase en nuestra lista de correo para mantenerse actualizado sobre lo que estamos haciendo y cuándo agregamos contenido nuevo!