¿Cuáles son los mejores libros sobre estadísticas para la ciencia de datos?

Hay muchos buenos libros sobre estadísticas, pero si está buscando libros sobre estadísticas que sean buenos para la ciencia de datos, le recomiendo buscar libros que se relacionen con algún tipo de componente de programación. Estos dos son gratis y son geniales:

  • Piense en las estadísticas del profesor Allen Downey (http://greenteapress.com/thinkst…) Estos le guían a través de todos los conceptos de estadísticas básicas, incluidas las pruebas de hipótesis, e incluyen ejemplos y código en Python.
  • Una introducción al aprendizaje estadístico ( http://www-bcf.usc.edu/~gareth/I… ). Este libro lo guía a través de varias formas de aprendizaje estadístico, incluyendo regresiones, clasificaciones y más. Este libro incluye aplicaciones en R.

Think Stats es un buen libro básico y Introducción al aprendizaje estadístico es una buena introducción al modelado estadístico y el aprendizaje automático. Si está interesado en más libros gratuitos de los mismos autores, Allen Downey también tiene Think Bayes y también puede consultar los Elementos originales de aprendizaje estadístico.

Tengo una respuesta más completa en ¿Cuáles son los mejores libros sobre ciencia de datos?

Personalmente, no he aprendido tanto de videos y tutoriales en línea tanto como he aprendido de los libros. Hasta este mismo momento, mi pequeño estante de madera tiene suficientes libros para mantenerme ocupado este invierno.

¡18 nuevos libros para científicos de datos, aprendizaje automático, sobre R y Python deben leer!

Comprender el aprendizaje automático y la ciencia de datos es fácil. Existen numerosos cursos abiertos que puede tomar ahora mismo y comenzar. Pero, adquirir un conocimiento profundo de un tema requiere un esfuerzo extra. Por ejemplo: es posible que comprenda rápidamente cómo funciona un bosque aleatorio, pero comprender la lógica detrás de su funcionamiento requeriría esfuerzos adicionales.

Aquí hay una lista de libros sobre aprendizaje automático / ciencia de datos en R y Python que he encontrado en el último año. Dado que leer es un buen hábito, con esta publicación, quiero pasarle este hábito. Para cada libro, he escrito un resumen para ayudarlo a juzgar su relevancia. ¡Feliz lectura!

Divulgación: los enlaces de Amazon en este artículo son enlaces de afiliados. Si compra un libro a través de este enlace, nos pagarían a través de Amazon. Esta es una de las formas en que podemos cubrir nuestros costos mientras continuamos creando estos increíbles artículos. Además, la lista refleja nuestra recomendación basada en el contenido del libro y no está influenciada de ninguna manera por la comisión.

R para ciencia de datos

Programación práctica con R

Este libro está escrito por Garrett Grolemund. Es más adecuado para las personas nuevas en R. Aprender a escribir funciones y bucles le permite hacer mucho más en R, que simplemente hacer malabares con los paquetes. La gente piensa que los paquetes R pueden permitirles evitar escribir funciones y bucles, pero no es un enfoque sostenible. Este libro le presenta los detalles del entorno de programación R utilizando proyectos interesantes como dados ponderados, naipes, máquinas tragamonedas, etc. El lenguaje del libro es simple de entender y los ejemplos pueden reproducirse fácilmente.

R para todos: análisis y gráficos avanzados

Este libro está escrito por Jared P. Lander. Es un libro decente que cubre todos los aspectos de la ciencia de datos, como la visualización de datos, la manipulación de datos, el modelado predictivo, pero no con tanta profundidad. Puedes entenderlo, ya que cubre una gran cantidad de temas y se pierde detalles de cada uno. Precisamente, hace hincapié en los criterios de uso de algoritmos y en un ejemplo, cada uno de los cuales muestra su implementación en R. Estos libros deberían ser presentados por personas que estén más inclinadas a comprender el lado práctico de los algoritmos.

Esta es realmente una función de dónde estás y qué quieres hacer. Por ejemplo, Introducción al aprendizaje estadístico y su hermano mayor, Los elementos del aprendizaje estadístico, son bastante matemáticos y conceptuales (los primeros menos). Además, si prefiere el punto de vista bayesiano (personalmente, debe aprender ambas vistas y usarlas según corresponda), no son realmente el lugar para aprender tales métodos.

Si es un principiante, comience con cálculo, álgebra lineal y probabilidad antes de abordar las estadísticas. Si conoce todo eso, bueno, investigue en algunos dominios que le gusten y vea lo que podría ser útil. Es mucho más rápido apuntar a ti mismo una vez que sabes a dónde vas. Si bien siempre recomiendo aprender todo lo que pueda sobre cómo resolver un problema determinado, también es muy importante salir y comenzar a resolver problemas.

Yo recomendaría (nivel principiante a intermedio)

  1. Estadísticas empresariales de Aczel
  2. Abrir el libro electrónico de estadísticas de introducción (versión gratuita)

OpenIntro

  1. Libro electrónico de estadísticas de nivel avanzado: los elementos del aprendizaje estadístico

minería de datos, inferencia y predicción. 2da edición.

Data Science es la recopilación de datos, presentación y organización de los datos. El análisis de datos requirió probabilidades y luego también requirió estadísticas. Discutiré directamente los libros de ciencia de datos que también están relacionados con las estadísticas.

1. Estadísticas prácticas para científicos de datos por Andrew Bruce

2. Inferencia estadística de la edad de la computadora por Bradley Efron, Trevor Hastie

3. Métodos estadísticos avanzados en ciencia de datos por Chen, D.-G., Chen, J., Lu, X., Yi, G., Yu, H. (Eds.)

4.Todas las estadísticas de Larry A. Wasserman

Para obtener más información: BEPEC | ¿Por qué ciencia de datos? Bangalore

Cuando esté aprendiendo estadísticas para la ciencia de datos, enfatizaría que es importante no solo repasar la teoría sino también aplicarla con el lenguaje de programación con el que va a trabajar.

Específicamente para Python, hay un par de libros adicionales que puedo recomendar:

  • Estadísticas computacionales en Python
  • Una introducción a las estadísticas con Python: con aplicaciones en las ciencias de la vida (estadísticas y computación): 9783319283159: Medicine & Health Science Books @ Amazon.com
  • Inferencia estadística para todos (sie)

Más que eso, recomendaría que eche un vistazo a más de 40 estadísticas de Python para recursos de ciencia de datos para obtener tutoriales adicionales, videos, … para apoyar su aprendizaje.

Si va a trabajar con R, le recomiendo OpenIntro: encontrará tres libros de texto, videos y laboratorios de práctica gratuitos que lo ayudarán enormemente. Además, eche un vistazo a estos cursos (gratuitos) que lo hacen aprender estadísticas con R: Análisis de datos e inferencia estadística, Principios de Bayes en R, Modelado estadístico en R (Parte 1) y toda una pista de estadísticas con R: Estadísticas con R Track El | DataCamp.

Hay muchos libros sobre estadísticas. Sin embargo, si quieres un libro que

  • Puede ayudarlo a comprender a través de ejemplos / simulación
  • Muestra pasos de simulación
  • Le permite descargar datos para que pueda repetir la simulación por su cuenta
  • Explica tus conceptos a través de casos de estudio / historias antes de presentarte las jergas
  • Tiene buena cobertura de temas en un curso (no solo uno o dos temas)
  • No hace una gran abolladura en tu bolsillo, entonces

Debe consultar este video curso mencionado a continuación. Mire el plan de estudios para comprender la cobertura.

Estadísticas simplificadas por ejemplo para análisis / ciencia de datos

Hemos eliminado varias señales (por ejemplo, reseñas en línea, popularidad del autor en el campo, contenido, menciones en redes sociales, etc.) de la web para más de 50 libros de ciencia de datos. Después de alimentar todos esos puntos de datos a una función de clasificación, hemos creado una lista de los principales libros de ciencia de datos. Puede consultar el siguiente enlace para la lista:

Los 30 mejores libros de ciencia de datos

Personalmente me encantó openintro para las estadísticas. Es una lectura fácil y tiene todos los conceptos principales que tratamos a diario. El PDF también está disponible gratuitamente.

Para una comprensión intuitiva de los casos de uso de estadísticas: lea “Estadísticas desnudas”. Disfruté leyéndolo y encontré un nuevo amor por las estadísticas desde el den.

Este es el mejor libro que he leído sobre aprendizaje automático y ciencia de datos desde una perspectiva estadística. Gran lugar para comenzar.

http://statweb.stanford.edu/~tib

Los elementos del aprendizaje estadístico: minería de datos, inferencia, | Trevor Hastie | Saltador

Elementos de aprendizaje estadístico es una buena introducción desde una perspectiva estadística.

More Interesting

¿Cuál es, en su opinión, la mejor medida de disimilitud para el análisis de imágenes en otras áreas del análisis de datos topológicos?

¿Cómo pueden las técnicas de big data y los métodos estadísticos ayudar a un jugador de cricket a analizar sus datos históricos y mejorar su rendimiento?

¿Cuál es la diferencia entre big data y meta data?

¿Cuáles son los preparativos iniciales para unirse a un programa de ciencia de datos para una nueva?

Dada la opción entre probar el Residency Match o hacer un curso de 2 años en ciencia de datos, ¿cuál preferirías?

Cómo hacer análisis inteligentes en R o Python

¿Qué es exactamente la minería de datos y cómo la aprendo?

¿Qué clases debería tomar en Columbia si quiero ser un científico de datos?

¿Sería difícil hacer una aplicación que tome fotos de partituras y las reproduzca en el instrumento elegido?

¿Cuáles son las diferencias en una maestría en ingeniería eléctrica (procesamiento de señales / aprendizaje automático) y una maestría en informática (aprendizaje automático)?

En la era de Big Data, ¿cómo elegimos información efectiva?

¿Qué teorías y avances en ciencias sociales (econometría, etc.), biológicas y de otro tipo son útiles para conocer y solicitar un científico de datos?

Cómo elegir un algoritmo de minería de datos al minar un conjunto de datos real

¿Qué clases debo tomar en CMU si quiero ser un científico de datos?

Entre la criptografía y la seguridad de la red, el procesamiento de imágenes y la minería de datos, ¿qué 2 asignaturas son mejores como asignatura optativa?