Quiero ser exhaustivo con programación y estadísticas en profundidad en poco tiempo. ¿Qué tengo que hacer? ¿Cuáles son algunos buenos libros para principiantes / intermedios?

De su pregunta, tengo la sensación de que se está centrando principalmente en la parte de programación de Data Science. Eso tiene sentido si aspira a ser un analista de datos lo suficientemente bueno en el futuro.

Sin embargo, si desea ser un analista de datos de primer nivel y convertirse en un científico de datos, también debe poder relacionar el lado comercial del análisis de datos con los aspectos tecnológicos. Por lo tanto, esta es mi recomendación de la mejor ruta más corta que puede tomar, con las 3 mejores fuentes que he usado para aprender Data Science:

  1. Data Science for Business : un libro extraordinario con aplicaciones prácticas de negocios de varios tipos de problemas resueltos con Data Science. También le dará un buen control sobre conceptos clave como sobreajuste, validación cruzada, sesgos, evaluación y selección de modelos, con aplicaciones de la vida real para agregar a su armamento de ciencia de datos.
  2. Introducción en profundidad al aprendizaje automático en 15 horas : este es un conjunto de videos de tamaño de un bocado en Estadísticas y ML. Lo que me encantó de esta colección es que puedes aprender estas cosas directamente de los expertos de Stanford que han creado algunos de estos algoritmos. ¡Qué asombroso es eso! Sin embargo, el contenido aquí es matemáticamente denso, así que siéntase libre de saltar de un lado a otro para obtener los conceptos correctos. También un montón de ejercicios en R hacia el final de cada lección te ayudarán a perfeccionar tus habilidades de programación en R
  3. Introducción al aprendizaje automático de Udacity : este es un curso divertido que me ayudó a aprender Python junto con los conceptos de aprendizaje automático. Se familiarizará con scikit learn, que es la base de ML en Python. Y los ejercicios de ejemplo como el reconocimiento facial con PCA y el clasificador de detección de fraude Enron son súper geniales. El curso ha cambiado un poco desde la última vez que lo tomé, aunque estoy seguro de que lo han mejorado.

Cada uno de estos le ayudará a atacar ML y estadísticas desde diferentes ángulos, triangular conceptos y ayudar a construir una comprensión multifacética para este campo.

¡Y así es como puedes aprender programación, estadísticas y aprendizaje automático mejor en el menor tiempo!

En profundidad y poco tiempo hay dos extremos que rara vez se cumplen, especialmente en el campo cada vez mayor de la ciencia de datos. Creo que está buscando cursos más rigurosos en estadísticas y aprendizaje automático que también tienen tareas de programación.
Puede consultar la última oferta de MITx (edx) sobre probabilidad e inferencia computacional. Tiene muchos proyectos de codificación en modelos gráficos y otras cosas divertidas.
Podrá escribir código para sistemas de recomendación, detección de spam, etc.
Es un curso de 03 meses y no trivial a tu nivel.
Que te diviertas.

More Interesting

¿Cuáles son algunas de las buenas certificaciones de Big Data para principiantes que desean desarrollar una carrera en Big Data?

¿Cuánto tiempo debe ejecutar una prueba A / B en su sitio antes de declarar a uno ganador?

¿Cuál es su experiencia con el programa inmersivo de ciencia de datos de la Asamblea General?

¿Qué es una aplicación de aprendizaje automático y cómo se usa, que no es una de las siguientes: redes sociales, motores de búsqueda, bioinformática, neurociencia, investigación en el CERN, ciencia actuarial y sistemas de recomendación?

Si me gradúo en 1-1 1/2 años con un programa de doctorado en economía, ¿cómo me preparo para un trabajo de ciencia de datos?

¿Cómo afecta la automatización al análisis de datos?

Cómo empezar si quiero aprender ciencia de datos como un nuevo aprendiz

¿Qué se necesita para clasificar dentro del # 10 en Kaggle? ¿Cuál es el camino de aprendizaje ideal para un principiante en ciencia de datos? ¿Qué todas las tecnologías y habilidades necesita adquirir y en qué orden? ¿Cuánto tiempo se tarda?

¿Es la ciencia de datos realmente una carrera en ascenso?

¿Cuáles son las diferencias entre la base de datos y la estructura de datos? ¿Cuándo usamos cada uno?

Para la validación cruzada K-fold, ¿qué k se debe seleccionar?

¿Los gráficos circulares merecen su reputación actual como malas visualizaciones?

¿Cómo se recomiendan elementos basados ​​en el historial de navegación (y elementos y características del usuario) cuando no hay ejemplos o calificaciones 'negativas'?

Al seguir una carrera en ciencia de datos, ¿un doctorado en economía sería más beneficioso que una maestría en ciencia de datos?

¿Cuánto tiempo puede un principiante aprender ciencia de datos?