¿Cómo debería un principiante aprender de un libro técnico que diga “Ciencia de datos desde cero”? ¿Debería completarlo una vez y luego volver a comprender temas complejos, o debería comprender profundamente cada tema antes de continuar y así retrasar la finalización?

Hola y gracias por la pregunta. ¡Este es bueno!

Permítanme comenzar diciendo que no he leído este libro en particular, así que pasé un tiempo revisando el contenido. Tal como lo veo, el libro tiene 3 segmentos principales: una porción de matemáticas y estadísticas, una porción de herramientas de codificación (principalmente python) y otra de teoría de ML (y su implementación).

Esta es una cobertura realmente enorme, y no sé qué tan bien lo han hecho. Dado que el paraguas que se lanza aquí es tan grande, te sugiero que vayas por la primera opción.

Comprenda que no existe un enfoque de aprendizaje “único para todos”. A algunas personas realmente les va bien cuando se toman el tiempo para digerir los conceptos, mientras que a otras les gusta ir de una manera más ágil, comenzando por obtener una visión general y luego gradualmente profundizando con el tiempo.

En el caso de este libro, propongo ir primero en amplitud porque si pasa tiempo asimilando completamente cada concepto, tomaría mucho tiempo. Además, y quizás lo más importante, es poco probable que cada concepto haya sido cubierto por completo en este libro (¿redes neuronales en 12 páginas?). Por lo tanto, pasar mucho tiempo en cada uno y esperar que lo haya “entendido todo” sería realmente una mala ilusión.

El estilo que funcionó para mí fue repasar los conceptos fundamentales y construir sobre ellos. Vengo de una formación en ingeniería, por lo que las partes matemáticas de la ciencia de datos no fueron un problema para mí. El libro principal que leí fue Introducción al aprendizaje estadístico en R y me puso en funcionamiento con la mayoría de los algoritmos comunes en ML. Sabía que no aprendí todo lo que había que aprender y que estaba bien. Comencé a avanzar y a aplicarlo para resolver problemas. De vez en cuando me topaba con un obstáculo y veía que me faltaba algo en mi comprensión de cómo funcionaban realmente las cosas, y luego leía una nueva fuente. Voy a ser sincero, todavía veo las conferencias CS229 de Andrew en mi tiempo libre a veces. Es básico de ML, pero de vez en cuando me doy cuenta de una idea que había pasado por alto anteriormente.

Construí sobre esta base con otros cursos y libros. Estudié las pruebas de hipótesis por separado e incluso hoy sigo leyendo más. Leo los sistemas de recomendación por separado y hoy diría que solo conozco los conceptos básicos de los recomendadores. Hice un recorrido completamente diferente de redes neuronales y aprendizaje profundo que aún está en progreso. A medida que se va añadiendo más conocimiento a los conceptos existentes, es hora de volver atrás y volver a pensar, repensar y aprender más. Esto simplemente no podría haberse hecho si dijera que voy a digerir algo completamente y solo luego seguiré adelante.

Supongo que esto podría ser cierto para cualquier campo que todavía se está desarrollando y tiene mucha actividad, pero también tiene una buena cuota de estilo personal y preferencia. Basándome solo en este libro, he dado mi recomendación: para un enfoque general de entrenamiento usted mismo puede ver lo que más le convenga.

El conocimiento técnico solo es útil cuando sabe dónde solicitarlo. La ciencia de datos es muy amplia. La forma más rápida de comprender y aprender conceptos es hacer preguntas prácticas reales (¿Qué? ¿Dónde? ¿Cómo? ¿Cuándo?).

Un novato necesita ser curioso. Hacer grandes preguntas sobre datos y mantenerlos en su mente durante la lectura y el estudio. Hará la vida más fácil. Repase toda la introducción de cada concepto y seleccione lo que él / ella piensa que será interesante y útil para responder a su pregunta antes de profundizar en los detalles.

More Interesting

¿Podrá Kaggle sobrevivir a la explosión en la industria del software de análisis?

Cómo aprender Tableau, de 0 a 10, en unos pocos meses.

¿Cuál es la diferencia entre ciencia de datos, análisis de datos, minería de datos, aprendizaje automático, inteligencia artificial y big data?

¿Cuál es la maldición de los grandes datos?

¿Qué clases de CS son las más importantes para un ingeniero de big data?

¿Cuáles son las diferencias entre el científico de datos, el ingeniero de datos y el ingeniero de aprendizaje automático?

¿Cómo debo diseñar mi curso en visión artificial / aprendizaje automático / robótica para mi maestría en EE?

¿Cómo impactan los informes de Big Data y Analytics en la productividad de una empresa?

¿Qué tan básicos son los datos en Uber?

¿Qué hace la combinación de datos y el software de análisis avanzado?

¿Qué aspectos del aprendizaje automático teórico y aplicado requieren una formación formal en qué subdisciplinas de las matemáticas y / o estadísticas?

¿Debo aprender conceptos de programación orientada a objetos en Python como científico de datos?

Después de realizar una validación cruzada K-fold en una entrada 7 * 98 con una salida de datos 1 * 98, ¿cómo selecciono los datos para el entrenamiento y las pruebas?

¿Cuáles son algunas ideas de proyectos de graduación en el campo del análisis de datos, en relación con la ingeniería industrial u otras especialidades de ingeniería?

Estoy trabajando en Business Intelligence de los últimos 5 años. ¿Es este el momento adecuado para actualizarme a la ciencia de datos y / o las tecnologías de big data?