¿Cómo debería un principiante aprender de un libro técnico que diga “Ciencia de datos desde cero”? ¿Debería completarlo una vez y luego volver a comprender temas complejos, o debería comprender profundamente cada tema antes de continuar y así retrasar la finalización? La tecnología cambia la vida futura

¿Cómo debería un principiante aprender de un libro técnico que diga “Ciencia de datos desde cero”? ¿Debería completarlo una vez y luego volver a comprender temas complejos, o debería comprender profundamente cada tema antes de continuar y así retrasar la finalización?

Hola y gracias por la pregunta. ¡Este es bueno!

Permítanme comenzar diciendo que no he leído este libro en particular, así que pasé un tiempo revisando el contenido. Tal como lo veo, el libro tiene 3 segmentos principales: una porción de matemáticas y estadísticas, una porción de herramientas de codificación (principalmente python) y otra de teoría de ML (y su implementación).

Esta es una cobertura realmente enorme, y no sé qué tan bien lo han hecho. Dado que el paraguas que se lanza aquí es tan grande, te sugiero que vayas por la primera opción.

Comprenda que no existe un enfoque de aprendizaje “único para todos”. A algunas personas realmente les va bien cuando se toman el tiempo para digerir los conceptos, mientras que a otras les gusta ir de una manera más ágil, comenzando por obtener una visión general y luego gradualmente profundizando con el tiempo.

En el caso de este libro, propongo ir primero en amplitud porque si pasa tiempo asimilando completamente cada concepto, tomaría mucho tiempo. Además, y quizás lo más importante, es poco probable que cada concepto haya sido cubierto por completo en este libro (¿redes neuronales en 12 páginas?). Por lo tanto, pasar mucho tiempo en cada uno y esperar que lo haya “entendido todo” sería realmente una mala ilusión.

El estilo que funcionó para mí fue repasar los conceptos fundamentales y construir sobre ellos. Vengo de una formación en ingeniería, por lo que las partes matemáticas de la ciencia de datos no fueron un problema para mí. El libro principal que leí fue Introducción al aprendizaje estadístico en R y me puso en funcionamiento con la mayoría de los algoritmos comunes en ML. Sabía que no aprendí todo lo que había que aprender y que estaba bien. Comencé a avanzar y a aplicarlo para resolver problemas. De vez en cuando me topaba con un obstáculo y veía que me faltaba algo en mi comprensión de cómo funcionaban realmente las cosas, y luego leía una nueva fuente. Voy a ser sincero, todavía veo las conferencias CS229 de Andrew en mi tiempo libre a veces. Es básico de ML, pero de vez en cuando me doy cuenta de una idea que había pasado por alto anteriormente.

Construí sobre esta base con otros cursos y libros. Estudié las pruebas de hipótesis por separado e incluso hoy sigo leyendo más. Leo los sistemas de recomendación por separado y hoy diría que solo conozco los conceptos básicos de los recomendadores. Hice un recorrido completamente diferente de redes neuronales y aprendizaje profundo que aún está en progreso. A medida que se va añadiendo más conocimiento a los conceptos existentes, es hora de volver atrás y volver a pensar, repensar y aprender más. Esto simplemente no podría haberse hecho si dijera que voy a digerir algo completamente y solo luego seguiré adelante.

Supongo que esto podría ser cierto para cualquier campo que todavía se está desarrollando y tiene mucha actividad, pero también tiene una buena cuota de estilo personal y preferencia. Basándome solo en este libro, he dado mi recomendación: para un enfoque general de entrenamiento usted mismo puede ver lo que más le convenga.

Ciencia de datos