¿Cuál debería ser mi plan de estudio para convertirme en científico de datos?

Conjunto de datos: en primer lugar, necesita un conjunto de datos interesante para jugar. O ya tiene sus propios datos (¡felicidades!) O necesita adquirir algunos. Estamos viviendo en la era de la sobrecarga de información, lo que probablemente significa que los datos están en todas partes y es fácil obtenerlos, ¿verdad? si y no

Estadísticas: Tener una buena comprensión de las estadísticas es extremadamente útil al realizar el análisis de datos. Una regla general dice que el primer paso después de obtener un conjunto de datos es echarle un vistazo rápido, y algunas estadísticas descriptivas básicas son un buen amigo suyo aquí. Si su conjunto de datos contiene variables numéricas, es posible que le interesen sus distribuciones: su centro (es decir, la media) y su extensión (es decir, la varianza).

Aprendizaje automático: en términos simples, el objetivo de los algoritmos de aprendizaje automático es aprender a tomar decisiones basadas en datos. Este enfoque, contrario al diseño de algoritmos codificados, tiene enormes beneficios en el sentido de que un método puede servir para muchos propósitos. Además, los sistemas de aprendizaje automático están diseñados para mejorar a medida que ingresan nuevos datos.

Visualización: ya he mencionado el poder descriptivo de las estadísticas. Permítanme ilustrar la importancia de la visualización en un ejemplo, donde las estadísticas simples no son suficientes: el cuarteto de Anscombe es una colección de cuatro conjuntos de datos diferentes con dos variables x e y.

MOOC: La ciencia de datos en diversas formas se está introduciendo como un nuevo programa en muchas universidades de todo el mundo. Los cursos en línea masivos van de la mano con esta tendencia y ya puede encontrar una gran cantidad de cursos gratuitos o muy asequibles que lo guiarán desde Introducción a la Ciencia de los Datos, pasando por Análisis de Datos e Inferencia Estadística, Minería de Datos o Visualización de Datos hasta Aprendizaje Automático. por Andrew Ng.

Desafíos: ahora, cuando tenga todas las piezas juntas, es hora de aplicar sus conocimientos en la práctica. ¿Y qué puede ser más divertido que participar en una competencia? Los desafíos de la ciencia de datos, como Kaggle, son una gran oportunidad para probar sus propias habilidades y aprender de los demás.

La ciencia de datos en sí misma es bastante diversa, con direcciones hacia la computación paralela distribuida y grande a la máquina y el aprendizaje profundo a la analítica avanzada a la IA a la computación cognitiva y muchas más áreas. Desde que recién comenzó, deseo que explore la amplitud y profundidad de los conceptos en todas las direcciones. Se ha diseñado y disponible un currículum interesante en las siguientes URL de github, que le brinda un buen lugar para comenzar, además de las especializaciones disponibles en moocs en línea en coursera, udacity y muchos más. Desde que recién comenzaste, mi consejo sería explorar la amplitud y entender a un alto nivel y explorar las revistas, conferencias y blogs de tecnología tanto como puedas, lo que definitivamente te da una idea y solidifica tus intereses en la dirección de tu pasión. Buena suerte .

Siraj Raval: introducciones de nivel principiante muy interesantes para muchas cosas

datasciencemasters / go

EricSchles / data_science_masters

stephaniecan / MyDataScienceMasters_2015-16

sociedad de código abierto / ciencia de datos

Es una buena noticia que haya optado por la ciencia de datos al principio de su carrera.
Sugeriría adquirir conocimientos sobre herramientas de programación como R y conceptos básicos de estadísticas y ciencia de datos. Hay buenos cursos en Data Camp y Coursera para ayudarlo a comenzar. Finalmente, valdrá la pena si practica proyectos de ciencia de datos: simples con conjuntos de datos disponibles en R (iris, mtcars) y complejos con Kaggle. Como sabrás, las manos en los proyectos son importantes para ayudarte a destacar.
No estoy seguro de sus habilidades y su compromiso de tiempo. Envíame un mensaje con los detalles y puedo guiarte.