¿Qué se necesita para que un estudiante de matemáticas e informática se convierta en un científico de datos?

Estudié matemáticas e informática y actualmente estoy trabajando como científico de datos, aquí en Quora.

Algunas de las clases más útiles que he tomado en preparación para este papel han sido las clases de estadísticas. Específicamente, los que lo llevan más allá de los escenarios de modelado de libros de texto del primer año, es decir, modelos lineales. Si hay una buena clase en estadística no paramétrica y un curso sólido en estadística bayesiana, entonces creo que esto cubrirá algún material útil. Del mismo modo, si hay un curso de aprendizaje automático, esto será invaluable. El análisis de series de tiempo es un tema realmente candente en este momento, ya que la mayoría de los análisis de datos tienen un componente temporal, es decir, son series de tiempo, y si puede incorporar esto en su experimento o modelo, entonces tendrá una ventaja en el mercado laboral.

Para algunos cursos pragmáticos en el lado de la ingeniería, creo que una clase en bases de datos a gran escala con frecuencia sería útil. O simplemente cualquier clase de base de datos que pueda tomar, siempre que no sea impartida por un profesor horrible. Nunca hice esto y con frecuencia me arrepiento.

Con respecto a la teoría de la medición, su posibilidad de usarla en un entorno profesional es increíblemente escasa. Sin embargo, le ayudará a comprender la probabilidad y, por lo tanto, las estadísticas en un nivel más concreto. Las clases de algoritmos se traducen directamente en la industria y creo que son realmente útiles: una parte bastante grande de la teoría de CS (creo que el contenido del ToC de Sipser) es menos útil en el día a día.

Habiendo dicho esto, creo bastante en dejar que tus intereses den forma a lo que estudias. Si crees que un tema es interesante y te apasiona, probablemente absorberás mucho más contenido. Tomé un curso de teoría de la información; los conceptos que Shannon pensó hace más de 60 años aparecen de forma aleatoria de vez en cuando y, aunque es difícil cuantificar su valor en un entorno profesional, parece una obviedad en retrospectiva. Sin embargo, si no lo encontrara fascinante, probablemente habría sido un desperdicio. Sentimientos similares para clases como análisis de redes, teoría de grafos, teoría de información cuántica, medida de probabilidad teórica, teoría de grupos y teoría de números que han capturado mi imaginación y entusiasmo en muchas ocasiones.

Elegiste bien con matemáticas / compsci: abre muchas puertas. ¡Buena suerte!

La mejor manera de entender algo es simplemente saltar y hacerlo

Participe en un proyecto de ciencia de datos de código abierto, como

Contenido calculado / tsvm

Lo que estamos tratando de hacer es establecer un conjunto de proyectos de investigación de código abierto, colaboración, ciencia de datos / aprendizaje automático

que corresponden al trabajo descrito en mi blog

Aprendizaje automático

Estos proyectos están diseñados para proyectos de investigación científica de buena fe que requieren recopilar nuestros propios datos y diseñar experimentos que prueben sistemáticamente ideas teóricas específicas.

A diferencia de Kaggle, que es aislado, competitivo y predefinido, estos proyectos están destinados a ser compartidos, colaborativos y requieren un pensamiento científico para enmarcar el problema.

Cada proyecto involucra

1. comprensión matemática y avance
2. experimentos de ciencia de datos
3. desarrollando un código

Estamos muy abiertos a tener colaboradores interesados ​​en realizar nuevas investigaciones en ciencia de datos.

Además de tomar más asignaturas, podrías considerar unirte a un laboratorio o realizar una pasantía en empresas que te darán un cambio para hacer tu trabajo de datos. Esto le permite ganar experiencia real con sus nuevos conocimientos académicos encontrados.

Ejemplo. Un grupo de investigación en el departamento de biología está realizando experimentos sobre los efectos de la sustancia X en una gran cantidad de plantas. Esto produce una gran cantidad de datos que podrían beneficiarse de una mejor visualización y presentación. También debe limpiarse y procesarse previamente. Se utilizan muchas herramientas estadísticas. Aquí puedes flexionar lo que acabas de aprender. Por supuesto, comenzando con las actividades más fáciles. Al final, obtienes experiencia y la gente bio está feliz.

Creamos una infografía que resume los pasos que puede seguir para convertirse en un científico de datos (todos los recursos en línea). Cómo convertirse en un científico de datos en 8 sencillos pasos: la infografía. También asegúrese de consultar nuestra Ciencia de datos de aprendizaje – Infografía, que le brinda una vista ligeramente actualizada (con recursos en línea) sobre los 8 pasos que debe seguir para aprender ciencia de datos.

Eche un vistazo a lo que el profesor Steven Skeina de Stony Brook había dicho sobre esta pregunta en su curso gratuito en línea Computational Finance