¿Eres un científico de datos pero tu especialidad no era CS? En caso afirmativo, ¿cómo hizo la transición? ¿Y cuánto te llevó?

Yo era una escuela secundaria … espera … PROFESORA DE ARTE con una licenciatura en biología ambiental. Aprendí a codificar para enseñarles a mis hijos algunas cosas interesantes de STEAM, me enamoré, aprendí sobre el análisis de datos y me gustó aún más.

Pasé un año entero aprendiendo R a través de Coursera, hice una pasantía de investigación de verano.

Tuve la oportunidad de trabajar con un hidrólogo haciendo un análisis de datos que se transformó en un rollo de Ciencia de Datos de Salud Pública.

Toda la transición tomó 2 años, 10 meses mientras enseñaba a tiempo completo.

No había ningún punto en el que, después de dejar la enseñanza, no trabajaba con datos y ganara más de lo que enseñaba. Mis habilidades y comprensión crecieron mucho de mi trabajo y para mí, ha sido una gran decisión.

Debido a que mi trabajo actual es ligero en algunos de los conceptos más pesados ​​de Data Science, dediqué mucho tiempo fuera de las horas de trabajo para desarrollar el aprendizaje automático y las habilidades avanzadas de programación.

Definitivamente es posible intentarlo en la ciencia de datos sin el pedigrí, requiere mucho trabajo, la voluntad de fallar a menudo y un sentido realista de lo que harás durante los primeros años. Y será difícil conseguir ese primer descanso.

Estoy en mi tercer año de construcción de esta carrera y mi tarjeta de presentación dice Científico de datos de salud pública.

Este es un resumen de dónde estoy ahora:

  • habilidades sólidas de R
  • habilidades de resolución de problemas superiores a la media
  • Una buena base en las matemáticas que entra en los modelos más comunes
  • habilidades de visualización de datos en múltiples áreas (rbokeh, highcharteR, ggplot, leafletR, tableau, matplotlib, seaborn)
  • rMarkdown, tableros flexibles, tablas de datos interactivas
  • HTML, CSS y una pequeña cantidad de JavaScript
  • una idea de qué hacer con SQL cuando sea necesario
  • la capacidad de trabajar en bases de datos no relacionales (mongoDB, Redis)
  • secuencias de comandos de Python
  • línea de comando
  • una gran cantidad de algoritmos de modelado
  • probabilidad – estimaciones prácticas y MCMC
  • estadísticas, frquentista y baysiano, pruebas AB, pruebas de igualdad, confianza e incertidumbre, regresiones, encuestas y factores
  • bosques de aprendizaje automático, SVM, regresiones de todo tipo, agrupación …
  • PNL y análisis de redes sociales (gráficos)
  • la capacidad de pensar creativamente sobre la consulta basada en datos
  • la destreza verbal para explicar lo que descubrimos en inglés simple

En mi estimación, ese es un científico de datos junior …

Me siento cómodo con esa etiqueta y pensaría que uno podría recibir un puesto con ese título en un entorno corporativo en este punto de la carrera, siempre que haya espacio para crecer y apoyo para promover una educación formal en el camino (piense en estadísticas o ciencia de datos con ayuda financiera desde arriba).

En este punto, sé lo que no sé y cómo puedo adquirir ese conocimiento cuando lo necesito … ese es un buen lugar para estar en este punto.

Para darle una estimación de mi cronograma, estaba trabajando con datos al final del primer año, obtuve el título de Científico de datos al final del segundo año y probablemente me gané el derecho de llevarlo en los últimos meses …

Trabajé mucho más de lo que la mayoría de las personas se sentirían cómodas trabajando, más de 50 horas semanales en los primeros 18 meses además de mi trabajo para desarrollar las habilidades básicas, por lo que el millaje puede variar según su manejo y las responsabilidades familiares.

Tomé una ruta no tradicional a la ciencia de datos. Fui a la escuela de posgrado en ciencias políticas, con el sueño de ser profesor. Pensé que serían todos estudios de casos e investigaciones cualitativas, pero estaba en un rudo despertar cuando descubrí que era un programa de ciencias sociales altamente cuantitativo. Al principio odiaba las estadísticas, pero tenía un profesor mágico en una clase que lo cambió todo: el análisis de regresión multivariante. Pensé: “Espera, esto es realmente divertido, ¿podría recibir PAGO por hacer esto?” Después de eso, fue a las carreras, tomando cursos de métodos de posgrado adicionales, completando una maestría en poli-ciencia con una concentración en estadística métodos y perfeccionar mis habilidades SAS en el camino.

Al mostrar mis habilidades de SAS y una victoria en una competencia de econometría (piense en Kaggle antes que Kaggle), inicialmente fui reclutado como analista comercial normal. Sin embargo, descarté y presioné para ingresar al grupo de ciencias de decisión (el grupo construyó los modelos estadísticos). Pude hacerlo debido a mi historial de estadísticas y, francamente, a mi incansable molestia para moverme al grupo.

Desde entonces, he trabajado como modelador estadístico a tiempo completo (un subconjunto de la ciencia de datos), construyendo modelos de puntuación predictivos a escala en finanzas y marketing. Expandí mi conjunto de habilidades a algoritmos de aprendizaje automático, SQL para la preparación de datos y R para la flexibilidad de usar técnicas de vanguardia en el campo. Realmente, la única área en la que me falta es en los lenguajes de programación directos, como C #, y también estoy trabajando para apuntalar esa habilidad.

Nota al margen: No se trataba del dinero para mí. No sé si eso me ayudó (apostaría que lo hizo), pero estaba tan enamorado del hecho de que podía pagar las facturas básicas básicas haciendo algo divertido, que el buen salario fue una ocurrencia tardía. Si amas esto, el dinero debería llegar a su debido tiempo.

TL; DR: – Es posible entrar en este campo sin una especialización de CS, pero se necesita pasión y MUCHA capacitación / práctica técnica. El ingrediente secreto para mí fue una actitud implacable, casi ilógica, que quería trabajar en el lado del análisis predictivo de la ciencia de datos a pesar de que ‘no tenía ningún negocio’ haciéndolo.

Esta es mi corta experiencia personal. La verdad es que nunca tomé una clase de CS. Siento que no fue para mí. Todo lo que escuché fue juegos, ni sé lo que CS puede hacer en ese entonces, así como mis mayores: economía y estudios internacionales. También en términos de matemáticas, también tomé solo una clase (cálculo 1). Si hubiera deseado tomar más de estas clases, definitivamente.

En el último año, sé que quiero fortalecer mis habilidades y ser más técnico, ya que me doy cuenta de que pronto estaría en el mercado laboral. La investigación económica era la opción obvia. Tenía una introducción estadística y econométrica, así que me comprometí a completar una tesis con el uso del análisis de datos y Stata , un software estadístico que la mayoría de los economistas o profesiones similares lo utilizan. De hecho, sabemos que no ayuda mucho, pero me dio una buena perspectiva de qué herramienta puede hacer. Esta experiencia de investigación me ayudó a conseguir una pasantía de análisis en una startup de análisis de big data, una de las más conocidas y relevantes en el espacio. La pasantía fue un gran comienzo y me dio tiempo para descubrir este campo de la ciencia de datos. Utilicé principalmente software de la empresa fácil de usar, lo que me permitió aprender el concepto de análisis y familiarizarme con el proceso de ciencia de datos.

Además del trabajo, fui a la reunión de ciencia de datos varias veces a la semana o más, y sé que realmente necesito codificar en R, Python y SQL. Entonces aprendí a un lado. Cursos en línea por la tarde. Seguí los tutoriales. Hice un proyecto personal, leí mucho. Implementar diferentes técnicas. Conéctese con otros científicos de datos . Luego pude conseguir que un científico de datos trabajara en otra compañía. Me llevó más de un año y todavía aprendía todos los días . Como puede ver, la programación fue muy difícil para mí dada mi experiencia, y tuve que ser capaz de manejar también las estadísticas, las matemáticas, el dominio comercial y la comunicación, lo que hubiera sido para siempre, si no hubiera comenzado .

Así que comienza ahora, descifra sobre la marcha .

Nunca he tomado una clase de informática. Tuvimos un curso de R / SAS en mi programa de posgrado de matemáticas y algo de Matlab en mis clases de física. La ciencia de datos implica muchas más matemáticas que la informática o la programación a menos que esté en un equipo de producción. Las estadísticas le servirán mucho mejor en el aprendizaje automático y el análisis de datos (a menos que haga una escuela de posgrado en CS, donde le harán aprender las matemáticas).

Me gradué con una Licenciatura en Música en Interpretación de Voz, y luego solicité un puesto de posgrado en Estadística Aplicada. Ahora trabajo en analítica como analista de datos, aunque también hacemos aprendizaje automático y modelado predictivo y todo eso.

Solo estoy entrando en el segundo año del programa de maestría ahora, y pasé directamente de la universidad a la escuela de posgrado.

Un día me di cuenta de que es lo que hice. Mi primer trabajo profesional fue ayudar a administrar un almacén de datos y proporcionar soporte de preventa. Ayudé a escribir un manual para la gestión de proyectos de construcción y me pidieron que construyera algunas simulaciones de proyectos para respaldar el manual. Me pidieron que tradujera un requisito de investigación de gestión de personal / operaciones en software de computadora. A finales de los 90, me pidieron que implementara un sistema de predicción del rendimiento que las matemáticas y otros investigadores pensaron que podía hacer debido a mi experiencia. Hace unos 13 años, comencé a familiarizarme más con la jerga.

Estaba en física. Obtuve mi doctorado, y luego tuve un postdoc durante cuatro años, antes de salir de la academia. En ese momento, pasé un poco más de un año haciendo la transición a Data Science (de los cuales al menos seis meses fueron realmente necesarios).

Hola

mi especialidad no era CS sino finanzas computacionales, y era un maldito científico de datos antes de que el área de la bahía inventara la palabra.

Sí, pasar por datos tick por tick fue realmente malo y estaba usando matlab, python 2.7, SAS y R sin ningún orden en particular.

Mientras estamos en la escuela, construimos modelos Monte Carlo realmente difíciles para calcular el precio de una opción estadounidense y eso fue por elección.

una vez en el trabajo, no hubo transición. Vadeé y fui arrojado al agua y allí estaba.

Ahora estoy trabajando en mi propia empresa y sigo haciendo lo mismo. vadeando

Como yo lo veo, te guste o no. si lo amas, lo encontrará.

y también necesita muchas estadísticas para crear modelos predictivos.

no es sexy ni glamorosa como se veía, sobre todo de nuevo.

Debo estar perdiendo algo.

Saludos

Parag

Mi respuesta es no, no soy un científico de datos, pero sí estoy en el camino de convertirme en uno. Ni siquiera es fácil para alguien con experiencia en cs, pero sí, cierta experiencia técnica en el manejo de datos en cualquier forma y conocimiento básico de estadísticas definitivamente ayuda. Diría que realmente quieres convertirte en un científico de datos y luego aprender a amar los datos. Explorándolo porque cuanto más aprendes la teoría de la ciencia de datos no puedes ser un científico de datos hasta que comiences a hackear datos e intentes encontrar el significado de ellos. Un chico con ese conocimiento básico realmente se convierte en un gran científico de datos, ya que también tiene que poseer el arte de comunicar las ideas que uno obtiene de los datos.

More Interesting

¿Es mejor tener demasiados falsos positivos o demasiados falsos negativos?

¿Qué es mejor para un doctorado de aprendizaje automático, UMass Amherst o la Universidad de Edimburgo?

¿Cuáles son los métodos de normalización de datos más comunes utilizados en el aprendizaje automático?

¿Qué tan arriesgado es cambiar a la ciencia de datos después de trabajar durante 4 años en TI?

¿Habilidades para el autoaprendizaje de la ciencia / análisis de datos o las estadísticas de EM?

Si todos mis estudiantes por debajo del promedio alcanzaron el promedio de la clase, ¿cuál será el aumento porcentual en el promedio de la clase?

¿Cuáles son los buenos libros que proporcionan casos de estudio en ciencia de datos?

¿Cuál es el futuro de Big Data e IOT para tomarlo como una carrera futura después de algunos años de experiencia en la industria india de TI?

¿Un MBA en operación / cadena de suministro ayudará a comenzar una carrera en ciencias analíticas y de datos?

¿Dónde puedo encontrar algunos buenos documentos sobre ciencia de datos / análisis y aprendizaje automático?

¿Cuáles son algunos buenos proyectos de ciencia de datos?

¿Qué curso de ciencia de datos es mejor para un principiante, el nanodegree analista de datos de Udacity o el curso de ciencia de datos?

¿Es posible aprender el aprendizaje automático y la ciencia de datos a través de MOOCS y otras fuentes en línea o debería estudiar una maestría en CS?

¿Qué certificación de Big Data es mejor en términos de aprendizaje y valor?

¿Cómo se puede usar la ciencia de datos en la aviación?