¿Debo convertirme en un científico de datos si no tengo una ciencia dura o un título universitario cuantitativo?

Muy pocas personas saltan a una posición de Data Science sin experiencia sustancial , ya sea investigación de posgrado en algún campo cuantitativo o experiencia en la industria. Es como decidir que quieres jugar fútbol algún día y estás pensando en jugar Quarterback en la NFL.

Para la mayoría de los puestos de Data Scientist necesitará al menos 4 años, ya sea que se trate de una investigación de doctorado en un campo cuantitativo o de pasar por la industria como analista de datos, ingeniero de datos o ingeniero de software en su camino hacia un rol de científico de datos. Es cierto que puede conseguir un trabajo como Científico de Datos sin esa experiencia, pero tendría algunas preguntas serias sobre la empresa y / o la persona (s) que lo contrataron.

Entonces tiene dos opciones, ruta académica o industria. Ambos necesitarán algunas habilidades de nivel de entrada en Matemáticas, Estadísticas y Programación (R, SQL, Python) para entrar en cualquiera de los dos. Entonces comenzaría allí y apuntaría a la fruta baja. Solicítelo en escuelas de posgrado y trabajos o descubra cuál será el camino que puede comenzar primero y trabaja con su personalidad, finanzas e intereses. Si haces estudios académicos, no ganarás dinero, pero puedes obtener un título cuantitativo pagado. Harás MUCHO trabajo repetitivo. Y mucha teoría. Muchas de las clases no serán directamente aplicables a Data Science. Si trabajas en la industria, debes ser capaz de entrenarte y estudiar después de horas (MOOC, Kaggle, etc.) para continuar agregando habilidades para saltar cada año de tu trabajo en la industria, ya que es probable que no aumentes las habilidades que necesitas muy rápido.

Fui por la ruta de la industria ya que el doctorado académico desperdició demasiado tiempo y energía (cursos no relacionados) para mí. También podría ganar alrededor de $ 300K (total) en ese salto de 4 años a medida que adquiriera más habilidades y experiencia. Esto tenía demasiado sentido para mí. Pero podía hacerlo porque podía elegir y mis propios materiales de aprendizaje y hacerme estudiar más de 5 días a la semana durante más de 2 horas por noche después de días de trabajo completo. Si no puede configurar y andamiar su propio plan de estudios y hacer el trabajo después del trabajo para hacerlo, el doctorado es la ruta para usted. Pero es probable que este sea un objetivo de más de 4 años para muchos. Si desea obtener un verdadero rol de científico de datos.

¡Buena suerte!

Esa es una excelente pregunta para hacer. Hay dos posibles perspectivas para su pregunta. Puedo responder desde el ángulo de los empleadores y otra forma de verlo desde el punto de vista de los aspirantes.

Visión del empleador: hubo un momento a fines de los años 80 hasta principios de la década de 2000 en el que las personas contrataban solo los primeros de un lote, personas con más y más títulos y certificados. Pero para nuestro mejoramiento, la situación ahora ha cambiado. A mi modo de ver, los certificados y títulos son solo una prueba de que ha completado un curso en particular. No habla de tu conocimiento de habilidades. Durante la contratación, vi una brecha significativa entre nuestras necesidades como industria y los académicos que le enseñan. De alguna manera, después de entrevistar a 45 candidatos, seleccionamos a 6 personas. Así que creo que esta es la era del talento.

Visión del aspirante: si usted es un aspirante a científico de datos y realmente tiene el suficiente interés para aprender ciencia de datos, no creo que un título haga una gran diferencia. Aunque un título le daría peso a su currículum, no puede evitar que se convierta en un científico de datos. Si tiene suficiente conocimiento y dedicación, la falta de certificados y títulos no puede detenerlo.

Aquí hay algunas cosas que debe saber para aprender ciencia de datos. Si tienes un amplio conocimiento de ellos, estoy seguro de que conseguirías un trabajo.

  • Estadística, probabilidad y álgebra lineal
  • Regresión lineal, series de tiempo y función de costo
  • Análisis exploratorio de datos
  • Tipos de datos
  • Recopilación, extracción, consulta, limpieza y agregación de datos para análisis
  • Fuentes de datos, limpieza y disputas
  • Raspado web
  • Trabajando con API
  • Regresión y series de tiempo
  • Desarrolle una comprensión profunda de las aplicaciones del mundo real de algoritmos de ML supervisados.
  • Regresión polinómica, cresta y logística
  • Validación cruzada K-fold
  • Árboles de decisión, árboles condicionales y redes neuronales
  • Técnicas de conjunto
  • K vecino más cercano
  • SVM
  • Agrupación, reducción de dimensiones, PNL
  • Desarrolle una comprensión profunda de las aplicaciones del mundo real de algoritmos de ML no supervisados.
  • K- Propagación de medias / afinidad y cambio medio
  • Ward / Agrupación aglomerativa / DBSCAN
  • Bayes ingenuos
  • PNL / Agrupación de texto / NLTK
  • PCA y reducción de dimensiones

Aparte de esto, la ética, la dedicación, la autodisciplina y el compromiso también son importantes.

Descargo de responsabilidad: soy cofundador de @GreyAtom y ayudo a talentos de ingeniería a encontrar carreras sostenibles en tecnologías emergentes.

Algunos enlaces rápidos

Permítanme comenzar dejando caer el doctorado. La mayoría de las personas con las que trabajo que están relacionadas con la ciencia de datos no tienen una. Esa es la inflación del mercado laboral funcionando.

Sin embargo, todavía no he visto a una persona que ingrese a un equipo de ciencia de datos sin dos de los siguientes rasgos:

  • Habilidades de datos, ya sea ingeniería o análisis.
  • Antecedentes matemáticos y estadísticos.
  • Experiencia de programación
  • Conocimiento del dominio

Me metí en la ciencia de datos por los dos últimos, con énfasis en el conocimiento del dominio. No tengo un doctorado, ni siquiera cerca. Sin embargo, recibo ofertas de trabajo para doctorados casi semanalmente. Las empresas quieren la experiencia, cuando no la obtienen, buscan la segunda mejor cosa que pueden calificar: títulos.

Sin embargo, según mi propia experiencia, lo que los doctores aportan en la mesa en términos de los dos primeros, a menudo los hace brillar en las tareas de prueba y las entrevistas, y todavía tengo que cumplir con uno que no supere las expectativas desde el principio.

El mejor consejo que puedo darle es invertir en la programación y la parte de matemáticas / estadísticas. El mercado está atrayendo a tanta gente para estos puestos que, en lo que a mí respecta, incluso espero que obtengan muchas habilidades y conocimientos de dominio en el trabajo. Si esto es lo que quieres hacer, sigue estudiando, los científicos de datos nunca dejan de estudiar. Mi equipo tiene el 20% del tiempo de trabajo asignado, por ejemplo. Tan pronto como pueda, solicite un puesto junior, obtenga experiencia laboral.

¡Buena suerte!

Creo que primero piense por qué quiere convertirse en un científico de datos. Si es solo por los altos salarios y el glamour que sugeriría, investigue un poco para entender si le gusta el trabajo o no. Sí, la ciencia de datos es un campo que paga mucho, pero también hay muchos roles serviles de baja remuneración en análisis. Además, creo que elegir un campo debe estar motivado si te gusta el trabajo y no solo por el dinero que puedes sacar.

Si ha realizado su investigación y está interesado en la ciencia de datos, le sugiero lo siguiente

  1. Elija un lenguaje de programación R o python y comience a practicar la codificación. Aprende lo básico.
  2. Realice algunos cursos en línea sobre campamento de datos, etc. para practicar la disputa de datos.
  3. Una vez hecho esto, elige el curso de ML de Andrew Ng y hazlo por completo. Es el mejor curso para cualquier principiante en ML, según yo.
  4. Ahora puede elegir una competencia básica en kaggle y leer foros, etc. para comenzar.
  5. En esta etapa, habrás obtenido un conocimiento más que decente de análisis y puedes elegir si quieres profundizar en ML o si quieres concentrarte en el trabajo de BI. BI se centrará más en ser un experto en SQL y visualización, mientras que la ciencia de datos requeriría que también seas bueno en conceptos teóricos de ML. Desde el punto de vista comercial, ambos son imp, de hecho a veces los problemas comerciales se resuelven mejor mediante informes de datos que un modelo ML.

Obviamente, ayuda si tiene un grado cuantitativo, ya que le será más fácil comprender los conceptos en ML, pero no es obligatorio. Lo que realmente necesita es concentración y determinación y, si lo tiene, alcanzará el éxito sin importar qué.

La mejor de las suertes