Quería ser un científico de datos, pero desde que me uní a la industria justo después de los estudiantes universitarios, no obtengo ese tipo de roles. Ir a un MS es muy difícil ahora que ya he pasado algunos años en la industria del software. ¿Qué tengo que hacer?

Empecé casi por el mismo camino que el tuyo. Esto es lo que estoy haciendo por eso ahora:

1. Obtenga educación
Este es el primer requisito más buscado. Puede pensar que optar por MS / PhD es difícil, pero es importante. Soy un estudiante de posgrado en este momento, estudio con muchas personas que son más de cinco veces mayores para mí, a fin de desarrollar adecuadamente su conocimiento profundo. Algunas universidades (como la mía) también ofrecen programas a tiempo parcial. Inscríbase en un par de cursos como minería de datos, estadísticas, inteligencia artificial, extracción de información, etc. Si no es posible, pruebe algunos cursos en Coursera.

2. Participe
La razón por la que puse ‘Getting Education’ en primer lugar es que te hace sumergirte en un océano de académicos. Si está inscrito en un curso universitario, se vuelve obligatorio escribir las tareas de programación y hacer las tareas de lectura. Haces amigos y compartes ideas con ellos. En caso de obtener un curso en línea, esfuércese por trabajar para todas las tareas, eso también, dentro del plazo. Comience a trabajar en proyectos en Kaggle

3. Sigue las tendencias
El campo de la ciencia de datos ha encontrado un aumento repentino de popularidad. Están sucediendo muchas cosas en la industria. Los paradigmas están cambiando. Invierta algo de tiempo para seguir lo que está sucediendo en el mundo. Hay muchos foros en línea como KDUGGETS (el principal recurso de la comunidad de minería de datos) que no debe perderse.
Si está activo en LinkedIn, encontrará muchos grupos que lo mantendrán alerta e informado. Echa un vistazo a esta publicación:
Aprenda de la web social: grupos de minería de datos en LinkedIn

Si está aprendiendo solo, asegúrese de hacerse amigo de algunas personas que ya están en el campo, tal vez, las que todavía están aprendiendo, porque pueden darle más tiempo y guiarlo. Puede acercarse a ellos para hacer las preguntas más tontas para aclarar sus confusiones. Habrá momentos en los que estarás completamente frustrado. Algunos de los conceptos más importantes pueden parecer aburridos. Es una parte del proceso. Simplemente sigue.

ACTUALIZACIÓN
Acabo de encontrar un maravilloso video de Jeremy Howard de Kaggle. Te dará una introducción a las herramientas que necesitas para aprender a sobresalir en Data Science (y en las competencias de Kaggle)

Análisis deAprendizaje automáticoBig DataBig Data AdviceCiencia dedatosMinería dePregunta personalVisualización de datos

¿Qué certificación de Big Data es mejor en términos de aprendizaje y valor?

¿Cuáles son algunos de los mejores recursos / estudios de caso sobre análisis de datos / prácticas de segmentación de clientes / métricas en las startups?

Cómo saber si estoy listo para una entrevista de ciencia de datos

¿Tenemos una estrategia de control de calidad para satisfacer todos los volúmenes, variedad y velocidad en Big Data?

¿Cuáles son algunos buenos libros de texto en selección / ingeniería de características al construir algoritmos de aprendizaje automático?

En ajedrez, ¿por qué es tan ventajoso jugar al blanco?

Creo que mi futuro también será así, ya que también me encanta jugar con datos, pero no quiero hacer MS hasta que sea de una universidad de renombre, así que lo que he planeado y te sugiero que repases tu conocimiento básico inicial en aprendizaje automático y minería de datos de pocos buenos recursos en línea como-
Aprendizaje automático de los cursos abiertos de la universidad de Stancford

Siguientes cursos Coursera: –
1. Red neuronal (Coursera)
2. Procesamiento del lenguaje natural (Coursera)
Después de completar todo esto, puede resolver algunos problemas en tiempo real o desarrollar un sistema inteligente que lo haga notar en la comunidad de minería de datos y luego, si solicita un trabajo en este campo, respetan y consideran su calibre y pasión en este campo .
NOTA: – Si conoce la teoría básica o los antecedentes en aprendizaje automático o minería de datos, entonces no es necesario que haga todos estos cursos, ya que solo le enseñaron cosas de nivel básico para desarrollar su interés en el campo respectivo. En ese caso, puede ir directamente al paso 2 para desarrollar una aplicación en tiempo real que puede no ser demasiado compleja o sofisticada, pero debería atraer a la gente común o al público. Al final, es la cantidad de visitas a su aplicación web lo que importa y hace que su sitio sea popular, más tarde puede trabajar en la complejidad de su proyecto.

Prashant Kumar Singh

Creo que podrías probar el curso de especialización en ciencia de datos de coursera. https://www.coursera.org/special …

Consta de 9 clases más un proyecto de especialización. Los siguientes son los breves detalles sobre esas clases: –

La caja de herramientas del científico de datos – Una introducción básica a los datos y la ciencia de datos y una guía básica para R / Rstudio / Github / Command Line Interface.
Programación R : Introducción a la programación R, desde la instalación de R hasta tipos, funciones y estructuras de control.
Obtención y limpieza de datos : una introducción para obtener datos de la web, de imágenes, de API y de bases de datos. El curso también cubre cómo pasar de datos sin procesar a datos ordenados.
Análisis de datos exploratorios : este curso cubre el trazado en gráficos base, celosía, ggplot2 y agrupamiento y otras técnicas exploratorias. También cubre cómo pensar en explorar datos que no ha visto.
Investigación reproducible : este es uno de los cursos únicos de nuestra secuencia. Cubre cómo pensar en investigaciones reproducibles, análisis de datos basados en evidencia, listas de verificación de investigación reproducibles y knitr, markdown, R markdown, etc.
Inferencia estadística : este curso cubre los fundamentos de la inferencia estadística desde una perspectiva práctica. El curso cubre tanto los detalles técnicos como ideas importantes como la confusión.
Modelos de regresión : este curso cubre los fundamentos del modelado de regresión lineal lineal y generalizado. También sirve como una introducción a cómo “pensar” relacionando variables entre sí cuantitativamente.
Aprendizaje automático práctico : este curso cubrirá las ideas conceptuales básicas en el aprendizaje automático, como los errores dentro / fuera de la muestra, la validación cruzada y los conjuntos de entrenamiento y prueba. También cubrirá una variedad de algoritmos de aprendizaje automático y su implementación práctica.
Desarrollo de productos de datos : este curso cubrirá cómo desarrollar herramientas para comunicar datos, métodos y análisis con otras personas. Cubrirá la construcción de paquetes R, Shiny y Slidify, entre otras cosas.

También habrá un proyecto de especialización, que consiste en una décima clase donde los estudiantes trabajarán en proyectos realizados con socios industriales, gubernamentales y académicos.

Ahora puedes preguntar qué se debe hacer después de esto.

Intente resolver problemas en https://www.kaggle.com y muestre su potencial a su empleador actual o futuros.

Aditya Joshi

Únase a una startup en el espacio de datos. Obtendrá todo lo que perfeccionará sus habilidades y lo pondrá a la par (o incluso mejor que) cualquier otro científico de datos que pueda estar haciendo una investigación exagerada.

Sin embargo, hay 3 supuestos aquí:

Tienes hambre de aprender.
La startup a la que potencialmente se unirá tiene suficiente carne (leer conocimiento / reputación / experiencia) para alimentarlo.
Te comprometes a contribuir y crecer con la startup sin pensar en el dinero.

Lo digo desde mi propia experiencia de 3 años de carrera en consultoría de gestión que pensé que (al menos para mí) me estaba oxidando el cerebro. Peor aún, me dio la sensación de que nunca podría volver a estimularme intelectualmente al involucrarme en algo cercano a la tecnología a pesar de tener una maestría de CMU. Afortunadamente, tuve una oportunidad con la que me burlé y solo mejora cada día. He crecido en todas las áreas posibles, ya sea tecnología, marketing o apretones de manos de clientes. Esta inmensa satisfacción al final de cada día supera a cualquier maestría / doctorado. No digo que no agreguen nada, sino que tomen decisiones en interés de lo que más le guste.

Prashant Kumar Singh

¿Qué tan bien puedes codificar? ¿Qué tan bien conoce varios algoritmos predictivos / de clasificación? Si la respuesta a cualquiera de esas preguntas es “no muy buena”, refuerce esas habilidades primero (puede hacerlo de forma gratuita a través de cursos en Coursera). Una vez que se sienta cómodo al escribir clasificadores algorítmicos o modelos de regresión en python o ruby, le sugiero que cree un modelo en un conjunto de datos de muestra y escriba un análisis bastante exhaustivo de sus resultados. Cuando solicite empleo, envíe este análisis (o enlace a un sitio web que lo contenga) en su carta de solicitud.

Prashant Kumar Singh

Otro buen recurso son los profesores universitarios. Me conecté con mis antiguos profesores de escuelas de negocios de pregrado y hablé sobre sus intereses de investigación y ofrecí ayudarlos. Se pone un pie en la puerta en términos de investigación.

Aparte de eso, seguiría estudiando y jugando con los datos. Hay innumerables conjuntos de datos y problemas en la web.

Comience a construir una cartera de lo que ha hecho: certificados de curso, competiciones de kaggle, proyectos autoguiados, etc. Esto lo ayudará a la hora de entrevistarse para un puesto de científico de datos.

Red. La creación de redes es clave en el campo de la ciencia de datos. A todo el mundo le encanta hablar sobre las palabras de moda “análisis”, “ciencia de datos”, etc., pero en realidad nadie sabe lo que significan. Conéctese con la gente adecuada (doctores, profesionales de la industria en el campo de la ciencia de datos) y ofrézcales ayuda con sus proyectos y aprenda todo lo que pueda.

Jason Li

Aquí está el plan que recomendaría:

Comience a trabajar en proyectos relacionados con los sistemas de datos y bases de datos. Hazlo durante un año más o menos en la misma compañía
Pase a un rol de desarrollador / administrador de bases de datos en la misma compañía o en una diferente. También será útil trabajar en el lado de BI de las cosas.
Mientras hace los dos anteriores, siga un curso de certificación de ciencias de datos en línea o en el aula. Tarda aproximadamente un año más o menos y generalmente es de bajo costo. Su empresa debería poder patrocinarlo en eso. Elige una universidad de renombre.
Practique lenguajes relacionados con estadísticas como R mientras hace todo lo anterior 3. Hay muchos recursos en línea sobre cómo comenzar.

Espero que esto ayude.

Vikram Jha

Compite en Kaggle. Si obtiene buenos resultados, tal vez no necesite MS / PhD para el trabajo de ciencia de datos que desea.

Jason Li

Estás en una mejor situación. Al menos acabas de gruñir.

Tengo un doctorado. grado con un par de años de experiencia “científica”.
Cambié mi carrera a TI y mi objetivo es convertirme en un científico de datos. Ahora soy analista de datos, pero todavía está un poco lejos de ser un científico de datos. No puedo estar más de acuerdo con Aditya en que “debas educarte primero”. Coursera proporciona un muy buen curso de “científico de datos” en el que estoy trabajando. Con suerte, este coure será útil para mí.

Prashant Kumar Singh

Únase a un proyecto en minería de datos (tal vez en alguna universidad o en otro lugar) a tiempo parcial. De esa manera puedes mejorar tus habilidades de dm junto con tu trabajo. Creo que muchas universidades también ofrecen títulos a tiempo parcial.

Prashant Kumar Singh

Mira a tu alrededor y entra en un nuevo programa de investigación donde no tienen idea de qué demonios están haciendo.

Prashant Kumar Singh

More Interesting

¿Cómo se puede aprender Big Data Hadoop en casa si no tiene experiencia laboral y está pensando en comenzar una carrera en Big Data?

¿Cuáles son las preguntas clave al crear un panel de datos?

¿Qué gráficos de Nvidia, GeForce o Quadro, son los mejores para aplicaciones de análisis de datos grandes, modelado computacional y ciencia de datos?

¿Por qué debería molestarme con Python si puedo usar software para el análisis de datos (Excel, Tableau)?

¿Es R una opción correcta para hacer un análisis predictivo en un conjunto de datos con más de 100K registros? Si no, ¿cuál es?

¿Qué tiene más alcance y permanecerá durante mucho tiempo en el mercado, la ciencia de datos, la computación en la nube o Hadoop y big data?

¿Qué lo motivó a convertirse en gerente de ciencia de datos en lugar de permanecer en el papel de un científico de datos senior?

Cómo seleccionar los atributos sensibles en un conjunto de datos