Cómo convertirse en un científico de datos como estudiante

En primer lugar, colocarse en una empresa de análisis de datos no lo convertiría en un científico de datos de todos modos, pero es posible ser un analista de datos.

Mu-Sigma, Flipkart, TESCO, Oracle Financial Services y, sobre todo, las empresas de alto perfil (TI y minoristas) utilizan el proceso de toma de decisiones basado en datos para tomar decisiones comerciales.

Si desea ser un científico de datos, planifique un título superior en ciencia de datos. Un curso de Maestría en Ciencias lo convertirá en un ingeniero de datos, pero se requiere un doctorado en Ciencia de Datos para ser un científico de datos. Usted es de la Universidad de Nivel 1, por lo que esto no será difícil para usted, sí, estar en una Universidad de Nivel 1 tiene sus ventajas, pero es una posibilidad remota, así que mejor asegúrese de lo que quiere.

Puede buscar en Google, sobre diferentes universidades y sus programas ofrecidos.
Esta pregunta ya ha sido respondida en Quora, eche un vistazo:

¿Cómo me convierto en un científico de datos?

La respuesta sobre cómo prepararse para la carrera en Data Science se puede encontrar en:

¿Cómo me convierto en un científico de datos?
¿Puedo convertirme en un científico de datos autodidacta?
Big Data
Ciencia de los datos

Como mencionó que ha realizado algunos cursos introductorios en análisis de datos, supongo que está familiarizado con Coursera, Edx, Udacity, Novoed y sitios de alojamiento de MOOC similares.

Con respecto a las empresas a las que debe dirigirse, puede obtener buenas ideas desde aquí:
¿Cuáles son las startups más populares en el espacio analítico?

El resto de mi respuesta se concentraría en cómo se puede avanzar en la carrera profesional en el campo de la ciencia de datos …

Un buen número de expertos establecidos en ciencia de datos enfatizan que más que un MS / PhD, buscan el tipo de trabajo o proyectos que uno ha realizado en el espacio de análisis / ciencia de datos. Por lo tanto, sería una buena idea participar en competiciones como las organizadas por Kaggle.

Pero para eso, uno necesita una buena base en:

  1. Matemáticas (Estadística: abordaje frecuentista y bayesiano, álgebra lineal, probabilidad, etc.)
  2. Aprendizaje automático
  3. Programación (para realizar una recopilación de datos básicos, munging y visualización para un análisis de datos más pesado algorítmicamente). Por lo tanto, un buen conocimiento de algunas de las herramientas de análisis de datos populares como Python, R, SAS, SPSS, Julia, etc. le dará una ventaja
  4. Como un científico de datos debe ser capaz de comprender la necesidad comercial y hacer su análisis para resolver la pregunta comercial, el buen conocimiento de cómo funciona el negocio tampoco perjudica
  5. y muchos más…

Te sugiero que comiences construyendo tus fundamentos en matemáticas, conceptos y algoritmos de aprendizaje automático … y luego comiences a aprender cómo implementar esos conceptos a través de un lenguaje de programación.

Una vez que estés cómodo hasta aquí, elige un proyecto o compite en Kaggle.
Este debería ser un buen comienzo para construir su perfil.

La mejor de las suertes 🙂

El “Espacio de ciencia de datos” está empezando a calentarse. Ha existido en varias formas, como el almacenamiento de datos, el análisis computacional y la informática de alto rendimiento en el pasado. Solo recientemente está recibiendo mucha prensa.

No puedo hablar por toda la industria, pero en nuestra opinión, hay mucha educación que debe hacerse en el mercado. Las empresas que ayudan a otras empresas a dar sentido a los datos de inmediato suelen ganar. Por lo tanto, una buena combinación de buenas habilidades ETL, base de datos y visualización generalmente ayuda.

El mejor plan para la ciencia de los detalles:

Aprenda lenguaje de desarrollo: ¡Sí! necesitas entender los ‘lenguajes’ de programación. Pruebe Python primero, ya que es bastante simple de entender y se encuentra bajo una posible clasificación. Aprenda Python aquí: Tutoriales de Python: Año 1 (No necesita ser Python Ninja, solo se necesitan detalles principales). A continuación, intente con la terminología de programación “R”. También es totalmente gratis. Aprenda R aquí: DataCamp: la forma más sencilla de aprender R y tecnología de detalles (es gratis)

El conocimiento de SQL es necesario: como va a realizar con una gran cantidad de datos, mis sugerencias son entender SQL. Descubra SQL aquí: SQLZOO o del youtube de “Manish Sharma”. canal com: guías SQL para principiantes / guías de fuente de datos de Oracle.

Comprendamos Estadística y Probabilidad: la posibilidad se conoce generalmente como la ciencia de la duda y esa idea es más esencial en el área de DS. Descúbrelo de los programas MIT. Aquí está el youtube. enlace com: Posibilidad e Investigación MIT

Aprendizaje automático: otro tema importante que todos deberían entender es el “Aprendizaje automático”. Necesitas tener información matemática para entender ML. Aquí está la mejor guía del mundo sobre ML: Selección de sesión | Dispositivo de aprendizaje

Aprenda el procesamiento del lenguaje orgánico: aquí están las mejores referencias, manejo del lenguaje orgánico con Python

Complete aquí: ¿Cómo puedo convertirme en un científico de datos paso a paso?

Como estudiante universitario, tiene acceso a clases increíbles y tiene la flexibilidad de aprender ciencia de datos cuando lo desee.

Consulte ¿Qué clases debo tomar si quiero convertirme en un científico de datos? ¿Y qué especialidad debería elegir si quiero ser un científico de datos? o ¿Cuál es el mejor tema para menores si te estás especializando en estadísticas?

Luego, consulte la versión más general de esta pregunta en ¿Cómo me convierto en un científico de datos?

O, si ya casi terminas con la escuela, mira ¿Cómo me convierto en un científico de datos, sin las habilidades necesarias?

Como estudiante universitario, se encuentra en el momento perfecto de su carrera para construir su base para convertirse en un Científico de Datos.

Diría que si sigues estos pasos, sería más fácil para ti construir tu carrera como Científico de Datos

1. Tome Estadística o Matemáticas como su especialidad. Las personas con experiencia en ingeniería también lo hacen como científicos de datos, pero no se puede negar el hecho de que necesitará tener una base sólida en matemáticas. Después de todo, encontrar patrones en los datos se basa en algoritmos matemáticos.

2. Tome algunos cursos de programación en Python. El mejor lugar es encontrar algunos recursos gratuitos en la red como Udemy o Udacity (tiene un curso gratuito de Python) y aprender a entender cómo funcionan los sitios web.

3. Si está tomando las estadísticas como su especialidad, entonces es posible que tenga un tema sobre programación R, si no es así, inscríbase en él, ya sea en línea o fuera de línea, ya que este es uno de los idiomas que necesita dominar.

4. Por último, pero no menos importante: asegúrese de interactuar con tantos Data Scientists como sea posible para comprender el camino que tomaron. Para ayudarlo a comenzar, puede unirse a un seminario web gratuito en vivo sobre cómo convertirse en un científico de datos. Puede hacer clic aquí para registrarse. https://attendee.gotowebinar.com …? source = quora

Obtenga experiencia trabajando con grandes conjuntos de datos: plantee preguntas para formular sobre los datos y descubra cómo responderlos utilizando datos (ya sea de los datos que ya tiene o con los nuevos datos que desea recopilar). En el camino, familiarícese con una variedad de herramientas para organizar, procesar, analizar y visualizar los datos. Comunique sus hallazgos con otros y recomiende un curso de acción. Este tipo de experiencia se encuentra típicamente en los laboratorios de investigación académica, pero no es exclusivo de ellos.

Luego aplique a trabajos de ciencia de datos. Podemos oler su experiencia, o falta de ella, bastante fácilmente en la entrevista.

¿Tiene su escuela algún tipo de programa cooperativo?

¡Soy un estudiante de matemáticas aplicadas de Waterloo y he aprendido mucho de mi primera cooperativa como pasante! Sugeriría tomar cursos de estadísticas y cursos de modelado para aprender la teoría y tratar de obtener una pasantía con una sólida comprensión de las matemáticas.

(¡¿Pero no tengo experiencia ?!) ¡entonces obtenga la entrevista solo de pasión!

mira otra pregunta que respondí sobre el tema:
Veo a muchas personas preguntando cómo convertirse en un científico de datos, pero ¿cuál es un marco de tiempo realista para obtener un trabajo a tiempo completo, comenzando desde la zona cero?

participar en un proyecto de ciencia de datos de código abierto

Contenido calculado / tsvm

Aprendizaje automático con etiquetas faltantes: SVM transductoras

Lo que estamos tratando de hacer es establecer un conjunto de proyectos de investigación de código abierto, colaboración, ciencia de datos / aprendizaje automático

que corresponden al trabajo descrito en mi blog
Estos proyectos están diseñados para proyectos de investigación científica de buena fe que requieren recolectar nuestros propios datos y diseñar experimentos que prueben sistemáticamente ideas teóricas específicas.

A diferencia de Kaggle, que es aislado, competitivo y predefinido, estos proyectos están destinados a ser compartidos, colaborativos y requieren un pensamiento abstracto.

Cada proyecto involucra

1. comprensión matemática y avance
2. experimentos de ciencia de datos
3. desarrollando un código

Estoy muy abierto a tener colaboradores interesados ​​en hacer una nueva investigación en ciencia de datos

a partir de enero de 2015 seguimos activos

Hay muchos cursos (MOOC o tradicionales) disponibles en todo el mundo, pero muchos olvidan que un Data Scientist debe ser bueno en CS / IT y ciencias duras, pero también en aplicaciones comerciales y ética y derecho. Esto último se olvida con demasiada frecuencia en los planes de estudio, pero es un desafío enorme.

Visítenos en el Data ScienceTech Institute, con nuestros programas de maestría más intensivos de 1,600 horas 😉

Estas son las habilidades más buscadas que los empleadores buscan para los puestos de Data Scientist, según el análisis realizado en las ofertas de trabajo:

  • Big Data
  • Pitón
  • Hadoop
  • R
  • Aprendizaje automático
  • Análisis de los datos
  • Minería de datos
  • SQL
  • Estadística

Intentaría leer un poco y ver videos relevantes para aprender más sobre estas habilidades y tecnologías. Si tiene tiempo, considere tomar un curso de eLearning para aumentar sus posibilidades en esta entrevista o en las siguientes.

Puede ver más información relevante sobre las habilidades requeridas y encontrar recursos relevantes para cada habilidad aquí.

Escribí una publicación de blog sobre esto con algunos consejos prácticos: Cómo obtener una pasantía en ciencia de datos.

Y luego, es posible que desee ver esta pista de carrera de ciencia de datos. 🙂

Creamos una infografía que resume los pasos que puede seguir para convertirse en un científico de datos (todos los recursos en línea): Cómo convertirse en un científico de datos en 8 sencillos pasos: la infografía. ¡Recientemente hemos renovado esta infografía Learn Data Science – Infographic y hemos actualizado los pasos, recursos y herramientas que puede usar para llegar a donde necesita estar para convertirse en un científico de datos!

Aquí esta lo que hice. ¡Enséñate a ti mismo el aprendizaje automático! y el seguimiento ¡Enséñate a ti mismo el aprendizaje automático de la manera difícil! (Parte 2)
Todo lo que necesita es su computadora portátil, conexión a Internet y tiempo.

Diría que a pesar de todas las habilidades que mencionó, debe mejorar aún más sus habilidades en Python y Hadoop, y también ayudaría a poder leer y comprender el código Java. (Pero aprender los conceptos básicos de Hadoop y desarrollar una base sólida en Python debería ser un gran comienzo. También debe conocer los conceptos básicos de Unix y cómo funciona el sistema de archivos y la sustitución de nombres de archivos … Incluyendo grep y sed, etc.).

“Ciencia de datos” es un término vago y cada empresa diferirá en sus necesidades. Muchos de ellos no van a contratar estudiantes universitarios para sus puestos de “científico de datos”, por lo que es posible que desee considerar un título de posgrado.

Tendrá que adquirir algún tipo de habilidades de tipo de programación CS-ish. Casi todas las publicaciones que veo quieren SAS o R y conocimiento de un lenguaje de programación como Python.

Ligeramente en el contexto indio, pero podría darte una idea.
growthfishacademy.com
Cómo ingresar a Analytics – GrowthFish Academy