Cómo planificar un autoestudio de ciencia de datos

Aquí hay un extracto de una publicación de blog que escribí donde expuse diferentes pasos. También le sugiero que revise la Carrera de Ciencias de Datos de Springboard, que puede ser la mejor opción para su plan de aprendizaje (divulgación completa, trabajo allí) 🙂

1- Busca recursos de aprendizaje en todas partes

Familiarícese con diferentes comunidades y recursos de aprendizaje, y conozca cuáles se adaptan a su estilo de aprendizaje. Obtenga una rutina de aprendizaje y un conjunto de rutas en función de cómo desea aprender. Obtenga una idea de dónde se encuentra y cuánto progreso necesita lograr. Nuestra guía de trabajos de ciencia de datos tiene una buena visión general de las habilidades que necesitará para tener éxito en la ciencia de datos y una buena lista de recursos para comenzar si desea aprender ciencia de datos de forma gratuita y en línea.

Querrá pensar constantemente sobre cómo aprender ciencia de datos. Los mejores científicos de datos son aprendices de por vida.

2- Aprende un lenguaje de programación

Como base, sugerimos aprender al menos un lenguaje de programación para que pueda comenzar a jugar con datos a escala. Para empezar, se sugiere encarecidamente que los científicos de datos en ciernes adopten uno de R o Python.

3- Aprende los conceptos básicos de estadística

Como científico de datos, se le pedirá que utilice métodos estadísticos para analizar e interpretar datos. Debe estar familiarizado con esos métodos, así como con la mentalidad general asociada con el pensamiento en las probabilidades.

4- Aprenda qué significan los datos para una industria en particular

Combine su conocimiento de los métodos de ciencia de datos con el conocimiento del dominio para que pueda comenzar a descubrir ideas sobre una industria en particular. Querrá aprender algo que le apasione y luego comenzar a aplicar métodos de ciencia de datos.

5- Combina tus conocimientos y crea proyectos del mundo real

Tome el conocimiento que tiene y comience a construir una cartera de proyectos interesantes de ciencia de datos. Examine diferentes ángulos y preguntas y cree análisis interesantes que pueda compartir con otros. Querrá crear un sitio de cartera utilizando software como WordPress y una cuenta de Github y comenzar a aplicar las habilidades que ha aprendido en teoría.

6- Network y conoce la comunidad de ciencia de datos

Querrá establecer contactos y conocer a la comunidad de ciencia de datos, ya sean eventos locales en Meetup o eventos más grandes como O’Reilly Strata. Es importante que comience a establecer contactos y conocer qué oportunidades hay en la ciencia de datos, y es importante comenzar a encontrar personas con las que pueda colaborar y de las que pueda aprender. Querrá comenzar a construir relaciones con personas en empresas contratantes o que tienen necesidades de ciencia de datos: incluso puede considerar trabajar independientemente como científico de datos si puede construir proyectos a nivel profesional.

7- ¡ Prepárate para el proceso de entrevista de ciencia de datos y entra en una carrera de ciencia de datos!

Después de construir su red y poner en marcha algunos proyectos de cartera, querrá comenzar a aprovechar a las personas dentro de su red y buscar diferentes oportunidades de trabajo. En este punto, debe concentrarse en dominar sus habilidades y pasar el proceso de entrevista de ciencia de datos. Springboard ha creado una guía completa de entrevistas de ciencia de datos que puede ayudar en este sentido.

Una vez que haya dominado la entrevista de ciencia de datos y haya aceptado su primera oferta, estará en una carrera profesional como científico de datos donde no tendrá que mirar hacia atrás. El aprendizaje de la ciencia de datos habrá valido la pena.

Como nadie respondió aún, solo insinúa.

Yo era un ingeniero agrónomo, luego obtuve una maestría en estadística.

  1. Creo que el primer paso es preguntarse cuál es su objetivo principal. ¿Desea cambiar de trabajo, o desea realizar su propio análisis solo, o mejorar los métodos que ya están en uso en su equipo?
  2. Una vez que sepa esto, es posible que desee identificar dos cosas: lo que le parece más emocionante y lo que cree que le falta más. Si son iguales, tienes tu primer paso. Por ejemplo, la comprensión real de las compensaciones clásicas en el aprendizaje estadístico. Sesgo vs Variación, Sobre vs subevaluación, explicando vs prediciendo. Yo recomendaría comenzar con un poco de información estadística, ya que realmente ayuda a ver la hipotisis subyacente, que a menudo están menos expuestas en el aprendizaje automático.
  3. Es posible que desee dejar de usar un software que requiere que haga clic. No es que no hagan bien el trabajo, pero la programación lo ayuda a comprender lo que hace más fácilmente y a profundizar su análisis. Por ejemplo, si desea verificar un análisis con valores p de un parámetro, es instantáneo en R. Debe hacer clic p veces en su software favorito. Soy parcial hacia R porque es lo único que sé. Intenté Python cuando me obligaron a hacerlo, también es muy bueno, pero odio que el índice comience en 0.
  4. Aumentar proporcionalmente ! R no es buen amigo con grandes bases de datos. No es muy rápido tampoco. Es posible que desee avanzar a los lenguajes de programación de nivel inferior. C ++, java. Solo sé muy poco sobre esto, así que tenga el consejo de un verdadero científico de la computación. Es posible que desee abordar algunos datos grandes jugando con hadoop en esta etapa.
  5. Hacer proyectos Encuentre un conjunto de datos que quiera comprender completamente y desafíe diferentes métodos: regresión logística versus bosques aleatorios o clasificador bayesiano.
  6. ¡A disfrutar!

Espero que encuentres esto un poco útil y otros consejos también.

Tenga en cuenta esta regla general: un científico de datos debe saber programar mejor que un estadístico y conocer mejor las estadísticas que un experto en informática.

Si sigue los ocho pasos mencionados en la imagen a continuación, debe estar bastante equipado con las habilidades para abordar los problemas de la ciencia de datos,

Un científico de datos tiene que ser un jugador de equipo, ya que el científico de datos es el circuito de retroalimentación que ayuda a iniciar, iterar e impulsar decisiones en la empresa. El científico de datos trabajará con gerentes de productos y personas de todo el mundo, convenciendo a las personas de las decisiones e impulsando las decisiones comerciales y de productos.