¿Cómo compararía las ofertas de especialización de “ciencia de datos” de Coursera y Udacity?

Hola,

He publicado una revisión detallada de la Especialización en Ciencia de Datos de la Universidad Johns Hopkins, que se ofrece en Coursera.

Divulgación completa: actualmente trabajo en Udacity. Trataré de enmarcar mis comentarios en términos de mis experiencias como aprendiz.

Especialización en ciencia de datos de la Universidad John Hopkins

Herramientas:

  1. R / RStudio

Fortalezas:

  1. Tomar la clase con otras personas en la especialización ciertamente ayudó.
  2. Los foros están bien organizados y es fácil buscar información o hacer preguntas.
  3. Disfruté de la evaluación por pares de los proyectos, aunque perdí puntos en dos de los proyectos y nunca supe por qué.

Luchas:

  1. Algunos cursos cubrieron demasiado material demasiado rápido.
  2. Quería más preguntas, cuestionarios o evaluaciones en los cursos para practicar.
  3. Los foros fueron más tranquilos hacia las últimas tres clases ya que no muchos estudiantes llegaron al final.
  4. Tuve que aprender mucho por mi cuenta para llenar los vacíos e hice uso de los foros para que mis compañeros respondieran mis preguntas.

Disfruté aprendiendo más sobre R y aprecié tres de los cursos en particular: Análisis de datos exploratorios, Investigación reproducible y Aprendizaje automático práctico. Es increíble que estas clases se ofrezcan de forma gratuita o por una pequeña tarifa (la versión paga verifica su identidad, le permite completar el Proyecto Capstone y le otorga un certificado al completar con éxito un curso). Felicitaciones a todos los involucrados de Coursera y JHU.

Para estar completamente preparado para la especialización, creo que necesita una exposición previa al álgebra lineal y clases avanzadas de estadística para completar toda la especialización, especialmente los modelos de inferencia estadística y regresión.

Los 9 cursos lo familiarizarán con el lenguaje de programación R; sin embargo, en su estado actual, no recomiendo usar la especialización como una forma de aprender los detalles de los algoritmos de Estadística y Aprendizaje automático (cómo funciona matemáticamente un algoritmo).

Si te esfuerzas más y no te importa investigar temas por tu cuenta (es decir, ser un emprendedor y ser curioso / ingenioso cuando te quedas estancado), entonces creo que puedes avanzar a través de la especialización.

Analista de datos de Udacity Nanodegree Program

He tomado 4/5 clases en el programa. Nota: Tomé estas clases una a la vez y no con una cohorte como lo harías en el programa Nanodegree.

Los cursos cubren tanto la teoría como la práctica de la ciencia de datos, y cada curso termina con un proyecto que le permite demostrar lo que aprendió.

Desarrollé dos de los cursos y proyectos finales. Todos los proyectos fueron diseñados para brindarle experiencia práctica con el material del curso y permitirle ir más allá de la descripción básica del proyecto si lo desea. Los proyectos pueden ser el comienzo de su cartera de trabajo para compartir con otros, especialmente los reclutadores.

Herramientas:

  1. Python (pandas, biblioteca de visualización ggplot2, scikit-learn)
  2. MongoDB
  3. R / RStudio (paquetes para visualizar y manipular marcos de datos: ggplot2, dplyr, reshape2)
  4. dimple.js y d3.js (bibliotecas de visualización)

Fortalezas

  1. Los cursos se crearon en colaboración con la industria y los expertos para que aprenda haciendo y aprenda cómo piensan los expertos acerca de los problemas empresariales / de datos.
  2. Preguntas frecuentes y oportunidades para practicar en lecciones, conjuntos de problemas o miniproyectos.
  3. Los proyectos finales son interesantes, desafiantes y le permiten demostrar lo que aprendió.
  4. Recursos adicionales y descargables. Puedo descargar videos para verlos en mi teléfono y explorar recursos adicionales para temas específicos.

Luchas:
No tengo una verdadera experiencia de aprendizaje ya que tuve acceso personal a instructores, entrenadores e ingenieros de Udacity. Animo a otros que se han inscrito en cualquiera de las clases individualmente o en el Data Science Nanodegree para que agreguen su voz.

Para todos los cursos, incluí un enlace a las páginas de descripción general del curso si desea obtener una visión más profunda del contenido del curso y los proyectos finales.

Introducción a la ciencia de datos, el primer curso proporciona una visión general del campo y lo expone a ideas cubiertas más profundamente en las siguientes cuatro clases. Obtendrá una visión general del proceso de hacer ciencia de datos y se familiarizará con los pandas, la biblioteca de trazado ggplot2 y la reducción de mapas.

La disputa de datos con MongoDB le enseña habilidades para trabajar con conjuntos de datos desordenados. Aprenderá sobre formatos de datos (JSON, CSV, XML, utilizando API web), calidad de datos, agregación / análisis de datos y MongoDB (una base de datos noSQL).

El análisis de datos con R le enseña a visualizar y explorar un conjunto de datos. En el curso, aprenderá el lenguaje de programación R y adquirirá técnicas de visualización mientras resume las variables, examina las distribuciones, piensa en valores atípicos / anomalías e investiga conjuntos de datos.

Introducción al aprendizaje automático es el curso que aún no he tomado. Cualquier comentario apreciado.

Visualización de datos y D3.js enseña visualización de datos en el contexto de la ciencia de datos. Aprendes sobre principios de diseño, percepción humana y narración de historias. Al final de la clase, debería poder crear una visualización que comunique los resultados de los datos de manera clara y efectiva.

Si desea clases para temas CS más avanzados, le recomiendo que consulte los cursos creados en colaboración con Georgia Tech: Catálogo de cursos de Udacity.

De un paso rápido de las ofertas de cursos y los programas de estudio, la mayor diferencia que veo entre las dos ofertas es que el programa Coursera tiene una secuencia definida de clases, mientras que Udacity no.

Creo que la secuencia que recomienda Coursera es un muy buen orden para introducirse en el campo general de la ciencia de datos, sin embargo, si ya está familiarizado con algunas de las técnicas y tecnologías que se están cubriendo, puedo imaginar que a la carta La naturaleza de los cursos de Udacity sería más atractiva. Aunque de ninguna manera son los dos mutuamente excluyentes, veo a Coursera como el más beneficioso para los estudiantes sin experiencia en investigación científica. Por otro lado, veo que Udacity es más beneficioso para alguien que ya ha estado expuesto a uno de los subcampos de la ciencia de datos y quiere mejorar en áreas específicas.

En términos de los temas cubiertos por los programas, mientras que Udacity ofrece la introducción más específica de software a Hadoop y MapReduce y Data Wrangling with MongoDB, en general, ambos sitios ofrecen introducciones a material muy similar en cuanto a limpieza de datos, datos exploratorios análisis, inferencia y aprendizaje automático. Por lo que vale, parece que Udacity está más basado en python, y Coursera está más basado en R. Ambos programas le proporcionarán una base sólida desde la cual puede explorar todos los campos especializados en los que se desborda la ciencia de datos.

Ambos programas parecen grandes introducciones a la ciencia de datos. Puede reducirse a qué programa cree que encaja mejor con su estilo de aprendizaje y antecedentes educativos, pero creo que tampoco puede equivocarse.

La ciencia de datos de JHU usa y solo usa R, mientras que la pista de ciencia de datos de Udacity enseña R, python, MongoDB y Hadoop.

Los cursos de Udacity lo introducirán en el campo de la ciencia de datos, y eso es todo. Si está enganchado, puede explorar otros materiales; Los 9 cursos de JHU aplican ampliamente R y al final del recorrido, estará idealmente cómodo con la aplicación de R a sus datos y algunos problemas analíticos.

Personalmente prefiero tener una visión más amplia de Data Science en Udacity, y luego profundizar en la pista de Coursera Data Science si me tomo en serio poner R en mi caja de herramientas.

Actualmente estoy tomando Udacity Data Aanalyst Nanodegree pero siento que la serie de cursos carece de muchos materiales para el “aprendizaje a su propio ritmo”. Por ejemplo, solución y materiales de aprendizaje adicionales. A medida que avanzamos en la clase, me preocupa cada vez más que solo estoy aprendiendo un poco. Dado que el programa es muy nuevo, el curso definitivamente podría mejorar, pero en este punto, no puedo recomendar a alguien que acaba de comenzar a aprender ciencia de datos. Espero que ayude 🙂

Hola,

¿Sería posible completar el nano grado de analista de datos en 2/3 meses con un aprendizaje acelerado, sin estar seguro de que esté basado en una línea de tiempo?
Estoy en una etapa de transición profesional y me gustaría acelerar el aprendizaje si es posible.

Gracias,
Andy