¿Cuál es la diferencia entre la pista de ciencia de datos de Coursera (a través de Johns Hopkins) y el nano grado de analista de datos de Udacity?

Hola, creo que puedo ayudar en esto ya que completé la Especialización en ciencia de datos de Coursera y actualmente estoy a la mitad del Grado de Analista de Datos de Udacity.
En primer lugar, ambos son geniales, no hay duda de eso.

En Udacity tiene acceso a todo el material de una vez, por lo que realmente puede hacerlo a su propio ritmo. En Coursera pasé mucho tiempo inactivo porque completé la lección de la semana y no tenía nada más que hacer. Además, terminé mi último curso en enero y el capstone solo estaba disponible en marzo, así que otro mes “esperando” (el capstone del curso es realmente divertido e interesante, por cierto)

Creo que Coursera podría reestructurarse un poco, el primer curso “el kit de herramientas del científico de datos” podría completarse en un día o dos para ser honesto, mientras que tienen un curso de 30 días de “inferencia estadística” que no tiene tiempo suficiente para enseñar qué te preguntan sobre el proyecto.
Por otro lado, Udacity asume cierto nivel de conocimiento estadístico. Debes realizar t-tets en el primer curso que no te enseñan con gran detalle (te muestran cómo ejecutar el código, pero depende de ti entender qué está pasando), pero ofrecen lo mejor Cursos estadísticos descriptivos e inferenciales en línea que he visto (no son parte de la especialización, pero son gratuitos)

El nivel de soporte que obtienes de Udacity es algo que también debes considerar. Mientras que en Coursera confían en los TA de la comunidad (ex alumnos que respondieron preguntas en los foros; nunca he escuchado de los instructores durante los 9 cursos), en Udacity, tienen entrenadores que están disponibles para responder sus preguntas (y son excelentes en eso). Además, tienen mucha más interacción contigo. Hay “horas de oficina” todas las semanas para hablar sobre los proyectos, Hangouts de Google sobre temas específicos (he visto sobre t-test, pca por ejemplo) y leo en alguna parte (no sé si es cierto) que puede programar Citas de 1 a 1 con los sofás (probablemente debería enterarse de eso)

Cuando se trata de ejercicios, en Coursera generalmente tienes 2 proyectos por curso + 4 cuestionarios (los proyectos fueron una gran oportunidad para aprender, no recuerdo haber aprendido demasiado de los cuestionarios). Udacity exige mucho más de ti al realizar pequeños cuestionarios en cada video (que son triviales pero te obligan a prestar atención), varios ejercicios completos (bastante complejos en algún momento) durante la lección y en cada capítulo, tienes un proyecto final, que Algunos casos pueden ser tan complejos como el proyecto final de Coursera.

¿Qué más? Tecnología: Udacity cubre muchas más tecnologías: R, python, mongo, D3.js, mientras que Coursera se enfoca en R pero enseña muy bien otras cosas como RPubs y R markdown (que Udacity no pide pero pide uno del proyecto para terminar con eso).

Un punto extra para Udacity que vale la pena mencionar: excelente aprendizaje automático. Realmente completo, cubre varios algoritmos y técnicas con gran detalle, mientras que Coursera se enfoca en ejecutar comandos en el paquete caret sin realmente decirle qué sucede detrás de escena.

Espero haber podido ayudar.

Divulgación : escribí esto cuando aún era estudiante / graduado. Desde entonces, me di cuenta de que creía en la misión de Udacity con tanta fuerza que solicité un trabajo allí, ¡y entré! Todo debajo de esta línea es el original sin editar.

Algún contexto: tomé el Nanodegree de Analista de datos de Udacity (DAND) y completé tres cursos en la Especialización en ciencia de datos de Coursera / JHU , incluido el Aprendizaje automático práctico (PML). Estas son, por supuesto, mis opiniones: soy parcial al programa DAND de Udacity.

El DAND de Udacity ofrece una pista muy completa que está muy orientada a proyectos, con cobertura en amplitud y profundidad: Python, scikit-learn, machine learning, R, análisis de datos exploratorios, MongoDB y bibliotecas de visualización como D3.js y dimple.js . La pista de ciencia de datos de JHU solo usa R, pero aún cubre la gama completa de la “caja de herramientas” de un analista de datos. Además del curso de PML, tomé los dos primeros: la caja de herramientas de Data Scientist y la programación de R. Estaba realmente decepcionado de ellos, habiendo terminado ambos el mismo día que comencé. No obstante, creo que es más apropiado comparar la experiencia entre PML y el curso y proyecto de aprendizaje automático DAND.

El curso de PML fue “más ancho que profundo”. Fue genial obtener exposición a varios algoritmos de aprendizaje automático en las conferencias, así como los antecedentes teóricos y académicos. Sin embargo, al igual que los dos primeros cursos en la especialización, no encontré el proyecto muy desafiante. Realmente no tuve una sensación de aprendizaje o logro después de completar el proyecto. El proyecto implicó la aplicación de un algoritmo de aprendizaje automático para clasificar ejercicios físicos basados ​​en datos del sensor. Aquí hay un enlace a mi informe: Proyecto práctico de aprendizaje automático. Fue fácil obtener una precisión de predicción del 100%, y me llevó solo unas pocas horas completarlo.

En contraste, ¡el curso y el proyecto de aprendizaje automático de DAND fueron extremadamente desafiantes! El proyecto fue ” Identificación de fraudes de correos electrónicos y datos financieros de Enron “: allanbreyes / udacity-data-science. El proyecto fue extremadamente abierto y el conjunto de datos fue real y desafiante. Fue difícil obtener incluso un 30% de precisión de predicción, y creo que es más representativo de los datos del mundo real que un analista tendría que piratear en la industria. Este proyecto tardó fácilmente entre 20 y 40 horas en completarse. Para mí, esta era la mejor manera de aprender: ensuciarme las manos y profundizar en un problema desafiante para aplicar la teoría.

Creo que eso describe la diferencia central entre los dos programas. El seguimiento de la ciencia de datos de JHU es más académico, mientras que el DAND de Udacity está más centrado en la industria y los proyectos. Dejará JHU con un certificado universitario y dejará el DAND con una cartera de proyectos. (Y el soporte de servicios profesionales para ayudarlo a conseguir un trabajo de analista de datos).

Para ser claros, creo que ambos son excelentes programas que vale la pena hacer. Si incluye los otros cursos introductorios de estadística ofrecidos en Udacity fuera del DAND, creo que ambos programas son amigables para principiantes y cubren la “pila completa” de ciencia de datos. Sin embargo, debo admitir que mi experiencia con el DAND fue más formativa. Creo que un buen combo para mí fue tomar el DAND completo y usar los cursos de ciencia de datos de JHU para complementar cualquier tema sobre el que quisiera seguir estudiando.

He probado las aguas en ambos, y generalmente diría que el “programa” de Udacity es más difícil de manejar con solo usar la interfaz; realmente dependen del modelo de tener entrenadores útiles para ayudar a los estudiantes a atravesar el proceso, ambos en términos de obstáculos para el aprendizaje y general y la usabilidad de su sistema de aprendizaje en particular. Auditar las clases de Udacity es divertido pero difícil de desarrollar. La interfaz de Coursera con los cursos de Johns Hopkins es muy sencilla, los instructores han estado ajustando sus clases durante un par de años y uno puede volver al material de varias maneras fáciles y accesibles. Lo que no quiere decir que el programa Coursera sea perfecto, al menos no para un novato como yo, más o menos. Pasé las primeras clases en la pista con relativa facilidad, pero tuve un tiempo mucho más difícil en la tercera pista (aunque “pasé”, lo que sea que eso signifique) y me detuve en la cuarta. Creo que las pistas posteriores no son factibles sin reservar realmente un tiempo de estudio serio, y tiempo para jugar con los datos y el software y cometer errores y hacer que su sistema no funcione correctamente, en los períodos de cuatro semanas asignados a cada curso.

Hola y gracias por el A2A.

No hice ninguno de los cursos de Udacity, así que no tengo una base para comparar la calidad. Asumiendo que está interesado principalmente en el contenido, desde la lectura de la descripción del curso de Udacity y desde mi experiencia con Coursera, las diferencias que veo son:

  • Udacity asume conocimiento previo en inferencia estadística. Uno de los cursos de Coursera es de inferencia estadística. Yo diría que ambos suponen conocimiento de estadística descriptiva. Udacity lo dice, Coursera no lo hace si recuerdo correctamente.
  • Udacity asume conocimientos previos de programación, especialmente Python. Uno de los cursos de Coursera es la programación R, el único lenguaje que necesitará para la especialización.
  • Coursera es, en mi opinión, más académico. Distingue la ciencia de datos de big data y se enfoca en la parte científica de la ciencia de datos. Por ejemplo, se preocupa por la investigación reproducible y la creación de productos de datos que un científico de datos puede compartir y discutir. Si bien eso es muy útil en un entorno corporativo, es (nuevamente en mi humilde opinión) una preocupación mayor en el contexto de investigación y academia.
  • El enfoque de Udacity es, en mi opinión, más corporativo. Expone al estudiante a cosas como MapReduce, MongoDB sin olvidar a mi querido amigo R. Tiene una parte de visualización que es muy importante para el profesional. Para darle un poco de contexto, el conocimiento que obtuve de la investigación reproducible es muy útil para discutir internamente en mi trabajo con otros analistas. Podemos revisar los datos, el proceso y la mentalidad, aplicar nuevos conjuntos de datos y discutirlos fácilmente. Sin embargo, para las partes interesadas, una visualización de contar historias es mucho más importante que la capacidad de reproducir la investigación.

¡Espero que esto ayude!

Ver

¿Vale la pena pagar 9 x $ 49 ($ 441) por una especialización en ciencia de datos en Coursera? ¿Alguien puede darme algunos buenos recursos para ciencia de datos, aprendizaje automático o minería de datos?

La especialización en ciencia de datos de Coursera contiene nueve cursos de la Universidad Johns Hopkins y un proyecto Capstone. Los estudiantes aprenderán cómo hacer preguntas científicas de datos, trabajar con conjuntos de datos y construir modelos de datos. El proyecto Capstone implica el uso de datos públicos para resolver un problema del mundo real, y la compañía dice que “se llevará a cabo con socios industriales, gubernamentales y académicos”. Cada curso, así como el proyecto, dura cuatro semanas, por lo que el Todo el programa debería tardar 40 semanas en completarse. El costo total del programa es de $ 490 ($ 49 por cada certificado verificado + $ 49 por el proyecto).
@ Revista Internacional de Nano Ciencia y Tecnología