Aquí está la perspectiva de un estudiante actual (a partir de enero de 2017) del certificado de Data Science.
Respuesta corta : si elige el conjunto correcto de cursos, el certificado de Harvard Data Science puede ser una excelente manera de ingresar al campo de la ciencia de datos. Obtiene un valor increíble por el tiempo y el dinero que invierte.
Respuesta larga :
- ¿Cuál es la mejor tecnología para procesar big data además de Hadoop y Spark?
- ¿Cuáles son los mejores 3 institutos de capacitación en el aula para un curso de ciencia de datos con certificación en Hyderabad?
- ¿Cuáles son los algoritmos de agrupamiento o clasificación para datos de series temporales? ¿Es posible usar estos algoritmos para detectar valores atípicos en datos de series temporales?
- ¿Podría el aprendizaje automático avanzado sacar a los científicos de datos del negocio?
- ¿Puedo duplicar los mismos datos para una tarea de clasificación en términos de aumento de datos?
Lo que obtienes del programa depende totalmente de los cursos que elijas. Tendrá que elegir los mejores cursos que se basan en sus antecedentes y, a veces, esperar a que se ofrezcan esos cursos. Desafortunadamente, no todos los excelentes cursos de Harvard están disponibles a través de la Escuela de Extensión, pero aún hay buena profundidad y amplitud en la lista. Vengo de una formación en ingeniería de software y mi objetivo era profundizar en las estadísticas y el aprendizaje automático. Así que elegí STAT E – 104, CS 109, CSCI E-81 y APMA-207. Estoy tomando todos los cursos en línea. Un poco sobre cada uno:
- ESTADO E 104 – Esta es una estadística básica aplicada. Le da una gran base en pruebas de hipótesis y regresión lineal. El profesor Michael Parzen era el instructor, y me gustó su forma de enseñar. Este curso me llevó alrededor de 25 horas semanales de trabajo. El único inconveniente era que tenía el examen de estilo de lápiz y papel que necesitaba un supervisor. Me costó mucho hacer que alguien supervisara mi examen y tuve que perder el examen final ya que mi supervisor desapareció. Esto probablemente no sea un problema si estás en los EE. UU.
- CS-109: este es el curso principal del programa que cubre casi toda la amplitud de la práctica de la ciencia de datos de una manera muy pragmática. Es difícil decir qué parte de este curso fue la mejor: las conferencias, los laboratorios, las tareas, todo fue simplemente increíble. Sin embargo, la carga de trabajo era muy alta. Tuve que pasar más de 40 horas en esto la mayoría de las semanas. Ahora CS-109 se divide en dos cursos, parte A y parte B. La mayor parte del contenido de la sesión de 2015 (la que tomé) está disponible abiertamente: CS109 Data Science
- CSCI E-81 – Conceptos básicos de aprendizaje automático y minería de datos, con muy pocas matemáticas de miedo. A diferencia de los otros cursos que tomé, este fue hecho especialmente para la escuela de extensión y se enseñó a través de conferencias en vivo. Este curso adopta un enfoque de “aprendizaje automático como un conjunto de herramientas” y cubre una amplia gama de algoritmos. El profesor lo empuja a leer muchos trabajos (y presentar uno a la clase) y también brinda apoyo para publicar algo por su cuenta. Hubo buenas tareas abiertas. La carga de trabajo fue de alrededor de 25 horas a la semana. Un curso alternativo es CS-181, que supongo que es un poco más pesado en matemáticas y enfatiza en un enfoque de modelado probabilístico para el aprendizaje automático. CS-181 no se ofrece durante todos los semestres.
- APMA-207 – Métodos estocásticos para análisis de datos, inferencia y optimización. Voy a tomar esto en el próximo semestre. Esto parece ser una gran combinación de temas en torno al análisis de datos bayesianos / probabilísticos y el aprendizaje automático. ( Actualización en julio de 2017 : Resultó ser un curso increíble. Parte del contenido está disponible abiertamente aquí: AM207. Cubre una gran cantidad de terreno dejando muchos consejos para aprender más. Creo que este curso me ha dado una base sólida para ve y explora dos libros que me resultaban un poco difíciles de abordar antes: Machine Learning de Kevin Murphy y Bayesian Data Analysis de Andrew Gelman. Otro libro utilizado en este curso – Replanteamiento estadístico – también es excelente.)
Hay muchos más cursos excelentes. En el lado de CS / systems, hay cursos como CS-165 y CS-265 que me parecen muy tentadores. STAT-110 es una joya de curso, pero no se ha ofrecido por un tiempo. Sin embargo, las conferencias y tareas están disponibles públicamente aquí: Estadísticas 110: Probabilidad, lo cual es genial. A menos que ya tenga una base sólida en probabilidad, diría que esto debería considerarse un curso obligatorio, aunque no obtiene crédito por ello. Por otro lado, muchos de los cursos de estadística más avanzados como STAT 111, STAT 171 y la mayoría de los cursos CS y STAT de nivel de posgrado de la serie 200 no están disponibles a través de la Escuela de Extensión. Recientemente parecen centrarse más en crear más cursos personalizados para la Escuela de Extensión.
Para mí, quizás la parte más difícil es detenerse en cuatro cursos :-). Hubiera sido genial si hubiera una manera de continuar para una maestría en ciencia de datos o estadística después de que uno haya completado los cuatro cursos necesarios para este certificado. Actualmente, sus únicas opciones son títulos de posgrado en sistemas de gestión de la información o ingeniería de software, que requieren muchos cursos irrelevantes (para ciencia de datos).
Ahora, ¿cómo se compara este certificado con el autoaprendizaje o tomar una serie de MOOC? Veo un par de cosas:
- Por lo general, la profundidad y el rigor de un curso de Harvard es mucho mayor en comparación con un MOOC.
- Suele haber más atención individual. Los TA siempre están dispuestos a pasar tiempo por usted. Sus asignaciones son evaluadas por los instructores (o TA’s para algunos cursos), lo que a veces genera comentarios valiosos. El sistema de soporte es excelente.
- Sus compañeros de clase a menudo están muy motivados y tienen conocimientos, lo que lleva a una interacción y colaboración significativas.