Hola,
He publicado una revisión detallada de la Especialización en Ciencia de Datos de la Universidad Johns Hopkins, que se ofrece en Coursera.
Divulgación completa: actualmente trabajo en Udacity. Trataré de enmarcar mis comentarios en términos de mis experiencias como aprendiz.
- ¿Cuál es una lectura más útil para alguien interesado en la investigación de LA: "Teoría del aprendizaje estadístico" de Vapnik, o "Elementos del aprendizaje estadístico" de Friedman / Tibshirani / Hastie?
- ¿Cuál es su opinión sobre el curso de ciencia de datos de la Asamblea General?
- ¿MATLAB es más popular y útil para la investigación que Python? ¿Por qué?
- ¿Cuáles son algunos de los desafíos que enfrentan las personas cuando pasan de la academia a la ciencia de datos?
- ¿Cuáles son los mejores paquetes de R? ¿Por qué?
Especialización en ciencia de datos de la Universidad John Hopkins
Herramientas:
- R / RStudio
Fortalezas:
- Tomar la clase con otras personas en la especialización ciertamente ayudó.
- Los foros están bien organizados y es fácil buscar información o hacer preguntas.
- Disfruté de la evaluación por pares de los proyectos, aunque perdí puntos en dos de los proyectos y nunca supe por qué.
Luchas:
- Algunos cursos cubrieron demasiado material demasiado rápido.
- Quería más preguntas, cuestionarios o evaluaciones en los cursos para practicar.
- Los foros fueron más tranquilos hacia las últimas tres clases ya que no muchos estudiantes llegaron al final.
- Tuve que aprender mucho por mi cuenta para llenar los vacíos e hice uso de los foros para que mis compañeros respondieran mis preguntas.
Disfruté aprendiendo más sobre R y aprecié tres de los cursos en particular: Análisis de datos exploratorios, Investigación reproducible y Aprendizaje automático práctico. Es increíble que estas clases se ofrezcan de forma gratuita o por una pequeña tarifa (la versión paga verifica su identidad, le permite completar el Proyecto Capstone y le otorga un certificado al completar con éxito un curso). Felicitaciones a todos los involucrados de Coursera y JHU.
Para estar completamente preparado para la especialización, creo que necesita una exposición previa al álgebra lineal y clases avanzadas de estadística para completar toda la especialización, especialmente los modelos de inferencia estadística y regresión.
Los 9 cursos lo familiarizarán con el lenguaje de programación R; sin embargo, en su estado actual, no recomiendo usar la especialización como una forma de aprender los detalles de los algoritmos de Estadística y Aprendizaje automático (cómo funciona matemáticamente un algoritmo).
Si te esfuerzas más y no te importa investigar temas por tu cuenta (es decir, ser un emprendedor y ser curioso / ingenioso cuando te quedas estancado), entonces creo que puedes avanzar a través de la especialización.
Analista de datos de Udacity Nanodegree Program
He tomado 4/5 clases en el programa. Nota: Tomé estas clases una a la vez y no con una cohorte como lo harías en el programa Nanodegree.
Los cursos cubren tanto la teoría como la práctica de la ciencia de datos, y cada curso termina con un proyecto que le permite demostrar lo que aprendió.
Desarrollé dos de los cursos y proyectos finales. Todos los proyectos fueron diseñados para brindarle experiencia práctica con el material del curso y permitirle ir más allá de la descripción básica del proyecto si lo desea. Los proyectos pueden ser el comienzo de su cartera de trabajo para compartir con otros, especialmente los reclutadores.
Herramientas:
- Python (pandas, biblioteca de visualización ggplot2, scikit-learn)
- MongoDB
- R / RStudio (paquetes para visualizar y manipular marcos de datos: ggplot2, dplyr, reshape2)
- dimple.js y d3.js (bibliotecas de visualización)
Fortalezas
- Los cursos se crearon en colaboración con la industria y los expertos para que aprenda haciendo y aprenda cómo piensan los expertos acerca de los problemas empresariales / de datos.
- Preguntas frecuentes y oportunidades para practicar en lecciones, conjuntos de problemas o miniproyectos.
- Los proyectos finales son interesantes, desafiantes y le permiten demostrar lo que aprendió.
- Recursos adicionales y descargables. Puedo descargar videos para verlos en mi teléfono y explorar recursos adicionales para temas específicos.
Luchas:
No tengo una verdadera experiencia de aprendizaje ya que tuve acceso personal a instructores, entrenadores e ingenieros de Udacity. Animo a otros que se han inscrito en cualquiera de las clases individualmente o en el Data Science Nanodegree para que agreguen su voz.
Para todos los cursos, incluí un enlace a las páginas de descripción general del curso si desea obtener una visión más profunda del contenido del curso y los proyectos finales.
Introducción a la ciencia de datos, el primer curso proporciona una visión general del campo y lo expone a ideas cubiertas más profundamente en las siguientes cuatro clases. Obtendrá una visión general del proceso de hacer ciencia de datos y se familiarizará con los pandas, la biblioteca de trazado ggplot2 y la reducción de mapas.
La disputa de datos con MongoDB le enseña habilidades para trabajar con conjuntos de datos desordenados. Aprenderá sobre formatos de datos (JSON, CSV, XML, utilizando API web), calidad de datos, agregación / análisis de datos y MongoDB (una base de datos noSQL).
El análisis de datos con R le enseña a visualizar y explorar un conjunto de datos. En el curso, aprenderá el lenguaje de programación R y adquirirá técnicas de visualización mientras resume las variables, examina las distribuciones, piensa en valores atípicos / anomalías e investiga conjuntos de datos.
Introducción al aprendizaje automático es el curso que aún no he tomado. Cualquier comentario apreciado.
Visualización de datos y D3.js enseña visualización de datos en el contexto de la ciencia de datos. Aprendes sobre principios de diseño, percepción humana y narración de historias. Al final de la clase, debería poder crear una visualización que comunique los resultados de los datos de manera clara y efectiva.
Si desea clases para temas CS más avanzados, le recomiendo que consulte los cursos creados en colaboración con Georgia Tech: Catálogo de cursos de Udacity.