¿Cuáles son algunas de las revisiones de Big Data y el certificado de análisis social de MITx?

Entonces, finalmente terminé con este curso y pensé en publicar una revisión para el mismo.

Entonces, aquí tienes!

Creo que deberíamos tener una sección especial en la introducción de este curso, que indique claramente, de qué NO se trata esto:

– No se trata de aprender Python para la ciencia de datos. Debes aprender numpy, pandas, matplotlib en otros cursos. Este curso no es para aprender la parte de ciencia de datos de Python.
– Este curso no se trata de hadoop / MapReduce / hdfs, no, no hablamos de nada de eso. Esa parte está relacionada con la infraestructura de datos y no se enseña / usa en este curso. Motivo Estoy diciendo esto explícitamente porque la mayoría de los novatos relacionan “BigData” con “Hadoop”.
– Este curso no se trata de aprender Machine Learning, donde puedes entender los conceptos básicos de regresión, descenso de gradiente, tasa de aprendizaje, regresión lineal / logística, propagación hacia adelante / atrás, bosque aleatorio, Xgboost, etc. Solo tenemos algunas líneas de introducción de lo mismo. Por ejemplo, si no comprende el término “sobreajuste”, podría sorprenderse cuando se use ese concepto.
– Este curso no trata sobre el aprendizaje de Nueral Network o el aspecto matemático de Deep Learning.
– Este curso no se trata de leer o analizar datos / sentimientos de Facebook o Twitter. Esto fue confuso para mí ya que usa la palabra “Social Analytics”.

Finalmente,

Por supuesto, este curso me ha dado información sobre la estrategia sobre la ubicación y el análisis de datos de llamadas celulares, a qué se puede aplicar y a gran escala y habilidades artísticas similares, pero no me dijo cómo puedo analizar los datos simples. conjunto, que tiene 3 mil millones de puntos de datos. El portátil iPython no se escalará independientemente de cuál sea la escala o la huella de la máquina.

Entonces, ¿de qué se trata este curso?

Pocas respuestas son:
– Estrategia de cómo capturar datos.
– Cómo analizar esos datos e intentar obtener información mediante visualizaciones sorprendentes.
– Cómo realizar la agrupación en puntos de datos.
– Cómo realizar identificaciones de patrones en los datos de ubicación.
– Cómo usar la API de los mapas de Python para visualizar datos en los mapas.
– Cómo ver valores atípicos en la muestra.
– Conozca los marcos escritos del MIT (Framework y Bandicoot) para la recopilación de datos en el teléfono y cómo encontrar información de esos datos con mucha facilidad.
– Preocupaciones relacionadas con la privacidad como científico de datos.
– Conocer los estudios de casos famosos realizados.

Y muchas más habilidades sobre ciencia de datos.

Entonces, amigos, según mi entendimiento:

Únete a este curso:
– si desea aprender Estrategia y conceptos sobre big data.
– Si desea comprender el flujo específico de la ciencia de datos para analizar la ubicación y los metadatos de los metadatos del teléfono celular.
– Si quiere escuchar al erudito del MIT y al gran Alex ‘Sandy’ Pentland.

Únete a otra cosa:
– Si desea aprender la aplicación básica de pitón y pitones en ciencia de datos como matplotlib, numpy, pandas.
– Si quieres aprender Machine Learning desde cero. por ejemplo, el curso de Andrew Ng (este es el estándar de oro para el curso de aprendizaje automático, ¡matemáticas muy básicas!)
– Si quieres aprender Hadoop / Mapreduce / Hdfs / Pig / Hive / Kafka, etc.

Una de las cosas más importantes que debes saber es:

No tenemos el tipo de ambiente de clase, donde cada maestro del MIT viene y da una conferencia para cada tema para cada semana del curso. En cambio, lo que han hecho es que alrededor de 5 maestros del MIT se sentaron de una vez cada uno y hablaron sobre el tema, que se grabó y se dividió en videos de 5 a 12 minutos cada uno y se presentan como semanas. ¿Por qué importa esto? porque eso significa que no tienes acceso a la gente del MIT en los videos durante el curso. No puede hacerles preguntas, pero tiene un apoyo limitado del tutor principal, que supongo que son expertos en el tema en cuestión, pero no obtuve mucho de ellos.

Ok, suficiente !!, ya me aburrí incluso a mí mismo 🙂

Feliz inclinada AI guerreros del mañana.

Como no hay revisión disponible para este curso, era muy reacio y no podía decidir si este es el curso correcto para mí o no, ya que estoy trabajando como administrador de la base de datos y quería cambiar en Data Analytic \ Science. Realicé diferentes cursos y finalmente decidí unirme a este curso teniendo en cuenta los siguientes puntos, que comenzarán a partir del 11 de julio de 2016 y proporcionarán mi revisión pronto.

  1. Valor de la certificación MIT.
  2. Teniendo en cuenta el futuro del análisis de datos y las ciencias sociales.
  3. Aprendí de primera mano del instructor del MIT y vivo en MA, así que espero tener la oportunidad de conocerlos en persona 🙂
  4. Proporcionar una base sólida a mi operador de análisis de datos.
  5. Teniendo en cuenta la inversión a largo plazo para el avance de mi operador.

La única desventaja que he encontrado sobre el costo de este curso, es decir, $ 2300 – 2500.

Estoy tomando la segunda ronda de este curso, se actualizará con comentarios. Hasta ahora no tengo reparos en GetSmarter, parece que realmente intentan hacer un buen trabajo, y el nivel de soporte es mucho más alto que, por ejemplo, en Coursera (como cabría esperar, dado el precio). Me parece que su plataforma (basada en Moodle) es un poco menos madura que la de Coursera. Sin embargo, funciona bien.

Estoy empezando a tener la sensación de que esto será mucho menos técnico de lo que inicialmente esperaba. Ya veremos, quizás las tareas “extra / bonus” serán desafiantes. Será interesante ver los aspectos no técnicos también.

[editar] Entonces, ahora estoy a más de la mitad del curso (módulo 6 de 8), y no espero que se vuelva más desafiante en el futuro. Aquí están mis conclusiones hasta ahora:

  • El curso ES interesante, desde la perspectiva de la “física social”. Aprendí muchas cosas nuevas (especialmente ideas sobre el comportamiento humano) … pero no muchas cosas técnicas nuevas.
  • Aprenderá sobre algunas bibliotecas de MIT (funf / bandicoot), que de hecho parecen bastante geniales, aunque no estoy seguro, aunque muchas personas podrán usarlas en el futuro (probablemente no lo haré, pero OTOH … quién sabe, tal vez lo haré )
  • No se trata realmente de “big data”. Quiero decir, sí, menciona big data, introduce algunos términos / definiciones, etc., pero no aprenderá nada práctico sobre big data. Realiza tus tareas en una máquina virtual EC2 con poca potencia, en python … así que cualquier tipo de análisis de “big data” está realmente fuera de discusión. Aprende que “existe el big data”, pero realmente no trabaja con él.
  • Intenta enseñarte cosas técnicas (por ejemplo, teoría de gráficos, aprendizaje automático) … pero no estoy seguro de qué tan bien tiene éxito. Si ya sabes esto (lo hice), entonces todo lo que tienes que hacer está en un nivel bastante básico; si aún no sabes estas cosas, entonces puede ser demasiado complicado, demasiado, y las explicaciones no son lo suficientemente detalladas para que realmente entiendas lo que estás haciendo (todo esto es especulación de mi parte, ya que no estaba en esta situación).
  • Sin embargo, incluso si eres experto en las áreas técnicas cubiertas por el curso, puedes aprender cosas nuevas / conceptos nuevos (lo hice), lo cual es bueno, es solo que realmente no se enseñan en el curso, solo obtienes un algunos consejos y tendrás que estudiarlos tú solo.

En resumen, para mí hasta ahora hubo dos grandes victorias de este curso: (A) los aspectos “sociales” (comportamiento humano) del curso; (B) algunos consejos / menciones de tecnologías interesantes que no conocía. En general, no lamento haber tomado este curso, a pesar de que resultó ser diferente de lo que originalmente esperaba.

El esquema del curso se ve muy interesante. Nunca me he preocupado por los certificados porque, a diferencia de los campos tradicionales, los estándares cambian demasiado rápido y el conocimiento es mejor que un certificado.

More Interesting

¿Cuáles son algunas de las arquitecturas de big data más complejas con análisis que conoces?

¿Cómo se puede utilizar Data Science en el sector de las telecomunicaciones?

¿Qué es la "fuga de datos" en la ciencia de datos?

¿Cuáles son las mejores herramientas de software para trabajar con grandes conjuntos de datos financieros (> 50 gb), por ejemplo, datos de acciones de CRSP?

En la era del aprendizaje automático, IA, big data, etc., ¿qué tan útil es estudiar campos ya maduros como CS teóricas y bases de datos relacionales a nivel de posgrado, y luego pasar a la industria del software?

¿Qué es una explicación intuitiva de una regresión multivariada?

(MS en ciencia de datos) VS. (Maestría en certificación CS + en ciencia de datos), ¿qué ruta es mejor?

¿Qué se puede inferir de esta gráfica de función de autocorrelación con pendiente descendente totalmente positiva?

¿Debo ir a UC Davis o UC Berkeley para estudiar Estadística?

¿Cuál es el mejor IDE de Python para análisis de datos / ciencia?

¿Cuáles son los valores reales de Kaggle?

¿Cuáles son las herramientas y tecnologías recomendadas más recientes para el análisis y visualización en tiempo real utilizando los datos de Twitter?

¿Cuáles son algunos proyectos que un estudiante de ciencias de la computación puede hacer en el semestre final en el campo de big data y análisis de datos?

¿Cómo influye Big Data en la gestión del talento?

En la era de Big Data, ¿cómo elegimos información efectiva?