¿Cuáles son algunas de las revisiones de Big Data y el certificado de análisis social de MITx?

Entonces, finalmente terminé con este curso y pensé en publicar una revisión para el mismo.

Entonces, aquí tienes!

Creo que deberíamos tener una sección especial en la introducción de este curso, que indique claramente, de qué NO se trata esto:

¿Hay algún científico de datos en la Antártida?
¿Qué es la ciencia de datos? ¿Cuál es el alcance? ¿El análisis de datos y el análisis comercial son lo mismo? ¿Necesitamos estudiar programación?
¿Qué es una fuente de datos?
¿Cuál es el mejor idioma para aprender para convertirse en analista de datos?
¿Qué me preparará mejor para convertirme en científico de datos: un título universitario relevante o autodidacta a través de Coursera, Kaggle y proyectos paralelos?

– No se trata de aprender Python para la ciencia de datos. Debes aprender numpy, pandas, matplotlib en otros cursos. Este curso no es para aprender la parte de ciencia de datos de Python.
– Este curso no se trata de hadoop / MapReduce / hdfs, no, no hablamos de nada de eso. Esa parte está relacionada con la infraestructura de datos y no se enseña / usa en este curso. Motivo Estoy diciendo esto explícitamente porque la mayoría de los novatos relacionan “BigData” con “Hadoop”.
– Este curso no se trata de aprender Machine Learning, donde puedes entender los conceptos básicos de regresión, descenso de gradiente, tasa de aprendizaje, regresión lineal / logística, propagación hacia adelante / atrás, bosque aleatorio, Xgboost, etc. Solo tenemos algunas líneas de introducción de lo mismo. Por ejemplo, si no comprende el término “sobreajuste”, podría sorprenderse cuando se use ese concepto.
– Este curso no trata sobre el aprendizaje de Nueral Network o el aspecto matemático de Deep Learning.
– Este curso no se trata de leer o analizar datos / sentimientos de Facebook o Twitter. Esto fue confuso para mí ya que usa la palabra “Social Analytics”.

Finalmente,

Por supuesto, este curso me ha dado información sobre la estrategia sobre la ubicación y el análisis de datos de llamadas celulares, a qué se puede aplicar y a gran escala y habilidades artísticas similares, pero no me dijo cómo puedo analizar los datos simples. conjunto, que tiene 3 mil millones de puntos de datos. El portátil iPython no se escalará independientemente de cuál sea la escala o la huella de la máquina.

Entonces, ¿de qué se trata este curso?

Pocas respuestas son:
– Estrategia de cómo capturar datos.
– Cómo analizar esos datos e intentar obtener información mediante visualizaciones sorprendentes.
– Cómo realizar la agrupación en puntos de datos.
– Cómo realizar identificaciones de patrones en los datos de ubicación.
– Cómo usar la API de los mapas de Python para visualizar datos en los mapas.
– Cómo ver valores atípicos en la muestra.
– Conozca los marcos escritos del MIT (Framework y Bandicoot) para la recopilación de datos en el teléfono y cómo encontrar información de esos datos con mucha facilidad.
– Preocupaciones relacionadas con la privacidad como científico de datos.
– Conocer los estudios de casos famosos realizados.

Y muchas más habilidades sobre ciencia de datos.

Entonces, amigos, según mi entendimiento:

Únete a este curso:
– si desea aprender Estrategia y conceptos sobre big data.
– Si desea comprender el flujo específico de la ciencia de datos para analizar la ubicación y los metadatos de los metadatos del teléfono celular.
– Si quiere escuchar al erudito del MIT y al gran Alex ‘Sandy’ Pentland.

Únete a otra cosa:
– Si desea aprender la aplicación básica de pitón y pitones en ciencia de datos como matplotlib, numpy, pandas.
– Si quieres aprender Machine Learning desde cero. por ejemplo, el curso de Andrew Ng (este es el estándar de oro para el curso de aprendizaje automático, ¡matemáticas muy básicas!)
– Si quieres aprender Hadoop / Mapreduce / Hdfs / Pig / Hive / Kafka, etc.

Una de las cosas más importantes que debes saber es:

No tenemos el tipo de ambiente de clase, donde cada maestro del MIT viene y da una conferencia para cada tema para cada semana del curso. En cambio, lo que han hecho es que alrededor de 5 maestros del MIT se sentaron de una vez cada uno y hablaron sobre el tema, que se grabó y se dividió en videos de 5 a 12 minutos cada uno y se presentan como semanas. ¿Por qué importa esto? porque eso significa que no tienes acceso a la gente del MIT en los videos durante el curso. No puede hacerles preguntas, pero tiene un apoyo limitado del tutor principal, que supongo que son expertos en el tema en cuestión, pero no obtuve mucho de ellos.

Ok, suficiente !!, ya me aburrí incluso a mí mismo 🙂

Feliz inclinada AI guerreros del mañana.