Hay dos reglas simples
Primero, tenga en mente la pregunta específica que está tratando de responder o formular hipótesis. Te servirá de guía para ti.
Segundo, visualice los datos, haga gráficos. Ayuda a comprender la gran cantidad de datos a través de imágenes. La visualización es un paso muy importante para encontrar las respuestas que busca.
- ¿Cómo aprender a analizar datos? No programación, ni minería, etc., sino saber cómo analizar conjuntos de datos.
- ¿Cuántos desarrolladores tiene la empresa Tableau?
- ¿Cuáles son las habilidades necesarias para aprender big data?
- ¿Por qué hay tantos científicos de datos falsos e ingenieros de aprendizaje automático?
- ¿Cuál es la satisfacción laboral de los científicos de datos? ¿Para qué tipo de empresas ha trabajado o trabaja para ahora de alguna manera, y ahora es un científico de datos? ¿Qué responsabilidades e impacto ha influido en la empresa?
Por ejemplo, si tiene datos climáticos de EE. UU. De los últimos 15 años que contienen temperatura, humedad, pm2.5 y otras 10 variables y los datos son máximos en ciudad para el día de los últimos 15 años.
Ahora puede ver que estos vastos datos no son fáciles de analizar rápidamente, pero puede hacerlo si sigue las dos reglas anteriores.
Primero, ¿qué quieres saber? Q1.¿Quieres saber si Estados Unidos se está calentando? Q2 ¿Quieres saber si Nueva York es más húmeda que Washington hoy? Si tiene preguntas específicas como estas, entonces sabe qué pasos tomar.
Ahora visualice, es decir, para el gráfico Q1 un gráfico de líneas con el promedio de la temperatura de todas las ciudades en el eje yy los días en el eje x, para el gráfico de barras del gráfico Q2 con la temperatura actual en el eje y y las ciudades en el eje x. Obtendrá ambas respuestas.