¿Cuál debería ser mi primer enfoque para comenzar a aprender análisis de datos?

Gracias por el A2A.

Tomaré una dirección diferente a otras respuestas de Quora sobre ‘dónde debería comenzar a aprender análisis de datos / análisis / ciencia de datos’.

La mayoría de las respuestas comienzan con cursos para tomar, herramientas para aprender o teoría para estudiar. Echa un vistazo a [herramienta de marca], [instructor de una famosa compañía de tecnología] y [libro de texto de profesor conocido].

Estos son importantes, pero secundarios. Y lo llevará a un camino hacia un universo inmenso e interminable de cosas para estudiar sin llegar al corazón de la analítica. Confunde persuadir a las personas de que conoces el análisis de datos , de hacerlo realmente bien .

El problema es que no puedes aprender algo hasta que ya casi lo sepas. y la alternativa es comenzar exactamente desde donde se encuentra y aprender a pensar como un analista de datos .

Creo que lo primero que debe hacer es sumergirse en un problema, aprender todo lo que pueda sobre él, hacer muchas preguntas y formular muchas hipótesis. Es solo entonces que está en el lugar correcto para buscar datos, y es solo con los datos en la mano y una idea clara de lo que desea probar, que las herramientas realmente se vuelven urgentemente cruciales.

Y lo segundo más cercano es conseguir una guía. El análisis de datos no es un dominio procesal bien estructurado. Cada problema de datos no es una lista de tareas para completar, sino una tierra para explorar. Hacer cosas es fácil, pero descubrir lo mejor que puede hacer no lo es.

No conozco tus antecedentes, pero supongamos que tienes un sólido conocimiento de lo siguiente:

  • Resolver problemas verbales de matemáticas de nivel secundario (estos son problemas matemáticos que se describen en forma narrativa, no con notación matemática).
  • Álgebra y geometría de secundaria
  • Álgebra lineal básica (qué son los vectores y cómo hacer manipulaciones matriciales básicas. Además, debe conocer la vista geométrica y algebraica de lo que representa Ax = b y Ax = cx)
  • Funciones básicas de Excel u otra herramienta de hoja de cálculo (es decir, ¿qué utiliza cuando no puede / no quiere hacer cosas a mano?)
  • Cálculo e interpretación de estadísticas descriptivas simples y gráficos asociados (media / mediana / modo, varianza / desviación estándar / correlación, histograma / recuadro y bigotes / diagrama de dispersión)
  • Probabilidad básica e inferencia estadística. Debe sentirse cómodo calculando probabilidades simples para cosas como dados y lanzamientos de monedas . ¿Sabes cómo calcular lo raro que es obtener, digamos, 10 caras en 15 lanzamientos cuando suponemos que la moneda es justa?

El conocimiento anterior generalmente implica que ha alcanzado un nivel adecuado de aritmética para comenzar a profundizar en la analítica .

Debes tener todo lo anterior si te especializaste en algo cuantitativo (ingeniería, estadística, informática, física / química) en la universidad. Si no es así, eche un vistazo a los muchos, muchos MOOC, bootcamps, OpenCourseware y simples cursos universitarios que puede tomar para básicamente “sentirse cómodo con los números y el pensamiento cuantitativo” … luego vuelva a esta publicación (y las otras publicaciones aquí) y continuar. Esta es la razón por la cual la mayoría de los anuncios de trabajo quieren que tenga un BS (como mínimo) en algo cuantitativo.

Dado el nivel básico de aritmética anterior, es probable que desee comenzar con algunos cursos / secuencias de encuestas sólidas sobre análisis. Esto no solo lo expondrá a la amplia gama de temas que necesitará dominar, sino también dónde están sus debilidades y qué áreas le gustan o no le gustan (pista: nadie logra una verdadera experiencia en todo en análisis, nos centramos en nuestras fortalezas /intereses).

Eché un vistazo a Coursera y parece tener algunas buenas opciones si no quieres gastar mucho dinero.

Nota: Los recomiendo después de navegar por su contenido y / o haber escuchado cosas buenas sobre ellos de otros … No los he tomado yo mismo. Según su contenido publicitado, es posible que desee analizarlos en el siguiente orden:

  1. Estadísticas con R: Se enfoca en conceptos estadísticos centrales utilizando el poderoso y ampliamente utilizado (¡y gratis!) Entorno de programación R.
  2. Excel a MySQL: esto está más centrado en las herramientas, pero le garantizo que terminará usando al menos uno de estos: una base de datos habilitada para SQL, una hoja de cálculo de Excel o un libro de trabajo de Tableau … ¡están en todas partes!
  3. Business Analytics: tiene una perspectiva diferente: enfóquese en las especializaciones temáticas (análisis de personas, análisis de operaciones) en lugar de métodos o herramientas.
  4. Ciencia de datos aplicada con Python: Ok … ahora las cosas “geniales”: aprendizaje automático [generalmente son modelos estadísticos mejorados centrados en la predicción]. Un beneficio secundario de esta secuencia del curso es que también aprenderás algo de Python. Ahora has trabajado con Excel, R y Python 🙂

Por supuesto, obtener una Maestría en Ciencia de Datos / Análisis / Investigación de Operaciones / Estadísticas también es una ruta excelente, aunque costosa y exigente, para prepararse para una carrera en análisis. Hay muchas buenas escuelas por ahí, así que si sigues este camino, te sugiero que obtengas ayuda de un asesor / consejero académico local.