Para responder a su primera pregunta:
El MS Business Analytics que busqué dio una amplia introducción al campo de la ciencia de datos, el aprendizaje automático, el análisis predictivo, la minería de datos y el análisis (hay tanta superposición entre esos términos que enumero todos aquí). Esto incluye
- Modelado predictivo: aprender a construir y evaluar un modelo que lo ayude a predecir o clasificar su variable dependiente.
- Minería de texto: incluía todo, desde nubes de palabras muy básicas a través del análisis de sentimientos ( “es el autor del texto enojado o feliz, …” ) hasta conceptos semánticos más complejos como Word2Vec (entender el significado detrás de las palabras)
- Optimización: Esto está estrechamente relacionado con cualquier curso de Ciencias de la Gestión o Investigación de Operaciones. Cuántos de esos artículos A y B se deben producir para maximizar los ingresos y minimizar el desperdicio.
- Visualización de datos: aprendimos a hacer gráficos efectivos para transmitir nuestro mensaje. El cerebro humano está mucho más enfocado para procesar información visual en lugar de texto y números. Utilizamos R y Tableau para contar historias.
- Análisis de Big Data: Cuantos más datos, más infraestructura necesita ser más eficiente. Básicamente, aplicamos algunas técnicas de minería de texto y modelado predictivo a conjuntos de datos a gran escala (> 1 GB) usando Hadoop y Spark
Para responder a su segunda pregunta:
- ¿Qué papel juegan las estadísticas en la ciencia de datos en comparación con habilidades como programación o visualización y comunicación?
- ¿Cuáles son ejemplos de datos secundarios?
- ¿Cuál es la diferencia entre big data, análisis, ciencia de datos, análisis de datos, minería de datos, inteligencia empresarial, econometría, estadística, aprendizaje automático (inteligencia artificial) y modelado matemático?
- ¿MATLAB es más popular y útil para la investigación que Python? ¿Por qué?
- Al usar una muestra para análisis estadístico, ¿cómo puedo asegurarme de que sea suficiente?
Data Science es una disciplina muy práctica enfocada . Puede ser bueno leer documentos de aprendizaje automático, pero realmente lo aprendes haciéndolo. Tome algunos de los famosos cursos introductorios en línea (Machine Learning | Coursera), compita en competencias de Kaggle, intente comprender cómo procedieron los ganadores. Durante su tiempo en la escuela, participe durante la clase, intente convertirse en un TA / RA, participe en proyectos de clase.
Así es como procedí en los últimos dos años para aumentar constantemente mi conocimiento de análisis. A partir de ahora, todavía hay forma de mejorar, pero estoy en condiciones de profundizar (fácilmente) en cualquier tema que quiera, dada mi experiencia previa 😉