¿Qué campos de las matemáticas son más esenciales para la ciencia de datos?

Además del análisis numérico y los algoritmos de la informática, necesitaría un dominio de nivel superior de álgebra (lineal y abstracto), así como análisis (real y complejo) como la base para cualquier trabajo avanzado medio decente más allá de la importación y la ejecución una biblioteca que alguien más hizo.

Claro, puede salirse con la suya con un curso de aprendizaje automático de segundo año, pero no sabrá cómo resolver problemas más complejos con trucos del núcleo, ni dichos cursos le dirán nada sobre análisis de series de tiempo, FFT o modelos de Markov (y cuándo y cómo usarlos): conceptos que se usan en problemas un poco más difíciles en los que las herramientas básicas como los árboles de decisión C4.5 o ID3 y las SVM no se ajustan perfectamente.

Por lo tanto, depende de lo que intentes hacer:

  • Obtenga un trabajo lo antes posible: cursos en línea sobre ML y un curso básico de álgebra lineal de pregrado.
  • Avanzar en un trabajo o hacer algo más allá de lo normal: al menos lo anterior

La estadística, la teoría de la probabilidad, el álgebra lineal y el cálculo son elementos imprescindibles para una ciencia de datos efectiva. Para cualquier cosa que involucre I + D, aprendizaje profundo u otros temas avanzados (análisis de datos topológicos), sería suficiente un análisis real, métodos numéricos, topología, geometría diferencial, teoría de grafos y quizás un curso de nivel superior sobre espacios de probabilidad / procesos estocásticos. Honestamente, he visto aplicaciones / documentos de lectura que se aplican a casi todas las ramas de las matemáticas a la ciencia de datos y al aprendizaje automático (incluido el álgebra de Lie en aplicaciones de aprendizaje profundo).

Una comprensión sólida de la estadística, la probabilidad y el álgebra lineal son la mayoría de lo que parece surgir en la ciencia de datos. Creo que es una buena idea tener una idea básica de lo que está sucediendo en Machine Learning, digamos a través del curso de Andrew Ng en Coursera: https://www.coursera.org/learn/m …, para que comience a ver qué tipo de de las matemáticas se acostumbra de primera mano.

Puedes terminar yendo mucho más profundo, pero es importante saber por qué vas más profundo.

More Interesting

¿Dónde puedo encontrar algunos buenos documentos sobre ciencia de datos / análisis y aprendizaje automático?

¿Existe una buena biblioteca para los algoritmos de detección de deriva conceptual?

Después de realizar una validación cruzada K-fold en una entrada 7 * 98 con una salida de datos 1 * 98, ¿cómo selecciono los datos para el entrenamiento y las pruebas?

¿Cuál de los siguientes cursos debería elegir, big data y Hadoop o data science? ¿Cuál de los cursos anteriores tiene más alcance en el futuro? Tengo 1,5 años de experiencia como desarrollador de Java.

¿Cuáles son los pros y los contras de usar Kaggle Scripts?

¿En qué áreas del aprendizaje automático es crucial la cuantificación de la incertidumbre?

¿Cuáles son los mejores 3 institutos de capacitación en el aula para un curso de ciencia de datos con certificación en Hyderabad?

Cómo desarrollar la intuición de datos

¿Cuál es su opinión de Stanford MS en Estadística: Ciencia de datos?

¿Cuáles son algunos de los mejores algoritmos de minería de datos de predicción de ventas?

¿Qué tan básicos son los datos en Uber?

¿Qué tiene más alcance y permanecerá durante mucho tiempo en el mercado, la ciencia de datos, la computación en la nube o Hadoop y big data?

Tengo 7 años de experiencia en análisis y ciencia de datos. ¿Vale la pena hacer PGPBA de Greatlakes o IIMB o CBA de ISB?

¿Qué tipo de métodos de ciencia de datos se pueden aplicar a los datos de tráfico web?

¿Cuáles son las habilidades necesarias para aprender big data?