¿Se necesita una base matemática / estadística sólida para aprender aprendizaje automático, big data o IA?

Es realmente bueno tener conocimiento en matemáticas / estadísticas para llevar a cabo el aprendizaje automático, big data e inteligencia artificial. Se requiere idear los diferentes modelos que ayudarían a automatizar el aprendizaje de diferentes patrones de datos y categorizar los datos de acuerdo con eso. Piense en el aprendizaje supervisado y el aprendizaje no supervisado en el que uno necesita entrenar el modelo de datos y esto puede automatizarse mediante la magia de diferentes ecuaciones matemáticas y estadísticas. Son los fundamentos básicos los que impulsan la creación de modelos y la capacitación de los datos … Sugeriría encarecidamente ver a través del curso Coursera para aprendizaje automático de Andrew NG. Andrew recorre los diferentes fundamentos de las matemáticas y su relación con diferentes aspectos de los fundamentos del aprendizaje automático. Así que abróchate y comienza con paciencia, es divertido cuando automatizas modelos y, por lo tanto, entrenas tus datos.

Puede aprender las técnicas de ML, AI y Big Data, pero una sólida base matemática / estadística ayuda a seleccionar mejor el método correcto para el propósito correcto y a ajustarlas para satisfacer sus necesidades. Comencé como matemático, pero estaba frustrado después de un punto y no podía recordar las complicadas pruebas y fórmulas para regurgitar en los exámenes hasta que descubrí esto, siempre y cuando recuerde el núcleo de cualquier técnica y cómo usarla para resolver problemas del mundo real. , podría ser bueno tanto en matemáticas como en ciencia de datos. Aprendí a usar R como lenguaje de programación para probar nuevas técnicas para que me resultaran más claras. Animo a mis amigos y familiares a que me cuenten toda su investigación de datos. A medida que me sorprendieron estos datos, volvería a mi material de origen y encontraría nuevas formas de abordar estos problemas y, en el proceso, mejoré en matemáticas.

Hablando de Big Data, gran parte de este es un almacenamiento y gestión de datos distribuidos creativos, por lo que si tiene experiencia con DBA tradicional como MySQL, podría hacer la transición al almacenamiento de Big Data sin necesidad de aprender análisis reales , por ejemplo.

Todavía no recuerdo muchas fórmulas y pruebas, pero mientras conozca la aplicación de una técnica, puedo codificarla desde cero en C ++ o R si un paquete no está disponible para R. En esencia, no necesito aprender de memoria como Podría hacer referencia a mis libros / notas en cualquier momento, pero la conciencia matemática ayuda inmensamente.

En lo que respecta al desarrollo web, la biblioteca D3.js del Sr. Bostock es un gran éxito en el mundo de la visualización de datos. Muchas empresas en línea basadas en datos y datos utilizan la biblioteca D3 para javascript para una representación visual espectacular de datos con funciones interactivas integradas, como es de esperar de Javascript. Podrías explorar esto como una opción.

Y, por supuesto, Python se ha convertido en el intermediario del lenguaje de programación de facto entre la ciencia de datos y la informática tradicional (raspado de datos, minería, desarrollo de software, etc.). Por lo tanto, podría aprender cómo raspar datos usando Python, volviéndose viable como desarrollador web del lado de los datos antes de hacer una transición gradual a la ciencia de datos más si le interesa.