¿Cuál es la importancia de las estadísticas y las matemáticas en el campo de la ciencia de datos? ¿Cuántas matemáticas y estadísticas se requieren para convertirse en un científico de datos?

Déjame contarte mi historia. Todos comienzan desde algún lado. Soy un ingeniero mecánico. Sin título de CS. No hay educación formal de matemáticas / estadísticas. Conseguí un trabajo de analista de negocios. Durante los primeros tres años realizó un gran trabajo de informes, incluidos Excel / SQL, Spotfire.

Entonces se presentó la oportunidad y mi gerente me invitó a su oficina:

Gerente: Quiero que aprendas algo de Python.

Yo: Pero nunca he hecho programación en mi vida. ¿Porqué ahora?

Gerente : Hay algo llamado Algoritmo de bosque aleatorio que se está haciendo famoso. Como usted es el único desarrollador que no es PHP / Javascript, pensé que podría ayudarnos (Business Read: Dado que usted es el único que no tiene trabajo en sus manos, ¿por qué no hace algo?)

Entonces fui a google. Lea para qué se utiliza el algoritmo. Acabo de entender un poco sobre la declaración del problema de clasificación. Obtuve un blog de alguien que lo había implementado en Python. Copia pegó su código. Corrió en mi máquina local. ¡¡¡Y voilá!!! Utilizamos ese pequeño fragmento de código para ejecutarlo en un conjunto de datos de clasificación para esa compañía y lo incluimos en un producto. Mi gerente quedó impresionado.

En ese momento no conocía ninguna ciencia de datos. No sabía acerca de Entropía, árboles de decisión, validación cruzada, etc., etc. Para decirle la verdad, el modelo que creé podría haberse adaptado demasiado como el infierno. Solo sé que fue un comienzo. Y considero que ese comienzo es muy importante.

A partir de entonces comencé a probar muchos modelos para hacer la misma tarea. Empecé con Kaggle. Y cuando no pude competir, comencé a leer más. Tomé muchos MOOC abiertos. Aprendí cosas nuevas. Estaba abierto a aprender cosas nuevas. Estaba abierto a entender cosas nuevas. Y un día me di cuenta de que podía entender las matemáticas detrás si estaba dispuesto a poner esfuerzo.

Empecé con amplitud y finalmente me metí en la profundidad de las cosas.

Así que empieza. Prueba la sangre. Ensúciate las manos. Ejecuta el algoritmo. Intenta mejorarlo jugando con los parámetros y leyendo en la red. Estoy seguro de que en el proceso aprenderá mucho sobre el funcionamiento interno de los algoritmos. Y tal vez algún día estarás lo suficientemente motivado para entenderlos completamente.

More Interesting

¿Qué se necesita para que un estudiante de matemáticas e informática se convierta en un científico de datos?

¿Cuáles son buenas métricas para la polarización política en las redes sociales?

¿Hay un programa de maestría para ciencia de datos / aprendizaje automático en ETH Zurich? ¿Qué tan bueno es en comparación con los de las universidades de los Estados Unidos, por ejemplo, Berkeley, etc.?

¿Es importante un curso de diseño y análisis de algoritmos para una carrera en análisis de datos?

¿Cómo es un día típico para un científico de datos en Microsoft?

Cómo cambiar de carrera de soporte a tecnología de big data

¿Cómo mejorar mi perfil para obtener una admisión para MS en Data Science de GA TECH?

¿Qué podemos hacer después de aprender el lenguaje R?

Tengo 28 años y he estado trabajando como auditor financiero durante los últimos 5 años. Quiero saltar al área de ciencia de datos y blockchain y seguir mi carrera en estos campos. ¿Cómo puedo hacer eso?

¿Cómo puedo comercializar mi punto de acceso si compré un plan de Big Data?

En la selección de características, ¿debemos eliminar siempre todas las características que tienen una alta covarianza entre ellas?

¿Cuáles son los modelos de confianza utilizados en la seguridad de big data?

¿Cuál es el mejor método para detectar valores atípicos en los datos de ventas anuales?

¿Cuáles son los marcos de Big Data?

¿Cómo hacen las estadísticas clases e intervalos de clase cuando los datos están en decimales?