Déjame contarte mi historia. Todos comienzan desde algún lado. Soy un ingeniero mecánico. Sin título de CS. No hay educación formal de matemáticas / estadísticas. Conseguí un trabajo de analista de negocios. Durante los primeros tres años realizó un gran trabajo de informes, incluidos Excel / SQL, Spotfire.
Entonces se presentó la oportunidad y mi gerente me invitó a su oficina:
Gerente: Quiero que aprendas algo de Python.
- ¿Cómo es Berkeley para la ciencia de datos?
- ¿Orientación profesional para personas de 25 años de edad con inclinación cuantitativa con datos / habilidades de programación?
- ¿Existe una forma más eficiente de almacenar tablas y filas sin tener que repetir ID?
- Soy un ingeniero de datos al año fuera de la escuela que gana 65k, ¿qué debo esperar para ganar sueldo después de 5 años?
- Según el mercado actual, ¿cuál es mejor: big data o Java?
Yo: Pero nunca he hecho programación en mi vida. ¿Porqué ahora?
Gerente : Hay algo llamado Algoritmo de bosque aleatorio que se está haciendo famoso. Como usted es el único desarrollador que no es PHP / Javascript, pensé que podría ayudarnos (Business Read: Dado que usted es el único que no tiene trabajo en sus manos, ¿por qué no hace algo?)
Entonces fui a google. Lea para qué se utiliza el algoritmo. Acabo de entender un poco sobre la declaración del problema de clasificación. Obtuve un blog de alguien que lo había implementado en Python. Copia pegó su código. Corrió en mi máquina local. ¡¡¡Y voilá!!! Utilizamos ese pequeño fragmento de código para ejecutarlo en un conjunto de datos de clasificación para esa compañía y lo incluimos en un producto. Mi gerente quedó impresionado.
En ese momento no conocía ninguna ciencia de datos. No sabía acerca de Entropía, árboles de decisión, validación cruzada, etc., etc. Para decirle la verdad, el modelo que creé podría haberse adaptado demasiado como el infierno. Solo sé que fue un comienzo. Y considero que ese comienzo es muy importante.
A partir de entonces comencé a probar muchos modelos para hacer la misma tarea. Empecé con Kaggle. Y cuando no pude competir, comencé a leer más. Tomé muchos MOOC abiertos. Aprendí cosas nuevas. Estaba abierto a aprender cosas nuevas. Estaba abierto a entender cosas nuevas. Y un día me di cuenta de que podía entender las matemáticas detrás si estaba dispuesto a poner esfuerzo.
Empecé con amplitud y finalmente me metí en la profundidad de las cosas.
Así que empieza. Prueba la sangre. Ensúciate las manos. Ejecuta el algoritmo. Intenta mejorarlo jugando con los parámetros y leyendo en la red. Estoy seguro de que en el proceso aprenderá mucho sobre el funcionamiento interno de los algoritmos. Y tal vez algún día estarás lo suficientemente motivado para entenderlos completamente.