TL; DR : Aprende las matemáticas. Conoce tus datos. Aprende a codificar. Ver videos. Practica por tu cuenta.
En mi experiencia, la mejor manera es tener las pautas 1, 2, 3:
- Aprende estadísticas. No puedo enfatizar la importancia de las estadísticas para el aprendizaje automático. Todo lo que hagas en ML tendrá sus raíces en las estadísticas de una forma u otra.
- Conoce las matemáticas Cualquier persona puede importar bibliotecas y crear un modelo de ML, sin conocer las matemáticas o la lógica que hay detrás. Sin embargo, un buen científico de datos siempre conoce las matemáticas detrás del modelo que está haciendo. Es un estándar de la industria, y muchos empleadores tienen este requisito básico.
- Comprende el problema; Lee los datos. En general, tendrá muchos datos con los que trabajar, y muchos datos equivalen a muchos errores y redundancias. El preprocesamiento y la limpieza de los datos es una de las tareas más grandes que un científico de datos puede enfrentar. Diría que aproximadamente el 60% de su tiempo se dedicará a analizar, limpiar y reducir los datos. Debe tener una buena comprensión del problema con el que está tratando de trabajar, para poder crear un modelo adecuado.
Saber cómo codificar no es tan importante como saber qué codificar. Debe saber el tipo de datos que está manejando y el problema que está tratando de resolver. La codificación es secundaria, y muchos lenguajes (python, R, C ++) ofrecen bibliotecas para facilitar su uso. Los idiomas como python y R son fáciles de aprender, ya que derivan gran parte de su sintaxis del idioma inglés, lo que facilita su lectura y comprensión.
- ¿Cómo implementamos el filtrado o el seguimiento del correo no deseado mediante una red neuronal?
- ¿Es Lisp un lenguaje de programación ampliamente utilizado en IA?
- ¿Cómo utilizarán los gobiernos la IA contra otros países?
- ¿Hay algún buen punto de partida de código abierto para escribir una IA para un RTS?
- ¿Qué tan inteligente es la inteligencia artificial hoy?
Ahora, comencemos con el proceso de aprendizaje real: ¿qué hacer primero y por dónde comenzar?
El aprendizaje automático, las redes neuronales y el aprendizaje profundo se abordan mejor como estructuras en capas, que deben abordarse una tras otra.
La mejor manera de comenzar con Machine Learning es comenzar con video cursos / tutoriales, algunos de ellos se mencionan a continuación.
Aprendizaje automático | Coursera (el mejor curso para ayudarte a comenzar)
Aprendizaje automático | Udacity
Aprendizaje automático con Python – YouTube
Una vez que lo domine, le sugiero que tome un proyecto propio y comience a trabajar en él. Como no eres un codificador ávido, te sugiero que también comiences a aprender un lenguaje de codificación, preferiblemente python. También he proporcionado algunos enlaces para aprender Python.
Programación para todos (Introducción a Python) | Coursera
Serie de tutoriales básicos de Python 3: YouTube
Una vez que sea minucioso con sus conceptos de Machine Learning, puede pasar a Redes neuronales y Deep Learning.
También le sugiero que cree una cuenta en kaggle.com (Your Home for Data Science). Es un portal para científicos de datos, y se le proporcionarán muchos desafíos para que los lea, discuta y resuelva.
Al final, te dejo con algunos consejos sobre cómo ser bueno en lo que haces:
- SIEMPRE limpie y preprocese los datos. En un entorno de aprendizaje controlado, es posible que tenga datos puros, pero ese no será el caso el 100% de las veces en la vida real.
- Visualizar datos es muy importante. Le da una idea de las relaciones que ciertos atributos tienen entre sí, y le ayudará a preprocesar los datos o diseñar un modelo.
- Es posible que un modelo complicado y potente no siempre le brinde los mejores resultados. A veces, un modelo simple y fácil de implementar puede ser útil.
- En el tiempo libre, busque las documentaciones de varias bibliotecas de ML. Nunca se sabe qué cosa interesante puede encontrar.
- Para ser un buen científico de datos, no es necesario tener una computadora portátil potente. Con servidores baratos y confiables disponibles, puede probar una pequeña porción de sus datos en su máquina, y si el modelo que ha elegido se adapta bien a su problema, puede cargar su código y los datos a un servidor remoto para hacer el cálculo para ti.
Espero que esto haya sido de alguna ayuda para usted.
¡Viva y prospere!
* inserta el saludo vulcano *