Novato de aprendizaje automático aquí 🙂
Estoy tomando la especialización de curso “Ciencia de datos aplicados con Python”. El último curso que tuve fue la introducción al aprendizaje automático y la primera vez que aprendí sobre el aprendizaje automático.
Si se trata del código en sí, Machine Learning es bastante simple: la última tarea del curso fue bastante compleja (entrene un algoritmo que clasifique las multas entre las que se pagarán y las que probablemente nunca se pagarán). ¡Algunas personas en el foro dijeron que les tomó 15 líneas de código! Me tomó al menos 50 líneas … Así que la parte del código es bastante fácil si sabes lo que estás haciendo. Usando scikit learn (biblioteca de python), la mayoría de los algoritmos tienen la misma lógica, solo es cuestión de usar el correcto.
- ¿Cómo usa Facebook el aprendizaje automático?
- Cómo estudiar TensorFlow
- ¿Cuáles son las diferencias en las aplicaciones de filtrado colaborativo en los datos de calificación y en los datos de compra?
- ¿Qué métodos (sin supervisión) deberían usarse para la categorización jerárquica automática de documentos?
- ¿Cómo funciona la regresión lineal múltiple en variables categóricas?
Hay dos elementos del aprendizaje automático que creo que son los más difíciles (también los más interesantes), y representan la mayor parte del trabajo:
- Selección de funciones: cuando tenga los datos (imagine un gran archivo de Excel) que usará para entrenar el algoritmo, no necesita usarlos todos. De hecho, debe usar lo menos posible. Debe comprender los datos, analizarlos, visualizarlos y conservar solo las características que son realmente una base para entrenar el algoritmo. Tener demasiadas características o no suficientes creará un algoritmo disfuncional.
- Elección del algoritmo correcto : una vez que tenga las características que considere más relevantes, debe saber qué algoritmo utilizar. La principal distinción es entre los algoritmos de clasificación (por ejemplo, clasificará las frutas según la forma, el color, etc.) y los algoritmos de regresión (por ejemplo, estimará el precio futuro de una casa). Dentro de estos tipos hay diferentes algoritmos que son más adecuados para diferentes tipos de datos y resultados esperados. Comprender estos algoritmos y saber cuándo se deben usar requiere mucho trabajo. Y ni siquiera estoy mencionando Deep Learning aquí …
Entonces se trata solo del código. Como dije antes, esta parte es bastante simple, aunque necesita algunos conocimientos previos: cómo trabajar con los datos (pandas si usa python) y cómo visualizar los datos (matplotlib si usa python). Así que ya son 3 bibliotecas con las que debe sentirse cómodo.
Acabo de terminar mi primer mes con Machine Learning y estoy muy emocionado por el futuro. Todavía tengo mucho que aprender y mucho que practicar, pero siento que realmente estoy aprendiendo algo que me permitirá tener una carrera interesante y exitosa.
Espero que entres en Machine Learning, independientemente de la complejidad.