¿Qué tan difícil es el aprendizaje automático?

Novato de aprendizaje automático aquí 🙂

Estoy tomando la especialización de curso “Ciencia de datos aplicados con Python”. El último curso que tuve fue la introducción al aprendizaje automático y la primera vez que aprendí sobre el aprendizaje automático.

Si se trata del código en sí, Machine Learning es bastante simple: la última tarea del curso fue bastante compleja (entrene un algoritmo que clasifique las multas entre las que se pagarán y las que probablemente nunca se pagarán). ¡Algunas personas en el foro dijeron que les tomó 15 líneas de código! Me tomó al menos 50 líneas … Así que la parte del código es bastante fácil si sabes lo que estás haciendo. Usando scikit learn (biblioteca de python), la mayoría de los algoritmos tienen la misma lógica, solo es cuestión de usar el correcto.

Hay dos elementos del aprendizaje automático que creo que son los más difíciles (también los más interesantes), y representan la mayor parte del trabajo:

  1. Selección de funciones: cuando tenga los datos (imagine un gran archivo de Excel) que usará para entrenar el algoritmo, no necesita usarlos todos. De hecho, debe usar lo menos posible. Debe comprender los datos, analizarlos, visualizarlos y conservar solo las características que son realmente una base para entrenar el algoritmo. Tener demasiadas características o no suficientes creará un algoritmo disfuncional.
  2. Elección del algoritmo correcto : una vez que tenga las características que considere más relevantes, debe saber qué algoritmo utilizar. La principal distinción es entre los algoritmos de clasificación (por ejemplo, clasificará las frutas según la forma, el color, etc.) y los algoritmos de regresión (por ejemplo, estimará el precio futuro de una casa). Dentro de estos tipos hay diferentes algoritmos que son más adecuados para diferentes tipos de datos y resultados esperados. Comprender estos algoritmos y saber cuándo se deben usar requiere mucho trabajo. Y ni siquiera estoy mencionando Deep Learning aquí …

Entonces se trata solo del código. Como dije antes, esta parte es bastante simple, aunque necesita algunos conocimientos previos: cómo trabajar con los datos (pandas si usa python) y cómo visualizar los datos (matplotlib si usa python). Así que ya son 3 bibliotecas con las que debe sentirse cómodo.

Acabo de terminar mi primer mes con Machine Learning y estoy muy emocionado por el futuro. Todavía tengo mucho que aprender y mucho que practicar, pero siento que realmente estoy aprendiendo algo que me permitirá tener una carrera interesante y exitosa.

Espero que entres en Machine Learning, independientemente de la complejidad.

Se basa en la necesidad

  1. Si planea trabajar para una multinacional en el campo de la ciencia de datos o para iniciarse en el campo de la ciencia de datos, los conceptos básicos de Internet y principalmente de los sitios web de MOOC estarían bien y un buen conocimiento sobre las herramientas de ML como TensorFlow, Caffle es obligatorio
  2. Si planea trabajar para un MNC en el campo de Investigación de Ciencia de Datos o comenzar en eso, se requiere un buen conocimiento de Estadística, Matemáticas (krishnakumarsekar / awesome-machine-learning-deep-learning-matemáticas)
  3. Si planea trabajar para una multinacional en el campo de la Visión por computadora o para iniciar, Conceptos básicos de Internet, un buen conocimiento sobre herramientas de ML como TensorFlow, Caffle y un conocimiento básico de algoritmos y cómo aplicar en la vida real está bien
  4. Si planea trabajar para un MNC en el campo de Investigación de Visión por Computadora o para iniciar, Un buen conocimiento de Estadística, Matemáticas para estadística, Matemáticas para visión por computadora (krishnakumarsekar / awesome-machine-learning-deep-learning-matemáticas), Ingeniería, Aplicada Matemáticas, complejidad de la computación, computación cognitiva, procesamiento de imágenes, procesamiento de señales, se requiere procesamiento de datos, un pequeño conocimiento del negocio ayudará mucho
  5. Si va a hacer una investigación solo para obtener un doctorado, puede revisar todos los trabajos de investigación de 3 a 4 años e intentar combinarlos para obtener un buen resultado, las matemáticas básicas y las matemáticas aplicadas estarían bien para comenzar, papel te ayudará con los algoritmos, conceptos, etc.
  6. Si planea ser un gigante, comenzando desde cero, debe estudiar todos los temas de matemáticas, desde álgebra lineal hasta teoría espacial topológica muy avanzada (krishnakumarsekar / awesome-machine-learning-deep-learning-matemáticas), todos los conceptos estadísticos desde básicos hasta aplicados estadísticas juntas, estadísticas comerciales, todos los conceptos de ingeniería, desde digital a computación y teoría clásica a cuántica, desde algoritmos básicos, teoremas, axiomas a conceptos avanzados, cómo combinar efectivamente matemáticas, computación y algoritmos (krishnakumarsekar / awesome-quantum-machine-learning)

Gracias y saludos

Krishna

realmente creo que depende de “¿para qué papel?”

La magnitud del desafío parece muy diferente para estos roles de ML:

  1. Desarrollar un nuevo algoritmo por completo (por ejemplo, un algoritmo novedoso, potente y eficiente sin supervisión)
  2. Hacer que los algoritmos actuales sean mucho más escalables (por ejemplo, svm con núcleos no lineales implementables en hadoop)
  3. Implementación de algoritmos a gran escala en tiempo real en producción
  4. Algoritmos de creación de prototipos (p. Ej., Generar predicciones ad hoc, incluida la presentación de kaggle, aprovechando los kits de herramientas de código abierto existentes como r y sklearn)

Lo primero que debes saber es que el aprendizaje automático no es tan difícil como crees. El aprendizaje automático no es una forma de diseñar un algoritmo. Es una forma de seleccionar el algoritmo correcto y aplicarlo correctamente, y en el aprendizaje automático tienes que aprender cómo se alimentan los datos. máquina y cómo usar los datos producidos.

Machine Learning es un proceso de conversión de patrones en acciones. Machine Learning es una combinación de ciencia de datos y matemáticas. Probabilidad y estadística, modelado de datos, habilidades de programación, lenguajes de programación de ML son las habilidades para aprender en ML.

Machine Learning es solo otra herramienta a su disposición para resolver un problema. Dicho de otra manera, “no pongas Machine Learning en un pedestal”, escribe Jason Brownlee para Machine Learning Mastery. Desde una perspectiva técnica, Machine Learning puede considerarse un “problema de depuración fundamentalmente difícil”, según S. Zayd Enam, Enam es el fundador de Stealth y candidato a doctorado en la Universidad de Stanford. Continúa escribiendo que ML es difícil porque o el algoritmo no funciona o no funciona lo suficientemente bien. Estos problemas se agravan cuando existen problemas con el modelo real y / o los datos. Enam ofrece esperanza en la afirmación de que los humanos pueden construir una intuición para investigar cómo un modelo va mal, depurar el problema y producir una tubería ML funcional.

Para obtener más información: BEPEC | ¿Por qué ciencia de datos? Bangalore

El aprendizaje automático es muy simple en el nivel abstracto. ML se trata de enseñar a las computadoras a aprender de los datos (experiencia) sin decirles explícitamente cómo resolver problemas. Tenemos experiencia previa (datos) y un conjunto de herramientas (algoritmos) con nosotros. Alimentamos esas experiencias y utilizamos uno o más algoritmos para mostrar a las máquinas cómo extraer patrones de experiencias pasadas para proporcionar soluciones en el futuro. Puede pasar algunas semanas y comprender los algoritmos de ML y la forma de resolver problemas con Machine Learning. Hay miles de excelentes recursos en línea para hacer eso. Entonces Machine Learning no es difícil. La verdadera dificultad es aplicar su comprensión para resolver problemas prácticos y reales. Solo conocer un montón de algoritmos puede no ser suficiente en este caso. Debería tener una comprensión profunda sobre lo que sucede debajo del capó para resolver problemas prácticos que surgen cuando aplica ML para resolver problemas por su cuenta. Primero debes entender tus datos. Entonces debería encontrar la mejor solución usando algoritmos. Además, debería poder medir el rendimiento de su solución. Para esto, debe contar con el conocimiento estadístico apropiado, el conocimiento de ML, el conocimiento del contexto para comprender primero los problemas y luego encontrar soluciones. Entonces aplicar ML es difícil.

Es una ciencia que se aproxima al futuro a partir de los datos del pasado.
Extensión esencialmente multidimensional de la aproximación de funciones.

La mecánica cuántica es mucho más difícil.

Los algoritmos son difíciles de construir y generalmente se consideran la “caja negra”.

Es fácil de usar porque hay muchas bibliotecas excelentes de alto nivel, pero es difícil de dominar (bueno, puede ser divertido dependiendo de lo que le guste) porque cubre muchos temas de matemáticas e informática.

Sugeriría seguir este enlace que puede aprender en 90 días.

Es menos difícil cada día que pasas jugando con él. ¡Comience hoy!