¿Por qué el aprendizaje automático es difícil de entender?

Comenzar con algo nuevo es difícil, aunque la extensión varía. La curva de aprendizaje para ML puede ser empinada para muchos. Pero un enfoque que generalmente funciona cuando intentas aprender algo nuevo es aprenderlo en capas . En el primer paso, intente obtener una imagen general de alto nivel de qué problema está tratando de resolver, cómo está tratando de resolverlo (a un alto nivel) y cómo mide que el problema realmente se está resolviendo satisfactoriamente. Luego, profundiza en cada uno de estos componentes, ganando más intuición de cada uno. Finalmente, entras en los tecnicismos de cada uno de los componentes.

Aquí, déjame darte una imagen de alto nivel del campo.

Problema que estamos tratando de resolver : dados algunos datos, el objetivo del aprendizaje automático es encontrar patrones en los datos. Hay varios entornos, como el aprendizaje supervisado, el aprendizaje no supervisado, el aprendizaje de refuerzo, etc. Pero el más común es el aprendizaje supervisado; así que nos centraremos solo en eso en el panorama general. Aquí, se le dan datos etiquetados [llamados “datos de entrenamiento”], y desea inferir etiquetas en nuevos datos [llamados “datos de prueba”]. Por ejemplo, considere los autos sin conductor. Los datos etiquetados incluirían la imagen de la carretera por delante en una instancia particular como se ve desde el automóvil, y la etiqueta correspondiente sería el ángulo de dirección [supongamos que la velocidad se controla manualmente, por simplicidad]. El objetivo del automóvil autónomo es que, dada una nueva imagen de la carretera, el sistema debería poder determinar el ángulo de dirección óptimo.

Cómo resolver : La mayor parte del aprendizaje automático supervisado se puede ver utilizando el siguiente marco: se le dan puntos de datos de capacitación [matemática] (x_1, y_1), \ ldots, (x_n, y_n) [/ matemática], donde [matemática] x_i [/ ​​math] son ​​los datos [por ejemplo, imagen de la carretera en el ejemplo anterior], y [math] y_i [/ ​​math] es la etiqueta correspondiente. Desea encontrar una función [math] f [/ math] que se ajuste bien a los datos, es decir, dado [math] x_i [/ ​​math], genera algo lo suficientemente cercano a [math] y_i [/ ​​math]. Ahora, ¿de dónde sacas esta función [matemáticas] f [/ matemáticas]? Una forma, que es la más común en ML, es definir una clase de funciones [math] \ mathcal {F} [/ math], y buscar en esta clase la función que mejor se ajuste a los datos. Por ejemplo, si desea predecir el precio de un apartamento en función de características como el número de habitaciones, el número de baños, el área cubierta, etc., puede suponer razonablemente que el precio es una combinación lineal de todas estas características, en cuyo caso, la clase de función [math] \ mathcal {F} [/ math] se define como la clase de todas las funciones lineales. Para los autos sin conductor, la clase de función [math] \ mathcal {F} [/ math] que necesita será mucho más compleja.

Cómo evaluar : Tenga en cuenta que simplemente ajustar los datos de entrenamiento no es suficiente. Los datos son ruidosos, por ejemplo, todos los apartamentos con la misma cantidad de habitaciones, la misma cantidad de baños y la misma área cubierta no tienen el mismo precio. Del mismo modo, si etiqueta los datos de los automóviles autónomos, puede esperar cierta aleatoriedad debido al conductor humano. Lo que necesita es que su marco de trabajo pueda extraer el patrón e ignorar el ruido aleatorio. En otras palabras, debería funcionar bien en datos invisibles . Por lo tanto, la forma de evaluar los modelos es guardar una parte de los datos de entrenamiento [llamado “conjunto de validación”] y predecir sobre estos datos para medir qué tan bueno es su modelo.


Ahora, independientemente de lo que estudies en el aprendizaje automático, debes tratar de relacionar los temas con el panorama general anterior. Por ejemplo, en la regresión lineal, la clase de función es lineal y el método de evaluación es la pérdida cuadrada, en SVM lineal, la clase de función es lineal y el método de evaluación es la pérdida de bisagra, y así sucesivamente. Primero entienda estos algoritmos a alto nivel. Luego, entra en los detalles técnicos. Verá que encontrar la mejor función [matemática] f [/ matemática] en la clase de función [matemática] \ matemática {F} [/ matemática] a menudo resulta en un problema de optimización, para lo cual utiliza el descenso de gradiente estocástico.


Para obtener más información y recursos, consulte ¿Cuál es el procedimiento paso a paso para aprender el aprendizaje automático por completo con la implementación?

Para un principiante, el aprendizaje automático parece complicado y no hay un punto de partida claro.

Así que hay algunos puntos a tener en cuenta antes de sumergirse en ML.

Prerrequisitos

Perspectiva matemática: álgebra lineal, cálculo vectorial, geometría fundamental, dominio espacial y, opcionalmente, programación cuadrática.

Programación y perspectiva de aplicación: fundamentos de algoritmos y estructuras de datos, experiencia con cualquier lenguaje de programación científica reciente.

Tenga en cuenta que conocer todo esto no es necesario, pero se recomienda para obtener una mejor comprensión, en función de sus necesidades.

Dónde empezar

Ahora, esto es bastante arbitrario y no hay un lugar fijo para comenzar para todos. Pero algunas de las siguientes fuentes son útiles.

  1. Curso de Andrew Ng sobre Machine Learning – Machine Learning | Coursera
  2. Clases de Caltech sobre Machine Learning – Curso de Machine Learning – CS 156 – YouTube
  3. Video conferencias de Nptel – Introducción al aprendizaje automático Prof. NPTEL S. Sarkar IIT Kharagpur – YouTube
  4. (Opcional, si está interesado en redes neuronales) Aprendizaje profundo por Simon Haykins – https://cours.etsmtl.ca/sys843/R

Después de obtener una comprensión decente mediante el uso de una o más de estas fuentes, puede comenzar a explorar las aplicaciones del aprendizaje automático e intentar construir algunas propias.

Puede consultar el dominio del aprendizaje automático para preguntas y dudas comunes.

Eso es todo, debes ser un programador promedio de ML al final de todos estos cursos. Encuentre sus propios intereses y desarrolle aplicaciones relacionadas con ellos una vez que tenga un conocimiento sólido. 🙂

Es obvio enfrentar dificultades en el aprendizaje automático porque no está relacionado con nada de lo que hubiera estudiado anteriormente. Si está relacionado con algo, son estadísticas y una implementación demasiado extraña. No sé qué curso o material de estudio está utilizando, pero debería probar Coursera | Cursos en línea de las mejores universidades. Únete gratis. Esto ha cubierto cada tema con lo básico, incluso si no está familiarizado con la parte de Matemáticas utilizada en ML.

Sin embargo, incluso cuando entiendes ML, aún sería difícil implementar ecuaciones. Lo que tendrá que hacer es revisar los conceptos y comprender el funcionamiento del problema junto con instancias de la vida real que facilitarán su comprensión y relación. Pase más tiempo con los gráficos y las ecuaciones para comprender mejor lo que está pasando en el curso. Pase tiempo incluso con la introducción del curso; de lo contrario, solo comprenderá CÓMO y QUÉ, pero no POR QUÉ.

Tomará tiempo. Ni siquiera puedo definir los términos que estudié una semana antes. Se necesitarán varias revisiones para comprender los términos y la ecuación y algunas más para implementarlos. Pero no hay nada que uno no pueda. Quizás lo has intentado mucho y lo has intentado bien. Tienes que esforzarte más. 🙂

Por lo general, soy la primera persona en decir que algo es difícil. Pero no voy a ir aquí. Aprender a usar el aprendizaje automático no es más difícil que aprender cualquier otro conjunto de bibliotecas para un programador.

La clave es concentrarse en USARLO, no en diseñar el algoritmo. Míralo de esta manera: si necesitas ordenar datos, no inventas un algoritmo de clasificación, eliges un algoritmo apropiado y lo usas correctamente.

Lo mismo con el aprendizaje automático. No necesita aprender cómo funcionan las agallas del algoritmo de aprendizaje automático. Debe aprender cuáles son las principales opciones (por ejemplo, redes neuronales, bosques de decisión aleatoria …), cómo alimentarlos con datos y cómo utilizar los datos producidos.

Hay un poco de arte: decidir cuándo puede y no puede usar el aprendizaje automático, y descubrir los datos correctos para alimentarlo. Por ejemplo, si desea saber si una película muestra a alguien ejecutándose, es posible que desee enviar fotogramas individuales y conjuntos de deltas de fotogramas con una cierta cantidad de segundos de diferencia.

Si eres un programador y es increíblemente difícil aprender ML, probablemente estés tratando de aprender las cosas equivocadas al respecto.

El aprendizaje automático no es nada difícil de entender. Hay muchas otras áreas en ciencias, que son 100 veces más complicadas que el aprendizaje automático. Necesita un conocimiento estándar de probabilidad y estadística, eso es todo. El aprendizaje automático es un tema de mucha expectación debido a su aplicación y sus enormes oportunidades de trabajo. El aprendizaje automático no es un tema de ese nivel, ¡sinceramente! Pero es muy divertido trabajar en Machine Learning.

La mayoría de la gente lucha por entenderlo porque hay muchos tutores que no tienen el arte de educar .

Explican los conceptos de Estadística de una manera tan matemática que no te das cuenta de por qué aprendiste esto. ¿Cuál es la aplicación empresarial de los conceptos? Permaneces confundido incluso con lo básico, incluso después de esforzarte mucho.

Del mismo modo, hay tutoriales de SAS / R, que pueden darle sintaxis pero no muestran la ejecución a mano. Idealmente, después de la explicación de la sintaxis, se le deben presentar varios casos, donde puede aplicar su aprendizaje de la sintaxis para que pueda obtener confianza y comprender las situaciones comerciales para el uso de la sintaxis.

Cuando esté aprendiendo regresión logística / árbol de decisión / análisis de clúster, etc., debe comprender el concepto, el código y las explicaciones detalladas de la salida (lo que debería significar que a veces está haciendo un cálculo manual en Excel para estar más cómodo para poder dar sentido a la salida SAS / R). Debería poder descargar código, excel, PDF, etc. para poder practicarlo junto con el curso y servirle como material de referencia más adelante.

Es importante leer algunos testimonios de centros de capacitación / entrenadores para saber que él es bueno para educar o simplemente para enseñar.

Soy un entrenador entusiasta del aprendizaje automático y mis tutoriales en línea serán de ayuda. También puedes ver el siguiente video de YouTube. Ayudará

No es del todo difícil. Todos sienten que es difícil debido a las matemáticas, si conoces la intuición geométrica detrás de las matemáticas, definitivamente te sentirás fácil.

Curso de IA aplicada: es una gran plataforma para los cursos en línea de Machine Learning, es uno de los mejores cursos de aprendizaje automático donde puedes aprender matemáticas con intuición geométrica.

appliedaicourse proporcionó un taller en línea, es gratis para los que usan el código de cupón para registrarse: [correo electrónico protegido]

enlace del taller: Motor de recomendación de prendas de vestir –AI Workshop @AppliedAICourse

Saber por dónde empezar es la clave.

Te sugiero que vayas a este sitio web y veas

Cómo iniciar AI / ML / DL. ¡¡Buena suerte!!

“El 80% de toda la ciencia de datos es ETL, munging o disputas”

– Todos los científicos de datos