Comenzar con algo nuevo es difícil, aunque la extensión varía. La curva de aprendizaje para ML puede ser empinada para muchos. Pero un enfoque que generalmente funciona cuando intentas aprender algo nuevo es aprenderlo en capas . En el primer paso, intente obtener una imagen general de alto nivel de qué problema está tratando de resolver, cómo está tratando de resolverlo (a un alto nivel) y cómo mide que el problema realmente se está resolviendo satisfactoriamente. Luego, profundiza en cada uno de estos componentes, ganando más intuición de cada uno. Finalmente, entras en los tecnicismos de cada uno de los componentes.
Aquí, déjame darte una imagen de alto nivel del campo.
Problema que estamos tratando de resolver : dados algunos datos, el objetivo del aprendizaje automático es encontrar patrones en los datos. Hay varios entornos, como el aprendizaje supervisado, el aprendizaje no supervisado, el aprendizaje de refuerzo, etc. Pero el más común es el aprendizaje supervisado; así que nos centraremos solo en eso en el panorama general. Aquí, se le dan datos etiquetados [llamados “datos de entrenamiento”], y desea inferir etiquetas en nuevos datos [llamados “datos de prueba”]. Por ejemplo, considere los autos sin conductor. Los datos etiquetados incluirían la imagen de la carretera por delante en una instancia particular como se ve desde el automóvil, y la etiqueta correspondiente sería el ángulo de dirección [supongamos que la velocidad se controla manualmente, por simplicidad]. El objetivo del automóvil autónomo es que, dada una nueva imagen de la carretera, el sistema debería poder determinar el ángulo de dirección óptimo.
- ¿De qué sirve una cámara en una máquina?
- ¿Cuál será la próxima revolución informática y cómo puedo participar?
- ¿Por qué se eligen los símbolos de asterisco y ampersand para trabajar con memoria en lenguajes de programación?
- ¿Cuándo la regresión logística funciona mal y se debe preferir la máquina de vectores de soporte (SVM)?
- ¿Cuál es la imagen de Cornell en la industria de CS?
Cómo resolver : La mayor parte del aprendizaje automático supervisado se puede ver utilizando el siguiente marco: se le dan puntos de datos de capacitación [matemática] (x_1, y_1), \ ldots, (x_n, y_n) [/ matemática], donde [matemática] x_i [/ math] son los datos [por ejemplo, imagen de la carretera en el ejemplo anterior], y [math] y_i [/ math] es la etiqueta correspondiente. Desea encontrar una función [math] f [/ math] que se ajuste bien a los datos, es decir, dado [math] x_i [/ math], genera algo lo suficientemente cercano a [math] y_i [/ math]. Ahora, ¿de dónde sacas esta función [matemáticas] f [/ matemáticas]? Una forma, que es la más común en ML, es definir una clase de funciones [math] \ mathcal {F} [/ math], y buscar en esta clase la función que mejor se ajuste a los datos. Por ejemplo, si desea predecir el precio de un apartamento en función de características como el número de habitaciones, el número de baños, el área cubierta, etc., puede suponer razonablemente que el precio es una combinación lineal de todas estas características, en cuyo caso, la clase de función [math] \ mathcal {F} [/ math] se define como la clase de todas las funciones lineales. Para los autos sin conductor, la clase de función [math] \ mathcal {F} [/ math] que necesita será mucho más compleja.
Cómo evaluar : Tenga en cuenta que simplemente ajustar los datos de entrenamiento no es suficiente. Los datos son ruidosos, por ejemplo, todos los apartamentos con la misma cantidad de habitaciones, la misma cantidad de baños y la misma área cubierta no tienen el mismo precio. Del mismo modo, si etiqueta los datos de los automóviles autónomos, puede esperar cierta aleatoriedad debido al conductor humano. Lo que necesita es que su marco de trabajo pueda extraer el patrón e ignorar el ruido aleatorio. En otras palabras, debería funcionar bien en datos invisibles . Por lo tanto, la forma de evaluar los modelos es guardar una parte de los datos de entrenamiento [llamado “conjunto de validación”] y predecir sobre estos datos para medir qué tan bueno es su modelo.
Ahora, independientemente de lo que estudies en el aprendizaje automático, debes tratar de relacionar los temas con el panorama general anterior. Por ejemplo, en la regresión lineal, la clase de función es lineal y el método de evaluación es la pérdida cuadrada, en SVM lineal, la clase de función es lineal y el método de evaluación es la pérdida de bisagra, y así sucesivamente. Primero entienda estos algoritmos a alto nivel. Luego, entra en los detalles técnicos. Verá que encontrar la mejor función [matemática] f [/ matemática] en la clase de función [matemática] \ matemática {F} [/ matemática] a menudo resulta en un problema de optimización, para lo cual utiliza el descenso de gradiente estocástico.
Para obtener más información y recursos, consulte ¿Cuál es el procedimiento paso a paso para aprender el aprendizaje automático por completo con la implementación?