¿Cuál es un ejemplo básico de aprendizaje automático?

Tomemos el ejemplo clásico de la clase de Andrew Ng en Coursera y hablemos sobre la regresión lineal. Imagina que estás tratando de vender tu casa y quieres descubrir cómo debes ponerle un precio. Entonces sabe que a medida que aumenta el número de habitaciones, también lo hace el precio. Entonces observa las ventas recientes de casas y observa la cantidad de habitaciones en comparación con el precio de venta.

Como solo tiene dos ejes, es simple trazar esto en un gráfico. Luego puede tomar el número de habitaciones en su casa, encontrar dónde debe ir en el gráfico y ¡listo! Excepto que notarás que los números que obtienes en realidad no tienen sentido, el precio está por todas partes para el número de habitaciones.

Entonces te dices a ti mismo, bueno, también veamos la cantidad de baños. Puede dibujar un gráfico tridimensional que grafica esas dos variables independientes, llamémoslas características, junto con el precio, también llamado variable dependiente. Ya que, nuevamente, usted sabe la cantidad de baños en su casa, puede encontrar el lugar en el gráfico que corresponderá con el precio que debe solicitar.

Pero una vez más, encuentra que los resultados no tienen sentido. Para las casas que tienen el mismo número de dormitorios y baños, obtienes precios diferentes. Y es probable que obtenga algunas casas con menos dormitorios y baños que se vendieron por más que algunas que tenían números más altos.

Por lo tanto, sigue agregando más funciones, tal vez esa es la calificación de las escuelas más cercanas, tal vez la distancia a los hospitales u otros proveedores de atención médica. Tal vez la edad de la casa. En cierto punto, es demasiado para usted realmente visualizar en un gráfico. Del mismo modo, tiene la intuición de que algunas de las variables son más importantes que otras.

Después de hacer esto por un tiempo, se te ocurre un modelo de cómo el precio interactúa con las diversas características de una casa. Dado que es probable que haya una gran cantidad de características, más de lo que los humanos podrán hacer cómodamente cualquier cosa, debe confiar en una máquina para hacerlo. Y la máquina había aprendido cómo predecir el precio de una casa a partir de algunos valores bien conocidos. QED ;-).

Tome una tonelada de documentos en un idioma determinado. Para cada palabra en ese idioma, calcule la probabilidad de que esta palabra sea seguida por otra palabra. Luego, puede hacer una caminata aleatoria para generar nuevos documentos que se parezcan a los originales, o puntuar nuevos documentos en función de lo similares que sean con esta medida.

Las probabilidades son los parámetros del “modelo” que la máquina ha “aprendido” utilizando datos de entrenamiento. Este es un modelo muy simple, y se puede mejorar de muchas maneras, como considerar las 2 palabras anteriores como una tupla, o incluso al intentar analizar la gramática del lenguaje. Pero pediste un ejemplo simple, no uno bueno 🙂

Yo diría que uno de los algoritmos más simples en ML es la clasificación lineal. Esta imagen muestra un ejemplo.

En la imagen, las entradas corresponden a los puntos (x, y), las salidas son de color rojo y azul, lo que significa que las entradas se dividen en dos clases diferentes, y el modelo es la línea que divide ambas clases. Este problema específico se llama clasificación.

El modelo que obtuvimos sigue esta ecuación, y = wx + b, donde w, es la pendiente, y b es el sesgo, ambos son números. En este caso, la ecuación es algo como esto: y = −1.3x + 1.6

Una vez que tenemos el modelo, podemos hacer predicciones. Un ejemplo es, dado un nuevo punto de entrada (x, y) = (0.2,0.3), ¿cuál sería la salida? Como el punto está debajo de la línea, la salida sería la clase azul. Aquí hay una buena explicación de los conceptos básicos del aprendizaje automático.