Tomemos el ejemplo clásico de la clase de Andrew Ng en Coursera y hablemos sobre la regresión lineal. Imagina que estás tratando de vender tu casa y quieres descubrir cómo debes ponerle un precio. Entonces sabe que a medida que aumenta el número de habitaciones, también lo hace el precio. Entonces observa las ventas recientes de casas y observa la cantidad de habitaciones en comparación con el precio de venta.
Como solo tiene dos ejes, es simple trazar esto en un gráfico. Luego puede tomar el número de habitaciones en su casa, encontrar dónde debe ir en el gráfico y ¡listo! Excepto que notarás que los números que obtienes en realidad no tienen sentido, el precio está por todas partes para el número de habitaciones.
Entonces te dices a ti mismo, bueno, también veamos la cantidad de baños. Puede dibujar un gráfico tridimensional que grafica esas dos variables independientes, llamémoslas características, junto con el precio, también llamado variable dependiente. Ya que, nuevamente, usted sabe la cantidad de baños en su casa, puede encontrar el lugar en el gráfico que corresponderá con el precio que debe solicitar.
- ¿Cómo aprenden los algoritmos de aprendizaje automático de los datos?
- ¿Qué significa una probabilidad gaussiana en el clasificador bayesiano ingenuo gaussiano?
- ¿Es incorrecto si realizo un análisis de opinión en revisiones individuales en lugar de en todas las revisiones a la vez?
- Al predecir un resultado binario, ¿cómo toman en cuenta las personas el orden en que ocurren las entradas?
- ¿Qué conocimientos de matemática / estadística y CS debo dominar (no matemático / stat / CS, pero graduado en ingeniería) para carrera / investigación en aprendizaje automático?
Pero una vez más, encuentra que los resultados no tienen sentido. Para las casas que tienen el mismo número de dormitorios y baños, obtienes precios diferentes. Y es probable que obtenga algunas casas con menos dormitorios y baños que se vendieron por más que algunas que tenían números más altos.
Por lo tanto, sigue agregando más funciones, tal vez esa es la calificación de las escuelas más cercanas, tal vez la distancia a los hospitales u otros proveedores de atención médica. Tal vez la edad de la casa. En cierto punto, es demasiado para usted realmente visualizar en un gráfico. Del mismo modo, tiene la intuición de que algunas de las variables son más importantes que otras.
Después de hacer esto por un tiempo, se te ocurre un modelo de cómo el precio interactúa con las diversas características de una casa. Dado que es probable que haya una gran cantidad de características, más de lo que los humanos podrán hacer cómodamente cualquier cosa, debe confiar en una máquina para hacerlo. Y la máquina había aprendido cómo predecir el precio de una casa a partir de algunos valores bien conocidos. QED ;-).