Compras de mango
Supongamos que vas a comprar mangos algún día. El vendedor ha tendido un carro lleno de mangos. Puede seleccionar los mangos a mano, el vendedor los pesará y pagará de acuerdo con una tasa fija de Rs por Kg (historia típica en India).
Obviamente, desea elegir los mangos más dulces y maduros para usted (ya que paga por peso y no por calidad). ¿Cómo eliges los mangos?
- ¿Existe algún modelo de aprendizaje profundo o algún otro método que ingrese como una colección de documentos y pueda predecir la probabilidad de un nuevo documento?
- ¿Cuáles son las desventajas de tener un tamaño de paso constante para el Descenso de gradiente estocástico?
- Cómo detectar regiones de texto solo de documentos escaneados
- ¿Crees que los algoritmos de aprendizaje automático pueden cambiar la forma en que hacemos simulaciones numéricas?
- ¿Necesito pasar al menos 1 año para repasar mis matemáticas antes de aprender el aprendizaje automático y el aprendizaje profundo?
Recuerdas a tu abuela diciendo que los mangos de color amarillo brillante son más dulces que los de color amarillo pálido. Entonces haces una regla simple: elige solo de los mangos amarillos brillantes. Comprueba el color de los mangos, elige los amarillos brillantes, paga y regresa a casa. ¿Final feliz?
No exactamente.
La vida es complicada
Supongamos que vas a casa y pruebas los mangos. Algunos de ellos no son tan dulces como te gustaría. Usted está preocupado. Aparentemente, la sabiduría de tu abuela es insuficiente. Hay más en los mangos que solo el color.
Después de reflexionar mucho (y probar diferentes tipos de mangos), concluye que los mangos amarillos más grandes y brillantes están garantizados para ser dulces, mientras que los mangos más pequeños y amarillos son dulces solo la mitad del tiempo (es decir, si compra 100 amarillos brillantes) mangos, de los cuales 50 son de tamaño grande y 50 son pequeños, entonces los 50 mangos grandes serán todos dulces, mientras que de los 50 pequeños, en promedio, solo 25 mangos serán dulces).
Está satisfecho con sus hallazgos y los tiene en cuenta la próxima vez que vaya a comprar mango. Pero la próxima vez en el mercado, verá que su vendedor favorito se ha ido de la ciudad. Decide comprar a un proveedor diferente, que suministra mangos cultivados en una parte diferente del país. Ahora, te das cuenta de que la regla que aprendiste (que los mangos grandes y de color amarillo brillante son los más dulces) ya no es aplicable. Tienes que aprender desde cero. Usted prueba un mango de cada tipo de este vendedor, y se da cuenta de que los pequeños, de color amarillo pálido, son de hecho los más dulces.
Ahora, un primo lejano te visita desde otra ciudad. Decides tratarla con mangos. Pero ella menciona que no le importa la dulzura de un mango, solo quiere los más jugosos. Una vez más, realiza sus experimentos, prueba todo tipo de mangos y se da cuenta de que los más suaves son más jugosos.
Ahora, te mudas a una parte diferente del mundo. Aquí, los mangos tienen un sabor sorprendentemente diferente al de su país de origen. Te das cuenta de que los mangos verdes son más sabrosos que los amarillos.
Te casas con alguien que odia los mangos. Ella ama las manzanas en su lugar. Vas a comprar manzanas. Ahora, todo su conocimiento acumulado sobre los mangos no tiene valor. Tienes que aprender todo sobre la correlación entre las características físicas y el sabor de las manzanas, por el mismo método de experimentación. Lo haces porque la amas.
Ingrese programas de computadora
Ahora, imagina que todo este tiempo, estabas escribiendo un programa de computadora para ayudarte a elegir tus mangos (o manzanas). Escribiría reglas del siguiente tipo:
if (el color es amarillo brillante y el tamaño es grande y lo vende el vendedor favorito): el mango es dulce.
si (suave): el mango es jugoso.
etc.
Usaría estas reglas para elegir los mangos. Incluso podrías enviar a tu hermano menor con esta lista de reglas para comprar los mangos, y estarías seguro de que elegirá solo los mangos de tu elección.
Pero cada vez que realiza una nueva observación de sus experimentos, debe modificar manualmente la lista de reglas. Debe comprender los detalles complejos de todos los factores que afectan la calidad de los mangos. Si el problema se complica lo suficiente, puede ser realmente difícil establecer reglas precisas a mano que cubran todos los tipos posibles de mangos. Su investigación podría obtener un doctorado en Mango Science (si hay uno).
Pero no todos tienen ese tipo de tiempo.
Ingrese algoritmos de Machine Learning
Los algoritmos de ML son una evolución sobre los algoritmos normales. Hacen que sus programas sean “más inteligentes”, al permitirles aprender automáticamente de los datos que usted proporciona.
Se toma una muestra de mangos seleccionada al azar del mercado ( datos de capacitación ), se hace una tabla con todas las características físicas de cada mango, como el color, el tamaño, la forma, se cultiva en qué parte del país, se vende por qué proveedor, etc. ( características ), junto con la dulzura, la jugosidad, la madurez de ese mango ( variables de salida ). Alimenta estos datos al algoritmo de aprendizaje automático ( clasificación / regresión ), y aprende un modelo de la correlación entre las características físicas de un mango promedio y su calidad.
La próxima vez que vaya al mercado, mide las características de los mangos en venta ( datos de prueba ) y lo alimenta al algoritmo ML. Utilizará el modelo calculado anteriormente para predecir qué mangos son dulces, maduros y / o jugosos. El algoritmo puede usar internamente reglas similares a las reglas que escribió manualmente anteriormente (por ejemplo, un árbol de decisión ), o puede usar algo más complicado, pero no necesita preocuparse por eso, en gran medida.
Voila, ahora puedes comprar mangos con gran confianza, sin preocuparte por los detalles de cómo elegir los mejores mangos. Y lo que es más, puede hacer que su algoritmo mejore con el tiempo ( aprendizaje de refuerzo ), de modo que mejore su precisión a medida que lea más datos de entrenamiento y se modifique cuando haga una predicción incorrecta. Pero la mejor parte es que puedes usar el mismo algoritmo para entrenar diferentes modelos, uno para predecir la calidad de manzanas, naranjas, plátanos, uvas, cerezas y sandías, y mantener felices a todos tus seres queridos 🙂
Y eso es Machine Learning para ti. Dime si no es genial.
Aprendizaje automático : hacer que sus algoritmos sean inteligentes, para que no necesite serlo. 😉