¿Cuál es la diferencia entre MapReduce, inteligencia artificial y aprendizaje automático? O más bien, ¿cómo están relacionados?

MapReduce: una solución de ingeniería para manejar operaciones (como ordenar, buscar, etc.) en grandes conjuntos de datos.

Imagina, si quieres ordenar 1000 cuerdas. Es fácil y factible en una sola computadora. Piensa en el mismo problema, pero con mil millones de cadenas. No es fácil. Te encontrarás con todo tipo de problemas de procesamiento y memoria. Por lo general, lo que podemos hacer intuitivamente es dividir esto en 1000 cálculos, dejar que cada uno procese 1 millón de cadenas y luego agregar los resultados paso a paso. Pero 1000 computadoras es mucho. Uno o dos fallarán, el disco duro se bloqueará, sucede una mierda. Entonces, ¿cómo manejas de manera inteligente que los datos no se pierdan y que otras máquinas “compartan esa carga”? Ingrese mapreduce. Una abstracción ordenada en la que un usuario final no tiene que pensar en todos estos problemas internos de carga compartida, tolerancia a fallas, replicación de datos, etc. Simplemente le da 1000 máquinas, escribe su “función” en forma de mapa reducido, y voila, hará el trabajo por ti.

Aprendizaje automático: ciencia de aprender de los datos y obtener nuevos conocimientos de ellos. Es parte de la IA.

Ahora supongamos que estas mil millones de cadenas son de diferentes líneas de diferentes géneros (novela de suspense, ficción, ciencia). Quiero que la máquina pueda reconocer el género de la novela a la que pertenece una línea, automáticamente. Por lo tanto, hay varios “modelos de aprendizaje automático”, en los que puede pensar y aplicarlos, y puede obtener algunos resultados con un x% de precisión. Pero cuando dice “aplicar modelos a los datos”, esencialmente está codificando un algoritmo para hacer cosas con los datos. Ahora, cualquier algoritmo se puede dividir en simples construcciones de búsqueda, clasificación, operaciones matriciales, etc. Estos componentes individuales se pueden implementar en el marco de reducción de mapas. Y, por lo tanto, todo su algoritmo se puede ejecutar en map-reduce. Más a menudo que no, ML requiere una gran cantidad de datos para aprender a lograr una cantidad significativa de precisión. De ahí que escuchen estas palabras juntas. De lo contrario, map-reduce es simplemente una herramienta, mientras que ML es una ciencia.

Inteligencia artificial: como su nombre lo indica, hacer que una computadora haga lo que los humanos hacen con precisión.

Ahora, si un humano mira algún texto, puede distinguir a qué género pertenece, si la gramática es correcta o no, etc. ¿Cómo hacemos que la máquina aprenda a hacer esas cosas? Entra AI. Es un espectro más amplio de la ciencia, con ML siendo una gran parte de él. Implica cosas desde la percepción visual, el reconocimiento de voz, la toma de decisiones, hasta la traducción entre idiomas. ML es una parte de esto. Varios otros subcampos como la teoría de la probabilidad, la aleatoriedad, etc. juegan un papel importante en él.