¿Cuáles son los casos prácticos de aplicación / uso de map reduce / hadoop en la nube o en un entorno distribuido?

Estaba viendo un video de la cumbre de Openstack, había una compañía que se ocupa de la producción de películas. Han mencionado su problema cuando no usaban servicios en la nube para sus animaciones y otros programas de representación de imágenes.

En el contexto de su problema, estoy respondiendo:

Se requieren muchos marcos de imagen (datos) para representar una imagen final en películas animadas. El uso de map-reduce ha eliminado drásticamente la limitación de la velocidad de transferencia de datos de ciertos servidores. Usted almacena (asigna) marcos que se representan en diferentes instancias en diferentes servidores y los procesa y luego se produce la representación final (reducción).

El escenario anterior se puede implementar utilizando servidores físicos también.

Esas personas han mencionado que pueden ahorrar mucho dinero después de usar los servicios en la nube para su propósito. A medida que se requieren servidores, se inician en la nube y realizan su procesamiento y se eliminan automáticamente una vez que finaliza su trabajo.

No solo se satisfaga conociendo la teoría de los casos de uso de Mapreduce. Intente implementarlos usted mismo usando el código Mapreduce. Para su comodidad, comparto un enlace donde se explican 3 casos de uso de Hadoop Mapreduce y la mejor parte es que se explican con el código Mapreduce adecuado y una ejecución del mismo en el clúster de Hadoop.

https://www.udemy.com/hadoop-map

Un ejemplo claro que puedo ver es ejecutar un experimento de decodificación del genoma humano: ni puede esperar que se ejecute en una sola máquina ni podrá configurar la infraestructura en las instalaciones. Si tiene que democratizar esto, necesita cloud + hadoop, que logrará economía en la nube y, bajo demanda, puede escalar automáticamente su infraestructura.