Cuando se ejecuta Apache Spark, ¿cuánta RAM se necesita generalmente en el clúster por nodo Spark?

Todo depende de la aplicación que esté ejecutando y de cómo esté codificada.

Por ejemplo, una aplicación simple de WordCount no usa mucha RAM, ya que cada tarea lee el fragmento de HDFS (predeterminado: 128 MB) y lo procesa sobre la marcha.

Por otro lado, las aplicaciones de aprendizaje automático normalmente almacenan en caché los RDD en la memoria con estructuras complejas con muchos punteros, lo que significa que necesitará más RAM a menos que desee tener muchos derrames de la memoria al disco. También cuenta el tipo de estructuras que utiliza (por ejemplo, el uso de objetos pequeños o una matriz de Ints en lugar de una lista vinculada). Tenga en cuenta que Java devora su memoria cuando usa estructuras costosas de memoria, así que trate de mantenerlo simple.

Yo diría que la mejor manera es iniciar su aplicación y usar la interfaz de usuario de Spark para ver su progreso, y si obtiene errores de memoria o se derrama mucho en el disco, aumente la memoria. Si los dimensiona demasiado grande, obtendrá una recolección de basura más larga y consumirá sus recursos más rápidamente.

Aquí se explica cómo acceder a la interfaz de usuario de Spark.

Monitoreo e Instrumentación

Related Content

¿Qué sucede si en una computadora portátil de 8GB de RAM, instalamos una caja virtual o VMware y una RAM de 2GB asignada para un sistema operativo Linux? ¿Hay algún problema que pueda ocurrir con la computadora portátil?

Cómo aumentar el ram de una computadora portátil vieja

¿Puedo poner una RAM DDR-4 de 3000 MHZ en una placa base que dice que es compatible con DDR4-2133 / 2400/2800/2933/3200/3600? ¿Se descuenta automáticamente a 2933 MHZ?

¿Debo comprar una Macbook Air con 128 GB o 256 GB? ¿Y qué diferencia tendría tener 4 GB de RAM en lugar de 8 GB de RAM?

¿Los juegos ejecutarán mejores gráficos con más RAM?

¿Por qué las aplicaciones de Android consumen más RAM, incluso mi PC funciona con 2 GB de RAM pero mi teléfono inteligente se atasca a veces con 1 GB de RAM?

¿Cuál es la mejor opción en una computadora portátil: la mejor RAM ddr3 de 8 Gb o la RAM ddr3 de 16 GB más barata?

Como de costumbre, depende, pero en el caso de Spark, que sabe cómo usar la memoria, le daría tanta memoria como sea razonable para una sola JVM. Mi estadio es de 10GB.

David Gruzman

Más de lo que originalmente piensas. A veces mucho más.

Claramente depende mucho del sistema, pero en mi pequeña experiencia es bastante fácil salir de la excepción de memoria.

David Gruzman

More Interesting

Cómo actualizar la memoria RAM de mi Mac

¿Qué se usa con más frecuencia en estos días: SDRAM, DRAM o RAM? ¿Cuál te da una mayor velocidad de procesamiento de datos?

¿Cómo afecta el ram al trabajo CAD?

¿Cuánto más lento se reanudaría una PC desde la hibernación con 16 vs 8GB de RAM con un SSD rápido?

¿Es posible agregar más RAM a una computadora de placa única mediante soldadura (es decir, Raspberry Pi o BeagleBone u Odroid o Toradex)?

¿Cuánta RAM debería asignar a mi Ubuntu VM (que usaré para desarrollar aplicaciones y juegos) cuando actualmente tengo 24 GB de RAM ddr4 en mi computadora portátil?

¿Un aumento de RAM ayudará a acelerar mi Lenovo?

¿Debería establecer el tamaño del archivo de paginación 1,5x de la cantidad de RAM?

¿Puedo actualizar la RAM de mi computadora portátil y un procesador?

¿Qué es mejor: RAM de doble canal o RAM de cuatro canales?

¿Son suficientes 16 GB de RAM para jugar en mi computadora portátil?

¿Por qué hay una diferencia en las dimensiones físicas de una RAM móvil y de computadora?

¿Qué aplicación puedo usar para aumentar mi RAM?

¿Lumia mobile se cuelga cuando tiene una RAM de 512 MB?

¿Cuál es la diferencia entre RAM y procesador desde un punto de vista funcional?

Web Analytics