Cómo usar el lenguaje C para escribir un programa para hacer una matriz de multiplicación que permita 1, 2, 3, 4, 5, 6 o 7 hilos que corren paralelos

Supongo que está preguntando acerca de la multiplicación de matriz de matriz densa aquí.

Existe el proyecto PLASMA que implementa rutinas de álgebra lineal densa para arquitecturas de memoria compartida, y ha estado apuntando a tales arquitecturas desde cero.
Los paquetes de subprogramas de álgebra lineal básica (BLAS) anteriores también se han modificado para poder ejecutarse en un entorno roscado; Estos incluyen GotoBLAS, Intel’s MKL, ATLAS, Apple’s Accalerate, OpenBLAS y probablemente otros.
El código especializado para la multiplicación de matriz de matriz densa incluye los algoritmos de Gerbessiotis implementados en BSP, que pueden ejecutarse en su arquitectura de destino utilizando MulticoreBSP para C; estos suelen ejecutarse más rápido que sus homólogos basados en MPI. Sin embargo, nunca he visto una comparación con PLASMA u otros códigos diseñados para arquitecturas de memoria compartida.

Pondré lo que creo que son los enlaces más prometedores aquí:
PLASMA por la Universidad de Tennessee
Multiplicación de matriz densa paralela por Gerbessiotis
MulticoreBSP

En cuanto a cómo implementar la rutina paralela; Esta es una tarea complicada para hacerlo bien. Ver, por ejemplo:
Multiplicación de matriz eficiente en memoria en el modelo BSP de McColl & Tiskin.

¡Estaría interesado en conocer sus experiencias!

Related Content

¿Qué proyecto utilizando la teoría de grafos sería apropiado para una tesis de licenciatura de CS?

¿Cuál es el orden de las operaciones para la notación sigma?

¿Cuáles son algunos de los temas de teoría de gráficos que necesito aprender para hacer el bien en la programación competitiva?

Cómo resolver la relación de recurrencia T (n + 1) = T (n) + ceil (n + 1) usando la sustitución para hacer un análisis asintótico

¿Qué pasaría si alguien prueba P = NP o P! = NP?

Cómo encontrar qué aplicaciones están conectadas a Internet y están consumiendo el balance de datos

¿Por qué no funciona mi función de búsqueda binaria?

Este documento, Página en sourceforge.net, enumera casi todos los algoritmos de álgebra lineal disponibles.

Shane Barratt

Prueba OpenMP.org. Fácil de usar. Simplemente descárguelo, # inclúyalo y coloque ‘#pragma omp parallel for’ encima de su bucle. La aceleración será impresionante.

Shane Barratt

More Interesting

¿Qué módulo será más útil, análisis multivariado o análisis bayesiano?

¿Cuál es la diferencia entre el aprendizaje PAC y el aprendizaje agnóstico PAC?

¿Las matemáticas son importantes para la piratería informática?

Me siento cómodo resolviendo problemas matemáticos. Sin embargo, cuando tengo que programar y derivar la respuesta para esos problemas, tengo dificultades para traducir mis pasos matemáticos en código. ¿Qué me recomiendan hacer para superar este problema?

¿Cuándo espera que se resuelva P vs. NP?

¿Qué tan probable es que las computadoras alienígenas se basen en algo equivalente a un UTM?

¿Cuál es el estado actual de la computación analógica?

¿Cómo se puede aplicar la lógica modal a las matemáticas?

¿Cuál es la mejor manera de dibujar un gráfico de teoría de grafos rápidamente?

¿Qué significa una garantía teórica en el aprendizaje automático?

¿Dónde puedo conocer y salir con profesores que trabajan en la intersección de algoritmos de aproximación y teoría de números algebraicos?

¿Qué debe incluirse en cualquier programa que use la función matemática?

¿Cuáles son algunas historias menos conocidas sobre Alan Turing?

¿Podría alguien explicarme en términos simples el significado de la teoría de la complejidad, la teoría del caos y la teoría de juegos?

¿En qué subáreas de matemáticas debería centrarme para mejorar mis algoritmos en informática?

Web Analytics