2 de mis colegas y yo estamos haciendo una presentación sobre Open MP, ¿pueden decirme qué temas trataremos?

Usted no describe para qué sirve, así que solo voy a describir un proyecto modesto que podría encontrar interesante.

Tenga en cuenta que OpenMP es implementado por el compilador, y que hay múltiples compiladores disponibles para una plataforma determinada (por ejemplo, Linux). ¿Difieren en rendimiento? Son algunos mejores que otros? ¿Cómo se separa el rendimiento de OpenMP del rendimiento del cálculo que se está compilando? ¿Las implementaciones del compilador aprovechan, por ejemplo, la retroalimentación dirigida al perfil?

OK, aquí hay otro: probablemente sepa que todos los multiprocesadores son asimétricos hoy en día: hilos, núcleos, módulos, nodos numa. Considere cómo se podría soportar o aprovechar este tipo de estructura en un programa OpenMP. ¿Tiene sentido exponer esta estructura al programador? Si elige una arquitectura de ejemplo (por ejemplo, un sistema haswell-v2 de 4 sockets), ¿puede aproximar cualquiera de los límites de rendimiento en un código compatible con la topología en lugar de ignorarlo?

Algo similar a esto: la página en openmp.org sería genial. Han explicado todo (lo básico) que uno debe saber de una manera muy accesible y organizada.
E intente agregar fragmentos de código de código de trabajo, una demostración que muestra la aceleración lograda sobre la parte en serie normal, etc.