Nos formations - École "Programmation hybride : une étape vers le many-coeurs ?"

lundi 08/10

09:00 12:30

Pourquoi l’hybride ?

E. Petit (Université Versailles St Quentin)

Au milieu de la dernière décennie, les architectures des processeurs ont pris un très net virage. Pour des raisons de consommation, de surface, de complexité et d'efficacité, la progression des architectures mono-coeurs a ralenti puis a laissé la place aux architectures multi-coeurs. Afin d'en obtenir les meilleures performances, il est nécessaire de faire apparaître du parallélisme de tâches. Dans le HPC cela se traduit par l'utilisation de schémas de programmation hybride tel que MPI+OpenMP. Par ailleurs, parmi les pistes explorées pour contourner le ralentissement des architectures mono-coeurs, des solutions d'accélérateurs matériels ont été étudiées. Les efforts de compatibilité aux normes (flottant en particulier), les efforts sur les environnements de programmation et le support d'un marché grand public ont permis aux GPUs de s'imposer, en particulier le couple NVIDIA/CUDA. Leurs architectures massivement parallèles présentent un paradigme nouveau pour les développeurs, les obligeant à retravailler en profondeur leurs applications. Dans ce cours, nous allons aborder les mécanismes architecturaux de base permettant de comprendre l'apport des multi-coeurs et les différences fondamentales entre CPU et GPU. Nous verrons ensuite comment et pourquoi ces architectures impactent les applications. Enfin nous aborderons les architectures nouvelles et les perspectives pour l'avenir.

14:00 15:30

Un exemple de A à Z

M. Tajchman

Le cours commencera par une introduction sur les méthodes physiques, numériques et algorithmiques mises en place dans un code 2D hydrodynamique. On présentera ensuite des versions construites en utilisant différentes méthodes de parallélisation: multi-threads (OpenMP, TBB), multi-processus (MPI), calcul sur GPU (Cuda), ainsi que des combinaisons de ces techniques. L'examen de ces versions ainsi que des exemples simples illustreront des conseils sur les choix de parallélisation, l'importance de l'organisation des accès mémoire, le recouvrement calcul-communications, etc.

mardi 09/10

09:00 17:30

Un exemple de A à Z(suite)

mercredi 10/10

09:00 12:30

Placement des processus

L. Saugé (BULL)

Le caractère "fortement" NUMA des architectures many/multi cores en général, nous oblige à nous poser la question de la stratégie du placement des processus dans ces environnements. En effet, dans ce contexte, l'un des premiers principes d'optimisation (de la performance) des codes est d'assurer aux processus la localité des accès mémoires et autres ressources.

Le but de ce cours est de d'appréhender et comprendre les contraintes qu'impose ces architecture sur les performances des codes "parallèles" au sens large, que ce soit en mode intra ou inter-noeuds.

Il sera fait quelques rappels sur les architectures des machines multi/many cores (cpu, mémoires) et il sera abordé en détails les moyens d'assurer le placement des processus afin d'optimiser les performances des codes.

Divers aspects pratiques seront abordés, entre autre:

14:00 17:30

Parallel Codes and High Performance Computing: Massively parallelism and Multi-GPU

L. Genovese (CEA)

In this presentation, we will start by revisiting the main aspects of evolution of parallel architectures from three points of view: Machine construction, code developments and code usage. In particular, we will see how these facts will influence the conception of High Performance Computing codes. We will focus on the aspects of combining CPU and GPU acceleration in a massively parallel environments.

In particular, we will see how hybrid codes conceptions influence the interpretation of performance results by the user. We will provide some examples which will show that performance benchmarking is a multicriterion evaluation process: the application should be correctly dimensioned on the computing machine.

jeudi 11/10

09:00 12:30

MPC

M. Pérache et S. Valat (CEA)

L'évolution actuelle des architectures vers le multi/many-core marque la fin du modèle Full-MPI au profit d'une approche MPI + X (X étant un modèle de threads/tâches). Dans ce contexte, le CEA et le laboratoire Exascale ont développé le support exécutif MPC qui a pour objectif d'unifier les modèles de programmation MPI et OpenMP/PThread au sein d'un même runtime. Cette unification permet d'optimiser l'implémentation MPI pour tirer parti de la présence d'autres threads et vis-versa pour OpenMP. Dans le même temps, l'arrivée des multi-cœurs a pour effet d'amorcer la diminution de la quantité de mémoire disponible par cœur. Dans ce contexte, MPC propose des extensions de gestion des données (HLS, allocateur mémoire, ...) pour les "legacy codes" qui permettent de réduire l'empreinte mémoire du support exécutif, mais aussi du code utilisateur en factorisant les données entre les processus MPI par exemple.

14:00 17:30

Programmation par directives pour le calcul hybride: HMPP et OpenACC

F. Lebeau (CAPS Entreprise)

Cette présentation fournira aux participants les bases et la méthodologie pour porter une application vers les systèmes hétérogènes. Après une introduction aux architectures massivement parallèles, les participants apprendront à optimiser efficacement une application avec les jeux de directives HMPP et OpenACC : notamment en ce qui concerne les transferts de données et les optimisations de calculs. Cette présentation s'accompagnera d'une description du fonctionnement d'HMPP Workbench développé par CAPS entreprise et de ses fonctionnalités.

vendredi 12/10

09:00 14:00

Programmation par directives pour le calcul hybride: HMPP et OpenACC (suite)

École "Programmation hybride : une étape vers le many-coeurs ?"

Descriptif de la formation

Programme

lundi 08/10

mardi 09/10

mercredi 10/10

jeudi 11/10

vendredi 12/10