Description

Formation CNRS : Choix, installation, exploitation d’un calculateur.

Autrans, du 5 au 9 octobre 2009.

Programme

lundi 05/10

13:30 14:30 Pas de support disponible

Introduction

  • Tour de table, attentes
  • Introduction à la formation
14:30 16:00 Télécharger le support

État des lieux moyens de calcul, mésocentres et GENCI

Violaine Louvet

Le paysage français du calcul a beaucoup évolué ces dernières années. Ce cours a pour but de présenter les différentes structures liées au calcul (moyens matériels mais aussi structures de recherche et d’animations scientifiques) afin d’avoir une vue globale de la situation du calcul en France. Les points qui seront en particulier abordés sont :

  • PRACE, GENCI ;
  • les mésocentres ;
  • les grilles de recherche et de production ;
  • les GDR et réseaux liés au calcul ;
  • les structures d’animation scientifique ;
  • l’offre de formation.
16:30 18:30 Télécharger le support

Les grilles de production (+TP)

Bruno Bzeznik

Il ne faut pas confondre "grille de calcul" et "grappe de calcul". Les grilles se situent à un autre niveau d’échelle, mais ce ne sont pas non plus toujours des grappes de grappes. Nous verrons dans cet exposé quelques définitions pour comprendre les grilles, nous aborderons quelques problématiques et des exemples. Enfin, pour comprendre certains concept à un niveau pratique, nous utiliserons ensemble une grille de production légère : CiGri.

mardi 06/10

08:30 10:30 Télécharger le support

Architectures aujourd’hui et demain

Françoise Roch

Ce cours présente les caractéristiques des architectures des plateformes de calcul haute performance et détaille plus particulièrement les architectures de processeurs, les différents niveaux de hiérarchie mémoire, les solutions d’interconnexion. Nous nous intéresserons aux différents méthodes qui ont été mises en oeuvre au cours des 10 dernières années pour gagner en performance, et aux facteurs qui déterminent aujourd’hui l’évolution des processeurs et des calculateurs.
11:00 13:00 Télécharger le support

Modèles de programmation

Guy Moebs

Cet exposé est une introduction au calcul parallèle sur les architectures généralistes actuelles. Son usage permet des gains de performances significatifs mais cela nécessite un peu de méthode. Plusieurs paradigmes existent ; nous nous intéressons aux deux principaux : parallélisme de données (OpenMP) et parallélisme de tâches (MPI). Les performances et techniques sont fortement liées aux modèles de machines parallèles, architecture et interconnexion des processeurs.
15:00 16:30 Télécharger le support

Contraintes d’hébergement, problématiques énergétiques, refroidissement

Dominique Boutigny

Dans ce cours, nous présenterons la problématique de l’hébergement des ressources informatiques. En s’appuyant sur des exemples concrets nous montrerons quelles sont les principales contraintes liées à la consommation électrique, au refroidissement et à l’agencement des salles. Un point particulier sera consacré aux aspects environnementaux tant du point de vue légal que citoyen. Les stagiaires seront invités à échanger librement au cours de cette session et sont les bienvenus pour proposer des exemples ou des problèmes concrets.
17:00 19:30 Télécharger le support

Etat des lieux des gestionnaires de batch, configuration

Olivier Richard

Après une introduction sur l’utilité des gestionnaires de ressources (aussi appelés Batch Scheduler), nous présenterons les grands principes de leur structure. Par la suite nous détaillerons certaines fonctionnalités, et les principaux logiciels disponibles. Des études cas seront aussi abordés pour illustrer les choix de configurations auxquels doit faire face un adminstrateur de grappe de calcul.

mercredi 07/10

08:30 13:00 Télécharger le support

Installation d’un cluster : différentes approches de déploiement de systèmes - Etat des lieux des installations de cluster / déploiements

Nicolas Capit

  • Introduction sur les outils de déploiement
  • Les distributions standards et leurs méthodes de déploiement intégrées
  • Les outils de déploiement qui s’appuis sur des distributions standard
  • Les distributions spécialisées
  • Les mises à jours après déploiement
  • Questions/réponses
15:00 19:30

Déploiement d’un cluster

Sessions parallèles

Télécharger le support Clustervision
Télécharger le support Kerlabs
Télécharger le support SGI

Présentation des solutions actuelles par les différents prestataires du domaine (4 sessions en parallèle)

  • Kerrighed
  • SGI
  • Bull
  • Clustervision

jeudi 08/10

08:30 13:00

Outils de développements et librairies

Thierry Dumont, Romaric David

Télécharger le support T. Dumont
Télécharger le support R. David

Politique d’installation des librairies scientifiques : finalités des différentes librairies, installation, utilisation (avec TP), Thierry Dumont. Outils de développement et d’optimisation, implémentation (MPI), installation et utilisation (avec TP), Romaric David. Ce cours présentera un panorama des outils de base qu’on retrouve sur tout cluster de calcul et qui sont nécessaires à un chercheur lorsqu’il s’approprie une machine :

  • Quels compilateurs puis-je utiliser ?
  • Où sont les bibliothèques mathématiques ?
  • Quel est le MPI géré et maintenu par les administrateurs système ?

Une fois ces outils connus, nous examinerons comment :

  • analyser les performances d’un code parallèle
  • utiliser un IDE pour le développement d’applications MPI
15:00 19:30 Télécharger le support

Benchmarks : aspects théoriques, aspects pratiques, TP sur différentes architectures, interprétation des résultats

Ludovic Saugé

La phase de benchmarking est bien évidemment primordiale pour orienter le choix d’une machine : elle permet entre autre de comparer les différentes solutions entre elles. Elle permet aussi aux différents vendeurs de contraindre l’architecture qui sera proposée en fonction des différents résultats obtenus par l’excution du jeu de test soumis. Au delà, ils permettent au cours de la vie de la machine de détecter d’éventuels problèmes ou régressions.

Les benchmarks sont des outils de mesure permettant de déterminer les performances d’un système, d’une sous-partie de ce système voire d’un élément particulier de celui-ci. Encore faut-il savoir ce que l’on souhaite mesurer et comment le mesurer.

Au cours de cette séance, je présenterai certains aspects théoriques mais aussi plus pratiques. Entre autre :

  • les différents aspects touchant aux performances des divers élements d’un cluster (CPU, mémoire, interconnect rapide, système d’IO ...) et que sont les valeur pertinentes à mesurer et comment les mesurer,
  • les bons usages pour préparer au mieux son jeu de tests et d’éviter certains pièges.

Suivra une séance de travaux pratiques où l’utilisateur sera invité à effectuer quelques benchmarks sur différents systèmes.

vendredi 09/10

08:30 10:30 Télécharger le support

Procédures d’achat

Françoise Berthoud

Méthodologie, traduction des besoins en spécifications techniques dans un cahier des charges, choix des critères de sélection des offres/pondération : théorie et mise en pratique. Les stagiaires seront invités à apporter un CCTP et à travailler sur son analyse, amélioration par binome ou trinome.
11:00 12:00 Télécharger le support

Monitoring de clusters, pourquoi, comment ?

Olivier Brand-Foissac

A quoi sert le monitoring, en quoi est-il nécessaire ? Comment fonctionne-t-il ? Quels sont les avantages et inconvénients des différents types ? Quelles spécificités dans un cluster de calcul ? Les outils disponibles les plus courant. Exemples.