Nos formations - École "Optimisation"

lundi 07/10

10:30 12:30

Introduction

William Jalby (Université Versailles St Quentin)

12:30 14:00

Repas

14:00 15:30

Optimisation de base et vectorisation

Romaric David

15:30 16:00

Pause

16:00 17:30

Optimisation de base et vectorisation

Romaric David

mardi 08/10

09:00 10:30

Caches (Partie 1)

David Büttner (TUM)

The Memory Hierarchy
Caches: Why & How do they work?
Bad Memory Access Patterns
How to not exploit Caches
Cache Optimization Strategies
How to exploit Caches even better

10:30 11:00

Pause

11:00 12:30

Caches (Partie 2)

David Büttner (TUM)

Cache Analysis
Measuring on real Hardware vs. Simulation
Cache Analysis Tools
Case Studies
Hands-on

12:30 14:00

Repas

14:00 17:30

Benchmark

Laurent Gatineau (NEC)

Introduction
- 1.1 Définitions
- 1.2 Objectifs des benchmarks
- 1.3 Les différentes phases d'un benchmark
Benchmarks synthétiques et éléments d'architecture
- 2.1 Processeur
- 2.2 Mémoire et cache
- 2.3 Réseau rapide
- 2.4 Système disques
- 2.5 Accélérateur
Benchmark applicatif
- 3.1 Portage et validation numérique
- 3.2 Classification de l'application
- 3.3 Profiling (CPU, MPI)
- 3.4 Projection des performances
Travaux pratiques
- Contenu ouvert en fonction des utilisateurs:
  - prise en main des benchmarks synthétiques
  - classification / profiling d'un code utilisateur

mercredi 09/10

12:30 14:00

Repas

14:00 17:30

Introduction to Performance Analysis

Florian Janetzko (Juelich Supercomputing Centre)

The complexity of modern High-Performance-Computing systems impose great challenges on running parallel applications efficiently on them. Performance analysis is therefore a key issue to identify bottlenecks and efficiency problems in HPC applications in order to improve and optimize the performance of these applications. We start with an overview of different performance problems which frequently occur in parallel applications and give an introductions to the concepts of performance analysis. In the second part we will discuss selected performance analysis tools in more detail and show how to use them in order to identify bottlenecks.

jeudi 10/10

09:00 12:30

Optimisation de noyaux CUDA avec les outils de "profiling" Nvidia.

Julien Demouth (Nvidia)

Lors de cette session nous présenterons une méthode pour optimiser des noyaux GPU écrits en CUDA et nous la mettrons en pratique sur un cas concret. Pour améliorer les performances de notre application, nous utiliserons les outils de « profiling » : Nsight et Nvprof.

12:30 14:00

Repas

14:00 17:30

Introduction aux entrées-sorties parallèles

Philippe Wautelet (IDRIS/CNRS)

Les supercalculateurs sont de plus en plus massivement parallèles. Dans ce contexte, l'importance des entrées-sorties devient de plus en plus cruciale. Le but de cette introduction est de présenter les différentes approches existantes pour réaliser des entrées-sorties performantes, leurs avantages et inconvénients, ainsi que les principes de fonctionnement des systèmes de fichiers parallèles. Des travaux pratiques seront réalisés pour mettre en oeuvre les concepts introduits lors de cette présentation.

vendredi 11/10

09:00 12:30

Expériences d'entrées-sorties sur architectures massivement parallèles

Philippe Wautelet (IDRIS/CNRS)

Les performances des systèmes d'entrées-sorties de plusieurs supercalculateurs ont été évaluées à l'aide d'une vraie application scientifique. Les résultats obtenus et les problèmes rencontrés seront exposés.

École "Optimisation"

Description

Programme

lundi 07/10

mardi 08/10

mercredi 09/10

jeudi 10/10

vendredi 11/10

Comité d'organisation