Séminaire IMS 10/01/2008 Distribution large échelle d’un algorithme financier de contrôle stochastique CIGC05 - GCPMF Xavier WARIN (EDF R&D - OSIRIS) Stéphane.

Slides:



Advertisements
Présentations similaires
17ème Forum sur les Impédances Electrochimiques, 31/01/05, Paris
Advertisements

Le moteur
1. Résumé 2 Présentation du créateur 3 Présentation du projet 4.
La Méthode de Simplexe Standardisation
Module Systèmes d’exploitation
Produit Gammes Nomenclatures Modules Techniques Prix de Revient Prix de Vente Modules Techniques Client Marges Mise en route Temps Unitaire Prix (Ex:
Fabrice Lauri, François Charpillet, Daniel Szer
Non linéarités liées à la thermique
Les déterminants des investissements des salariés dans les FCPE d’Actionnariat Salarié Monsieur le Président, messieurs les membres du jury, je vous remercie.
Simplification Out-of-Core des modèles polygonales complexes
LIRMM 1 Journée Deuxièmes années Département Microélectronique LIRMM.
Reconnaissance de la parole
Les numéros
ACTIVITES Le calcul littéral (3).
Les Prepositions.
1 MONDER2006 – 11/01/ Etudes de sensibilité pour la prospective électrique française à laide du modèle MARKAL Edi Assoumou.
Simplification et abstraction de dessins au trait
Journées franciliennes 2006 Moussa ELKIHEL (LAAS-CNRS;UPS Toulouse )
Exercices Algorithmiques
Performances 1 Évolution : Performance. Performances 2 Évolution : Mémoire.
Génération interactive dimages projectives : Application à la Radiothérapie Pierre BLUNIER Du 01/12/2002 au 28/03/2003 Centre Léon Bérard.
1 Placement automatique des composants lors du déploiement dapplications à base de composants Abdelkrim Beloued Chantal Taconet, Dhouha Ayed, Guy Bernard.
La diapo suivante pour faire des algorithmes (colorier les ampoules …à varier pour éviter le « copiage ») et dénombrer (Entoure dans la bande numérique.
Parallélisation d’un Algorithme CNFT
1 Analyse de la variance multivariée Michel Tenenhaus.
07/24/09 1.
Sélection automatique d’index et de vues matérialisées
Améliorer les performances du chiffrage à flot SYND
Des RRA à la diagnosticabilité
Architecture de grille générique, multi-
Projet .NET : Projet GEn A4RIL
Application des algorithmes génétiques
II. Chaînage, SDD séquentielles
Vuibert Systèmes dinformation et management des organisations 6 e édition R. Reix – B. Fallery – M. Kalika – F. Rowe Chapitre 2 : Les applications fonctionnelles.
Journée thématique du GDR IFS « Réduction de modèle en IFS » ENSAM – Jeudi 18 mai 2006 Validation de l’approche de la réduction a priori - POD sur l'équation.
1 SERVICE PUBLIC DE LEMPLOI REGION ILE DE France Tableau de bord Juillet- Août 2007.
Détection de co-évolution de gènes Master 2 : Informatique à Finalité Professionnelle et Recherche Unifiée (IFPRU) Parcours Ingénierie de lIntelligence.
Cours Corporate finance Eléments de théorie du portefeuille Le Medaf
F Copyright © Oracle Corporation, Tous droits réservés. Créer des programmes avec Procedure Builder.
La Saint-Valentin Par Matt Maxwell.
« Recherche de méthode d’estimation de volume de production à risque »
Présenté à: M. Froduald Kabanza Par: Jonathan Pelletier Cody Stoutenburg Simon-Pierre Thibault.
Programmation linéaire en nombres entiers Algorithme de la subdivision successive («Branch and Bound Algorithm»)
Programmation concurrente
Les modèles linéaires (Generalized Linear Models, GLM)
Universté de la Manouba
Notre calendrier français MARS 2014
Les changements de numéraire dans la tarification d’options
Quelle heure est-il ??. THE TIME: OCLOCK IL EST HEURE IL EST + + HEURES etc.
3ème partie: les filtres
Détection du meilleur format de compression pour une matrice creuse dans un environnement parallèle hétérogène Olfa HAMDI-LARBI.
C'est pour bientôt.....
Veuillez trouver ci-joint
Ordonnancement de tâches
SUJET D’ENTRAINEMENT n°4
Programmation linéaire en nombres entiers : les méthodes de troncature
ECOLE DES HAUTES ETUDES COMMERCIALES MARKETING FONDAMENTAL
Stage 2A CS80 pour Origin 1/28. 1) Presentation of the internship 2) The Multi-Oscillator 3) Connection-GUI’s API Conclusion Stage 2A CS80 pour Origin.
Traitement de différentes préoccupations Le 28 octobre et 4 novembre 2010.
ECOLE DES HAUTES ETUDES COMMERCIALES MARKETING FONDAMENTAL
1 Modèle pédagogique d’un système d’apprentissage (SA)
10 paires -. 9 séries de 3 étuis ( n° 1 à 27 ) 9 positions à jouer 5 tables Réalisé par M..Chardon.
CALENDRIER-PLAYBOY 2020.
Programmation dynamique
Les Chiffres Prêts?
Réunion ANR - GCPMF 15/01/2008 Xavier WARIN (EDF R&D - OSIRIS)‏ Stéphane VIALLE (SUPELEC - IMS)‏ Constantinos MAKASSIKIS (SUPELEC - IMS, LORIA - AlGorille)‏
Ordonnancement en présence d’agents individualistes
Transcription de la présentation:

Séminaire IMS 10/01/2008 Distribution large échelle d’un algorithme financier de contrôle stochastique CIGC05 - GCPMF Xavier WARIN (EDF R&D - OSIRIS) Stéphane VIALLE (SUPELEC - IMS) Constantinos MAKASSIKIS (SUPELEC - IMS, LORIA - AlGorille)

Introduction 1

Introduction Objectif : présentation du travail effectué dans l’équipe IMS depuis février 2007. Travail s’inscrit dans le cadre du projet ANR-GCPMF : consortium d’industriels et d’académiques But : étude de la faisabilité de l’utilisation de clusters/grilles de calculs pour la finance Cause : augmentation incessante des besoins en puissance de calcul

Introduction Solution : distribution/parallélisation. pour accélerer et passer à l’échelle Actuellement, parmi les applications en finance : celles qui se décomposent en tâches indépendantes commencent à être bien maîtrisées (applications Bag of Tasks (BoT)) ; celles qui se décomposent en tâches inter-dépendantes font l’objet de recherches …

Introduction En collaboration avec EDF, distribution d’une application utilisée pour la valorisation d’actifs de stockage de gaz. Application non BoT, mettant en jeu : des calculs intensifs ET des communications fréquentes : redistribution régulière de données et de résultats  nécessite une optimisation des échanges de données

Contexte financier 2

Contexte financier Actif de stockage de gaz : cavité où est stocké le gaz ; matériel (pompes, …) pour injecter/sous-tirer. Contraintes de fonctionnement diverses. Gaz OUT IN Fluctuations des prix du gaz : Cause : modification de la demande (hiver, été) Conséquence : possibilité d’arbitrer pour profiter de la dynamique des prix → valorisation

Contexte financier La valorisation fait appel à : des algorithmes de contrôle stochastique des modèles de prix variés Dans notre cas le propriétaire veut déterminer à quel prix il va louer une partie de son actif. Pour ce faire, il se fonde sur les résultats potentiels de différentes stratégies de gestion qu’il aurait pu appliquer sur la portion louée s’il ne l’avait pas louée.

Distribution de l’algorithme 3

Algorithme séquentiel Aujourd’hui Futur Prix de location à t0 Phase 1 : une phase rapide de génération de futurs possibles (arbre trinomial: à chaque noeud possibilité d’injecter du gaz, d’en soutirer ou de ne rien faire) Phase 2 : phase d’application de l’algorithme de contrôle stochastique (résolution backwards; phase d’optimisation pour choisir la meilleure stratégie de gestion) Intervention de calculs stochastiques complexes dépendants des niveaux de stock admissibles et d’aléas de prix issus du modèle de prix utilisé t0 tn-1 tn Calculs Stochastiques Hypothèses de terminaison

Algorithme séquentiel Pour chaque pas de temps (de tn-1 à t0) Pour chaque niveau de stock admissible Calcul complexe pour déterminer la meilleure décision à prendre au temps ti avec un niveau de stock si : « Injecter, ne rien faire ou soutirer ? »

Difficultés de parallélisation Pour chaque pas de temps (de tn-1 à t0) Pour chaque niveau de stock admissible Calcul complexe pour déterminer la meilleure décision à prendre au temps ti avec un niveau de stock si : « Injecter, ne rien faire ou soutirer ? » La parallélisation au niveau de la boucle la plus externe est impossible à cause des dépendances de l’algorithme. Le niveau le plus intéressant se trouve au niveau de la boucle sur les niveaux de stock.

Structures de données A chaque pas de temps utilisation de deux tableaux : OldRes et NewRes. OldRes : contient les résultats du pas de temps précédent. NewRes : pour mémoriser les résultats du pas de temps courant. Problème : à chaque pas de temps le travail s’effectue sur une zone contiguë mais à bornes variables. A ti : Niveaux de stock Aléas de prix Résultats à ti+1 OldRes Calculs Résultats à ti NewRes

Schéma de parallélisation En séquentiel, on peut se placer dans le cas ci-contre. NewRes Redistribution Devient ti : OldRes Calculs En parallèle : NewRes Solution 1 : réplication des tableaux. broadcast. Solution 2 : optimisation de la taille des tableaux. redistribution de ce qui est nécessaire.

Schéma de parallélisation Sur P1: P2 P1 P0 P2 P1 P0 Res à ti+1 ti : 1) Déterminer la nouvelle distribution des calculs à ti P1 P2 P0 Res à ti 2) Déterminer les données requises à ti par P1 (Receive) Plan de routage P2 P1 P0 C D 3) Déterminer les données à envoyer par P1 (Send) A B 4) Allouer structures de données de taille optimale P0 P1 C A D P2 - B Receive Send 5) Effectuer les communications selon le plan de routage (MPI) P1 P2 P0 6) Calculer Res à ti

Etude des performances 4

Evaluation des performances Expérimentations sur 3 architectures distribuées : Deux clusters de PCs (SUPELEC et GRID’5000/Sophia). Le supercalculateur Blue Gene/L d’EDF R&D. Avec 3 modèles de prix du gaz : Besoins Modèle Calculs Mémoire Gaussien « G » * Normal Inverse Gaussien « NIG » ** Gaussien 2 facteurs « G-2f » ****

Performances avec « G » 54min 14min 8 15s 64 1024 56x sur Opteron 216x sur BG

Performances avec « NIG » 6h40 3min 128 1024 133x = (6*60 + 40)/3

Performances avec « G-2f » Besoin de beaucoup de mémoire 11 Go pour l’exécution séquentielle 10 CPUs avec 2 Go en parallèle Exécution rendue possible par notre distribution Scale jusqu’à 1024 processeurs Limitation : Impossible de calculer un speedup rigoureux Donc étude d’extensibilité (seulement)

Performances avec « G-2f » 14h 16 2h20 128 46min 1024 Blue Gene wins !

Etude d’extensibilité avec « G-2f » Maintient du temps d’exécution

Conclusion & Perspectives 5

Conclusion & Perspectives Distribution originale d’un algorithme itératif de contrôle stochastique dynamique : distribution à chaque pas de temps des calculs et des données. Résultats issus des expérimentations témoignent de l’efficacité de notre distribution sur clusters de PCs (128 CPUs) et supercalculateur (1024 CPUs) Accéleration de l’exécution sur trois modèles de prix aux caractéristiques variées 2 modèles de référence et 1 nouveau modèle

Conclusion & Perspectives Actuellement, une version multidimensionnelle de l’algorithme destinée à gérer plusieurs actifs de stockage simultanément, mise au point conjointement par EDF R&D et SUPELEC, est en train d’être évaluée. Un cas test sur 7 stocks met : 18 h sur les 32 PCs du cluster de SUPELEC ; 5h50 sur 1024 nœuds de Blue Gene. Les temps de calculs sont réduits MAIS restent longs ! La possibilité d’occurrence de pannes n’est pas écartée : même sur Blue Gene !

Conclusion & Perspectives A présent investissement dans l’étude des techniques de tolérance aux pannes.

Questions ? ?