1 Réunion ANR-CIGC GCPMF 15 mars 2006 Architecture de grille générique, multi- paradigmes et tolérante aux pannes, pour le temps contraint. Application.

Slides:



Advertisements
Présentations similaires
Windows Server 2012 Mode de licence.
Advertisements

Développement dapplications sur mobiles.NET et J2ME, C++ et Symbian WIPLIER Thomas – M2IRT2009 – 15/02/2007.
Génie Logiciel 2 Julie Dugdale
ASP.NET v2 + Ajax = Atlas Pierre Lagarde DevDays 2006 Equipé aujourdhui, prêt pour demain !
Présenté Mouhamadou Thiam Experimental Comparison between Bagging and Monte Carlo Ensemble Classification auteurs Roberto Esposito & Lorenza Saitta.
Data Management for Large-Scale Scientific Computations in High Performance Distributed Systems A. Choudhary, M. Kandemir, J. NoG. Memik, X. Shen, W. Liao,
ACTIVITES Le calcul littéral (3).
1/22 Présentation Dechou & CO Développement dun programme de gestion dascenseurs Spécifications fonctionnelles générales.
1/22 Présentation Dechou & CO Développement dun programme de gestion dascenseurs Spécifications fonctionnelles générales.
PhotoManager eXtreme Présentation IceCream team Besoins Étude existant Technologies Découpage des tâches Conclusion.
LA TECHNOLOGIE WAP WIRLESS APPLICATION PROTOCOL Arnaud MERGEY Davy RIBOUD David ZAMORA DESS RESEAUX 2000/2001.
Réseaux IP/MPLS Yazid KARKAB IR3.
Coopération/Distribution DEA Informatique Nancy. Content 4 Introduction - Overview 4 Coordination of virtual teams : –explicit interaction model –explicit.
Mise en œuvre d’une démarche et d’un outil de gestion de « connaissances métier » basés sur la collaboration. Cyril BEYLIER
Vers un outil d’aide à la conception des cannelures à flancs en développante de cercle La recherche effectuée lors de ma thèse a consisté à décrire le.
Directeur de Thèse : Pr. Witold Litwin
Journées franciliennes 2006 Moussa ELKIHEL (LAAS-CNRS;UPS Toulouse )
A abstraction b assembleur c nombre binaire d bit e cache f UC g puce h compilateur i famille dordinateurs j contrôle k chemin de données l défaut m dé
Distribution de politiques de sécurité IPsec F. BARRERE - A. BENZEKRI - G.GRASSET - R. LABORDE – Y. RAYNAUDIRIT/SIERA Université Paul Sabatier – Toulouse.
N. Jacq- LBP/CNRS - DataGrid France - November, 21th, 2001 Avancement du WP10 N. Jacq - LBP/CNRS marianne.in2p3.fr/datagrid/wp10.
18 avril 2002réunion Datagrid France1 E-toile Plate-forme RNTL 2001 Environnement matériel et logiciel pour le développement et l expérimentation de grille.
INTRODUCTION A JAVA Chapitre 1 : Introduction
JORAM Java Open Reliable Asynchronous Messaging
Informatique parallèle hautes performances

Séminaire IMS 10/01/2008 Distribution large échelle d’un algorithme financier de contrôle stochastique CIGC05 - GCPMF Xavier WARIN (EDF R&D - OSIRIS) Stéphane.
1 ACI DADDI - Réunion de lancement IRISA - Projet ADEPT Michel Hurfin Jean-Pierre Le Narzul Frédéric Tronel 23 mai 2005.
11:20:16 Programmation Web PHP Création et manipulation d'images Jérôme CUTRONA
Laboratoire d ’Interaction Collaborative, Téléformation, Téléactivités
METADYNE... L’architecture clients-serveurs d’un hypermédia adaptatif
L.I.S.E. Logiciel sur Internet de Système dEnchère L.I.S.E. Projet dinformatisation du système de production denchereenligne.fr L.I.S.E : Logiciel sur.
1 Introduction Le groupe BOSCH Contexte de travail Objectif à réaliser Développement du projet.
AliceFrancePhysique Un mode demploi à créer…. IPNO, 23 et 24 mai AFP : ses premières journées Organisées par Christian Kuhn, Christelle Roy, Yves.
DGA REI RECHERCHE EXPLORATOIRE ET INNOVATION Réseau d’ Observation Océanique Automatisé par Gliders 2007 – 2009/2010.
Analyse de la variance à deux facteurs (données déséquilibrées) Michel Tenenhaus.
L’EQUIPE PLURIDISCIPLINAIRE EN SOINS PALLIATIFS
Fabienne d’Arripe-Longueville
Les SHA…cest pas encore sha mais sha viendra !! Sophie Hervé et Anne-céline Ballet EOH Etablissement public de Santé mentale de la Réunion.
جامعــــــة محمد خيضــــــــــــر
Ecole de Chirurgie Faculté de Médecine de Nancy
MRP.
Projet TéléCabriJava - G. Kuntz - revue SIRAC - 17/10/00 Géométrie dynamique sur le Web
Contrôle daccès et qualité de service dans les réseaux basés sur ATM Olivier Paul.
La VISIO-FORMATION La formation personnalisée, en toute liberté….
Les eaux souterraines mises sur ordinateur
La règle des 24/14 secondes AWBB Département Arbitrage.
CYCLE 3 : Alternatives Faire des choix dans un programme en C 1- AIGUILLAGE SIMPLE sur CONDITION : if-else 2-AIGUILLAGE MULTIPLE sur CONDITIONS if-else.
Architecture de grille générique, multi-
Validation d’applications pour les Legos Mindstorms
Calcul distribué pour l'imagerie médicale
LES PRELEVEMENTS SUR RESSOURCES PROPRES
Rennes, le 18 septembre 2006 Support du paradigme maître-travailleur dans les applications à base de composants Tâche 2.2 Hinde Bouziane Réunion LEGO.
Ressources calcul 2014 Demandes d'heures DARI et PRACE 2 septembre 2013 Marie-Alice Foujols
PARALLEL COMPUTATION WITH INDUSTRIAL CODES Yannick HALLEZ & Benoît LABEYRIE.
Architecture Logicielle Les supports d’applications
Soutenance Orale, TER 2002 Equipe TENEBRION / J.P. Arcangeli
LA COMMUNICATION INTER-API
ADOBE FLEX 4. © Logica All rights reservedNo. 2 Introduction Flex en action Autour de Flex Logica Le programme.
Contribution du projet PARIS Christian Pérez Réunion LEGO LIP, ENS Lyon 10 février 2006.
Faculté I&C, Claude Petitpierre, André Maurer Le parallélisme Introduction.
LE PROFILE UML POUR MARTE
Détection du meilleur format de compression pour une matrice creuse dans un environnement parallèle hétérogène Olfa HAMDI-LARBI.
Séminaire Doc Mining Paris 13/11/2002 PSI Librairie Adam Sébastien Delalandre Mathieu Héroux Pierre.
KF-RAY Raytracer parallèle Projet long d’informatique
Supports de formation au SQ Unifié
Modèles et protocoles de cohérence des données en environnement volatil Grid Data Service IRISA (Rennes), LIP (Lyon) et LIP6 (Paris) Loïc Cudennec Superviseurs.
Étude d’un protocole de partage de travail entre systèmes Pair à Pair
PaCO++ André Ribes Réunion Hydrogrid Rennes 15/09/03.
Réunion ANR - GCPMF 15/01/2008 Xavier WARIN (EDF R&D - OSIRIS)‏ Stéphane VIALLE (SUPELEC - IMS)‏ Constantinos MAKASSIKIS (SUPELEC - IMS, LORIA - AlGorille)‏
1 Détection de défaillances et algorithmes répartis pour les GRIDs Marin BERTIER Thèmes SRC Laboratoire d'Informatique de Paris 6 Université Pierre & Marie.
Transcription de la présentation:

1 Réunion ANR-CIGC GCPMF 15 mars 2006 Architecture de grille générique, multi- paradigmes et tolérante aux pannes, pour le temps contraint. Application aux calculs financiers. Sébastien Bezzine, Virginie Galtier, Stéphane Vialle

2 Architecture de Grille : - tolérante aux pannes - récupération sur panne en temps limité - assimilation dynamique de nouvelles ressources - équilibrage dynamique de charge - mixant les concepts n-tiers et distribués - supportant limplantation dalgorithmes distribués à couplage faible et à couplage fort Introduction Grilles de nombreux composants : - ressources hétérogènes - pannes inévitables - pannes « fréquentes » … Applications industrielles : - en temps contraint - architecture n-tiers avec BdD - algorithmes variés Paradigme RMI/envoi de messages ET paradigme de mémoire partagée

3 ProActive Middleware de grille et environnement de développement, sous la forme dune bibliothèque Java développée par léquipe OASIS de lINRIA Sophia-Antipolis. Création dobjets actifs sur des machines distantes. Communications asynchrones entre des objets actifs se trouvant sur des machines différentes. Appels de méthodes sur des groupes dobjets actifs. Processeur Objet actif Objet passif Une distribution par « RMI » et « envois de messages » (approximativement), et fortement « extensible » (applicable à des architectures « larges échelles »)

4 JavaSpaces Programmation parallèle aisée, mais a priori destinée à un nombre limité de machines. Existence dun mode « transactionnel » (commit) et dun mode « persistant », plus lent mais tolérant aux pannes, Services sous-jacents (ré)activables en cas de nécessité Une distribution par partage de données dans une mémoire partagée virtuelle sur une grille de PCs (grille de JVM).

5 Architecture de grille + des PCs de réserve ( ε %) Server Client Server TCP SubServer Worker ProActive Worker BD Architecture n-tiers typique des applications industrielles ProActive ? BD JavaSpace « mémoire partagée virtuelle » (on demand)

6 Tolérance aux pannes (1) PC objet actif Server… objet actif Alive PCs de réserve : Détection des pannes Envoi des résultats partiels Server SubServers Workers

7 Tolérance aux pannes (2) PC objet actif Server… objet actif Alive Server SubServers Workers envoi du groupe de workers et du résultat partiel relance des calculs PCs de réserve : Détection des pannes Envoi des résultats partiels

8 Tolérance aux pannes (3) PC objet actif Server… objet actif Alive Server SubServers Workers SubServer Plus aucun PCs de réserve ! Détection des pannes Envoi des résultats partiels

9 Tests avec Pricing Européen Test de larchitecture avec des « pricing européen » par simulations de Monte-Carlo : –Grand nombre de simulations de Monte-Carlo réparties sur les workers (random() sur chaque worker … ), –Problème embarrassingly parallel, –Test de tolérance aux pannes. 3 versions de pricing européen développés à Nice à inclure dans notre testbed n sim. Somme des n résultats jusquà N N « M-C simulations » Workers SubServer Equilibrage dynamique de charge

10 Tolérance aux pannes : res 1 Tests de tolérance aux pannes de workers avec PCs de réserve : –10 Millions de simulations avec 3 SubServers et 24 Workers : 27 minutes. 1 tâche élémentaire de 1000 simulations sur un worker : 3s –Surcoût des pannes de workers dans un même groupe de 5 workers : Pannes simultanées pendant les calculs Panne après envoi des résultats Panne avant envoi des résultats 1 worker0,4 - 0,62,2 – 3,1 2 workers0,7 - 1,92,3 – 3,2 3 workers1,1 - 2,93,8 – 4,8 4 workers1,4 - 3,54,0 – 5,4 5 workers2,5 - 5,55,4 – 7,4 Surcoût de récupération sur panne : - important vis-à-vis dune tâche élémentaire (3s), - faible vis-à-vis de toute lapplication (27mn). Temps supplémentaires de calcul (en secondes)

11 Tolérance aux pannes : res 1 Tests de tolérance aux pannes de workers avec PCs de réserve : –10 Millions de simulations avec 3 SubServers et 24 Workers : 27 minutes. 1 tâche élémentaire de 1000 simulations sur un worker : 3s –Surcoût des pannes de SubServers dans un groupe de 3 SubServers : Surcoût de récupération sur panne : - supérieur aux récupérations de pannes de workers (normal !) - reste faible vis-à-vis de toute lapplication Temps supplémentaires de calcul (en secondes) Pannes simultanées pendant les calculs Panne après envoi du résultat Panne avant envoi du résultat 1 SubServer3,3 - 4,15,1 – 6,7 2 SubServers4,9 - 6,56,4 – 9,2 3 SubServers5,4 – 8,67,6 – 11,5

12 Conclusion et perspectives Distribution en Java & ProActive, équilibrage dynamique de charge, speedup = 20 sur 24 processeurs (efficacité = 83%). Détection et correction automatique des pannes, temps de correction de lordre de quelques secondes, utilisation de machines de réserve si disponibles. Résultats actuels sur des calculs embarrassingly parallel : Développements en cours : Incorporation de JavaSpaces activables à la demande, entre un subserver et ses workers. Incorporation des 3 algorithmes de « pricing européens » développés à Nice (Omega & Oasis).

13 Conclusion et perspectives Amélioration des heuristiques de tolérance aux pannes. Implantation de calculs de risques distribués fortement couplés. Expérimentations sur Grille : Grid5000 en multi-sites. S. Bezzine (stagiaire ingénieur CNAM), V. Galtier et S. Vialle en collaboration avec Omega et Oasis. Perspectives 2006 : Premières expérimentation dutilisation de GPU et insertion dans larchitecture Java développée. M. Ifrim (stagiaire Master UPB), V. Galtier et S. Vialle + … collaborations avec les autres partenaires bienvenues. Bibliothèque générique à base de Java-1.5/Generics, ProActive, JavaSpaces, sur grille de CPU et de GPU.

14 Architecture de grille générique, multi- paradigmes et tolérante aux pannes, pour le temps contraint. Application aux calculs financiers. Questions ?