1 DataGRAAL DataGRid pour Animation et Applications à Large échelle Yves Denneulin IMAG-ID Pierre Sens LIP6 - INRIA.

Slides:



Advertisements
Présentations similaires
GDRMACS Objectifs thématiques et Structuration
Advertisements

Diffusion des résultats de la recherche européenne
Réunion d’information et Comité d’entreprise
La politique de certification : du B2i au C2i
(Services et prestations des secteurs sanitaire et social)‏
ScaldWIN, Semaine Internationale de lEscaut 2011 LEscaut, rivière et courant vital.
Le Groupe de Travail sur les Archives Ouvertes (GTAO) du consortium Couperin Jean-François Lutz Journée détude Paris, 21 mai 2007.
IN’Tech Le club de technologie de Grenoble Network Initiative animé par l’INRIA Rhône-Alpes.
Copyright 2008 © Consortium ESUP-Portail ESUP-Days 8, Paris, 3 Juillet 2009 Points généraux Alain Mayeur.
Assemblée générale du réseau rural France – 17/12/2009 Réseau européen de développement rural (RE DR) Gaëlle Lhermitte, Unité AGRI/G.3.
Michel Cosnard et Thierry Priol INRIA Sophia Antipolis
Journée projet CGP2P Laboratoire ID / Projet APACHE (URM 5132) Equipe G3 Grappe & Grille de Grappe 3 Enseignant-Chercheurs 7 Doctorants DEAs.
Gabriel Antoniu IRISA / INRIA Rennes
Activités développées RTP 09 : Bases de données et d'informations hétérogènes et distribuées Actions spécifiques et équipes-projets associées Objectifs.
ACI GRID Projet JE RESAM Support Réseau et Intelligence pour la Grille Coordinateur C. Pham, Univ. Lyon 1, INRIA RESO.
Les GDR d'animation STIC Coordination inter-GDR Luc Bougé, IRISA/ENS Cachan Assemblée générale Specif, Grenoble, 18 janvier 2002.
Comité de pilotage (Rochefort le 20 mai 2005) Indicang – Interreg III Comité de Pilotage Bordeaux le 15 décembre 2005 Communication.
Réunion coordinateurs de réseaux
Laboratoire d'InfoRmatique en Image et Systèmes d'information LIRIS UMR 5205 CNRS/INSA de Lyon/Université Claude Bernard Lyon 1/Université Lumière Lyon.
Encadrants: P. Ghodous et N. Lumineau
PROJET DATAGRID À lIPSL (Pôle Données) C. Boonne Réunion DataGRID - 31/01/ Lyon.
User Support Sophie Nicoud DataGrid France – CPPM 22/09/02.
18 avril 2002réunion Datagrid France1 E-toile Plate-forme RNTL 2001 Environnement matériel et logiciel pour le développement et l expérimentation de grille.
Certificats Globus et DataGrid France
Grille Régionale Rhône-Alpes Institut des Grilles du CNRS Yonny CARDENAS CC-IN2P3 Réunion du groupe de travail grilles Projet CIRA Grenoble, le 2 Juin.
CONTinuité de service en INformatique UbiqUitaire et Mobile
Participation à la promotion de Radio Jeunes Reims Stage de fin détudes se déroulant du 11 Avril au 21 Juin 2005.
du 22 mai DADDi Dependable Anomaly Detection with Diagnosis ACISI 2004.
EQUIPE TaToo Extraction de connaissances dans les bases de données : motifs séquentiels et ontologie LIRMM - CNRS - Université Montpellier II.
Journée du Groupe Thématique « Test et Tolérance » Amélioration du Rendement et Fiabilité des Mémoires Marseille, 6 mai 2010 GDR SoC – SiP P. Girard –
SCIENCE ET GENIE DES MATERIAUX - SGM
6èmes : Coût 170 euros Du 14 au 18 Avril 2014 – 3jours/2nuits En fonction des thèmes Sortie forêt D.Leméhauté (sept/oct 3,50 Euros/élève) Concours interclasses.
DataGRAAL DataGRid pour Animation et Applications à Large échelle
SDTICE Séminaire national C2i niveau 2 Métiers du Droit Université dAuvergne 3 et 4 avril 2008 Nathalie Chantillon - SDTICE.
Auto-organisation dans les réseaux ad hoc
Classification Ascendante 2-3 Hiérarchique: Applications au Web Mining
Le portail des MSH
Communication Collaborative : créer et assurer la visibilité de son blog 1.
LAction Concertée Incitative GRID: Bilan et perspectives Thierry PRIOL Directeur de lACI GRID INRIA
Jean-Marc Hasenfratz Mdc UPMF depuis 1999 i MAGIS-artis depuis 1997.
Échéancier # E) Bilan réflexif /rapport individuel (cours # 15 individuel disponible sur le site section travaux (Attention : rédiger votre travail.
Rhône-Alpes : Grille pour le Traitement dInformations Médicales RAGTIME Réunion de démarrage Mardi 16 septembre 2003.
Projet région Thématique prioritaire n°10 Calculs Scientifiques Logiciels Rhône-Alpes : Grille pour le Traitement dInformations Médicales (RAGTIME ?)
1 RAGTIME Middleware Gestion des accès aux données RAGTIME Middleware Gestion des accès aux données Jean-Louis Roch (ID-IMAG) Participants: – IF-INSA Lyon:
Marie-Laure Potet et Yves Ledru(LSR/IMAG)
LSR Groupe de Travail AFADL du GDR ALP Journée de rencontre « Techniques Formelles pour le Génie Logiciel » 5 juin 2002 ENST – Paris Préparée par Yves.
Association des Technologies de lInformation pour lEducation et la Formation
18 projets ont été retenus Budget accordé : 2,5M€ Campagne 2002 :
Architecture des systèmes pair-à-pair de gestion de données Gabriel Antoniu Projet PARIS IRISA/INRIA.
SITRANS – Système d’information Transcriptome pour la plate-forme de la Genopole Rhône-Alpes Daniel CRISAN
Réforme de la recherche à l’INP Grenoble
Utilisation et Maîtrise de lInternet dans lenseignement « bonne maîtrise Informatique » « réelle réflexion pédagogique » « appropriation efficace des outils.
BEP métiers de l’Électrotechnique Seconde de détermination
LEGO – Rennes, 18 Septembre 2006 Un outil de monitoring pour le déploiement dynamique de JuxMem Loïc Cudennec IRISA / INRIA, PARIS project-team Stage de.
Qu’est ce qu’une grille ?
GDS – Paris, 13 Octobre 2006 Un outil de monitoring pour le déploiement dynamique de JuxMem Loïc Cudennec IRISA / INRIA, PARIS project-team Stage de M2RI.
Réunion des directeurs d’unités ST2I 30 octobre 2007 Réseau Doc-ST2I Missions et perspectives (MI2S)
Modèles et protocoles de cohérence des données en environnement volatil Grid Data Service IRISA (Rennes), LIP (Lyon) et LIP6 (Paris) Loïc Cudennec Superviseurs.
BTS Services et Prestations des Secteurs Sanitaire et Social (SP3S)
GDS : Grid Data Service Gabriel Antoniu IRISA / INRIA Rennes Réunion de lancement du projet GDS de l’ACI Masses de Données 22 septembre 2003.
Gabriel Antoniu IRISA / INRIA Rennes
1 Deux exemples de management (et d’organisation) de la recherche : le CNRS et l’INRIA Club EEA, Tours, 13 mai 2009.
L’Education nationale Bref historique, environnement administratif et débat d’actualité, le tout en 3 heures ! Bernard Desclaux, directeur de CIO Pour.
Projet CiGri CIMENT GRID Grille grenobloise pour la simulation numérique par méthodes de Monte Carlo Laurent Desbat (coordinateur scientifique) et Nicolas.
27/06/20081 Ingénierie écologique Journée des directeurs de Programmes Interdisciplinaires 27 juin 2008 Gif-sur-Yvette.
GDS : Grid Data Service Etat de l’avancement Gabriel Antoniu Réunion GDS, Lyon, 17 février 2006 IRISA, Rennes ACI Masses de Données.
Projet GDS de l’ACI MD Projet PARIS IRISA, Rennes.
Informations V. Breton Directeur de France Grilles.
______________________________________________ Christina Cantrel Réunion correspondants com Paris – 23/11/11 Plan de com CNRS
Grilles de recherche Veronique Donzeau-Gouge. 2 objectifs Renforcer la présence du CNRS dans ce domaine en liaison avec : L’Institut ST2I L’INRIA, Les.
Transcription de la présentation:

1 DataGRAAL DataGRid pour Animation et Applications à Large échelle Yves Denneulin IMAG-ID Pierre Sens LIP6 - INRIA

ACI DataGRAAL – 10/01/03 2 Partenaires Communauté bases de données : PRISM – SMIS (INRIA – Univ. Versailles St Quentin) LIRMM (Univ. Montpellier) LSR-IMAG (Grenoble) LISI – (INSA Lyon) Communauté système : PARIS (IRISA) LRI - Equipe Cluster (Université Paris 11) REMAP (LIP - ENS Lyon) LIP6 (Université Paris 6) Apache ID – IMAG HP Labs Applications : CERS IN2P3

ACI DataGRAAL – 10/01/03 3 Contexte 2 types de grands systèmes distribués Les Grilles de calcul ou « GRID » Les systèmes de Calcul Global Les systèmes Pair à Pair Les systèmes distribués à grande échelle Grands sites de calcul, Clusters PC <1000 Stables Identification individuelle Confiance ~ Volatiles Pas dident individuelle Pas de confiance Caractéristiques des nœuds : Problématique

ACI DataGRAAL – 10/01/03 4 Problèmes ouverts dans la gestion des données Qualité de service dans laccès aux données Efficacité des accès Disponibilité Tolérance aux fautes Hétérogénéité des sources Persistance Modèles de partage Ecritures multiples Protocoles de cohérence Problématique

ACI DataGRAAL – 10/01/03 5 DataGRAAL : Les objectifs 1.Gestion des données à très large échelle exploratoire 2.Multi-communautaire : Profiter/confronter les expériences des BD, système, applications animation 3.Identification de thématiques/concepts communs 4.Maquettes dexpérimentation Objectifs

ACI DataGRAAL – 10/01/03 6 DataGRAAL : les applications Stockage : Grande quantité Dispersion des données Hétérogénéité Objectifs

ACI DataGRAAL – 10/01/03 7 Coopération entre communautés Communauté système Issus des expérience des systèmes répartis et pair-a-pair Protocole de localisation Placement, déploiement Protocole de cohérence Détection et gestion des fautes Communauté bases de données Gestion de grandes quantités de données Hétérogénéité Mobilité Médiation traditionnellement, architecture faiblement distribué Complémentarité

ACI DataGRAAL – 10/01/03 8 Coopération (2) Applications physique des particules physique des plasmas simulation de grands systèmes physiques Idée de la coopération : faire se rencontrer des communautés différentes contexte : stockage distribué de grandes quantités de données Complémentarité

ACI DataGRAAL – 10/01/03 9 Atouts des partenaires PRiSM/INRIA langage de requêtes, fouille de données exploitation de grandes quantités de données LSR Eclatement d un SGBD en un ensemble de services (persistance, duplication, …) Connaissance approfondie des architectures de SGBD LISI Systèmes dinformation à large échelle LIRMM médiation, exploitation de résultats venant de nombreuses sources Complémentarité BD

ACI DataGRAAL – 10/01/03 10 Atouts des partenaires (2) IRISA / PARIS Maîtrise des mémoires partagées Partage de mémoire pair-è-pair Expérimentations avec JXTA LRI Calcul haute performance sur P2P Tolérance aux fautes LIP6 Modèle de cohérence hiérarchiques Gestion des fautes dans environnement asynchrone Systèmes multi-agents LIP ReMaP Environnement de type grille Traitement de grande masses de données Redistribution dynamique des données et tolérance aux pertes Complémentarité Système

ACI DataGRAAL – 10/01/03 11 Atouts des partenaires (3) HP Labs environnement de grappe virtuelle forte volatilité Laboratoire ID expérience architecture grande grappes administration, gestion déploiement efficace d applications sur un grand nombre de nœuds Complémentarité Infrastructures

ACI DataGRAAL – 10/01/03 12 Atouts des partenaires (4) IN2P3 expérience dans la gestion de grandes quantités de données élément central de Datagrid CESR fusion de plusieurs grandes bases en une seule requêtes hétérogènes à traiter, stockage réparti CEA expériences grandeur nature modélisation du climat, de la terre forte complexité des données grand nombre de sites Complémentarité Applications

ACI DataGRAAL – 10/01/03 13 Identification des tâches (provisoire) Tâche 1 : Besoins applicatifs (Tâche transversale) Moteurs : CEA / CESR / IN2P3 Tâche 2 : Déploiement de données Moteurs : LRI / LIP / LIP6 / LISI Tâche 3 : Accès efficace aux données Moteurs : PRISM / LIRMM / LIP / LSR Tâche 4 : Partage de données Moteurs : IRISA / LIP / LIP6 / PRISM / LSR Tâche 5 : Modèle de cohérence Moteurs : IRISA/ LIP6 / PRISM / LSR Tâche 6 : Tolérance aux fautes Moteurs : LIP6 / LRI / LIP Tâche 7 : Apport des approches multi-agents Moteurs : LIP6 / IRISA Axes

ACI DataGRAAL – 10/01/03 14 Tâche 1 : Besoin applicatif CEA, CESR, IN2P3 « Retour » dexpérience de DataGrid Capacité de stockage – 5-8 PetaOctects / année 10 PetaOctects de disque Puissance de calcul – PC rapides Répartition du volume ? Grain. Quelles disponibilités, persistance ? Mode de partage ? Axes

ACI DataGRAAL – 10/01/03 15 Tâche 2 : Déploiement LRI : XtremWeb LISI : Technique de cache Web LIP6 : Algorithmes de placement de données / observation LIP : DIET+IBP - Redistribution, Placement Axes

ACI DataGRAAL – 10/01/03 16 Tâche 2 : déploiement (2) Constat : Placement de données très statique Exploration 1 : vers plus de dynamicité Nécessité de contrôler lenvironnement Ressources disponibles Détection de fautes en environnement asynchrone (pb algorithmique) Transport dinformation de contrôle à large échelle (filtrage, propagation épidemique) Accumulation de données pertinentes (vision partielle) Prise de décision Problème de validité des informations Exploration 2 : Lien avec le placement des tâches Axes

ACI DataGRAAL – 10/01/03 17 Tâche 3 : Accès PRISM : Accès efficace en fonction du profil LIRMM : Adaptation dynamique des vues LIP : Distribution de requêtes Co-ordonnancement

ACI DataGRAAL – 10/01/03 18 Tâche 4 : Partage PRISM : Mode de partage transactionnelle IRISA / LIP6 / LISI Partage à grain fin (page / objet) LIP Gestion de versions de données immutables Axes

ACI DataGRAAL – 10/01/03 19 Tâche 4 : partage (2) Versionning vs. données modifiables Limite du partage en lecture dans P2P Approche de partage « volontaire » limitée Le partage avec de nombreux écrivains Augmenter la complexité - Quelles applications ? Des tendances récentes : Partage (en lecture) forcé (ex. Edonkey) Partage avec un nombre réduit décrivains (Ivy …) Axes

ACI DataGRAAL – 10/01/03 20 Tâche 5 : Cohérence Modèle de cohérence sur mémoire partagée répartie (IRISA / LIP6 / LISI) LISI DosMos IRISA Cohérence au relâchement Cohérence multi-thread (DSM-PM2) LSR Réplication LIP6 Modèle hiérarchique (CLRC) Axes

ACI DataGRAAL – 10/01/03 21 Tâche 5 : Cohérence (2) Avenir des mémoires partagées réparties ? Application à large échelle Travail coopératif, couplage de code Hétérogénéité Tolérance aux fautes Axes

ACI DataGRAAL – 10/01/03 22 Tâche 6 : Tolérance aux fautes PRISM : Redondance dynamique LIP 6 : Détection de fautes hiérarchique (RTT-FD) Réplication dynamique (DARX) LRI : Journalisation de messages + mémoire de canal MPICH-V LIP : Code redondant Reconstruction dynamique LSR Axes

ACI DataGRAAL – 10/01/03 23 Tâche 6 : Tolérance aux fautes (2) Gestion de lincertitude des informations vers un système « indulgent » ? Choisir la bonne stratégie (types de réplication, point de reprise, journalisation) en fonction de plusieurs critères : Applicatif (type de fautes, nombre de fautes, temps de recouvrement) Environnemental : surcoût, charge des machines et du réseau, MTBF… Axes

ACI DataGRAAL – 10/01/03 24 Tâche 7 : Approche multi-agent LIP6 : Plate-forme DARX : Fiabilité des agents, réplication Dynamicité IRISA/LIP6 Service de partage de mémoire sur DARX Axes

ACI DataGRAAL – 10/01/03 25 Tâche 7 : Approche multi-agent (2) Un agent est une entité physique ou virtuelle : capable dagir sur elle-même et sur son environnement, capable de percevoir son environnement, mais ne dispose que dune représentation partielle de cet environnement (et parfois aucune), peut communiquer avec dautres agents, poursuit un objectif individuel, qui possède des compétences et peut offrir des services, … Propriétés dun agent = autonomie, proactivité, adaptabilité, sociabilité, mobilité, … Agent une alternative pour le large échelle ? Axes

ACI DataGRAAL – 10/01/03 26 Organisation Réunions régulières Plénières (2 par an) Par tâche (~5 par an) Site Web : Suivi des réunions (transparents) Lien vers les projets du domaine Mailing list : Organisation

ACI DataGRAAL – 10/01/03 27 Déroulement Première réunion de suivi 10/02/03 – Paris Retour positif (M. Cosnard, P. Fraigniaud) Importance de lACI (thématique, nb de partenaires) Animation primordiale => importance du site Web Identifier des thématiques avec des moteurs forts Attention à la dispersion Lien avec lACI GRID2 (éviter les doublons) Publier Séminaire de jours (30-31/01/03) Définition de thèmes de travail Responsables Définition dun échéancier (future réunion technique avec thème) Organisation

ACI DataGRAAL – 10/01/03 28 Déroulement 22 avril journée ACI Grid à IPDPS Préparation dun Poster + 1 recto-verso (anglais) Fin de laction Écriture d un document commun (Livre) École sur la gestion de données à grande échelle (formation permanente CNRS) – Mai 2004 Organisation Bretagne (Port aux Rocs)