Réunion calcul simulations GIEC/IPCC - Prodiguer Lundi 23 Mars 2009 1 PRODIGUER un noeud français de distribution des données GIEC/IPCC Sébastien Denvil.

Slides:



Advertisements
Présentations similaires
Stockage et sauvegarde
Advertisements

Couplage BASE/Outils de Data Mining Pierre LAURENCE
POTIMART Plate-forme Ouverte d’expérimenTation pour l’Information Multimodale et l’Analyse des Réseaux de Transport Projet labellisé Réunion PREDIM &
Revue rapide de tous les aspects du service. Tryble en trois points Tryble permet de "cloner" des contenus présents dans un PC … dans un service Internet.
SITools Présentation de l’outil (1/2)
STRATEGIE DONNEES MARINES Les données in situ Catherine Maillard, IFREMER/TMSI/IDM/SISMER SISMER Table Ronde RIO 29/11/2000 SISMER Systèmes dInformations.
Microsoft Office Groove Le contexte Une utilisation des postes de travail en très grande évolution chez les professionnels. Des lieux de travail.
Le Grid Computing Par Frédéric ARLHAC & Jérôme MATTERA.
Conception de la sécurité pour un réseau Microsoft
Laboratoire d'InfoRmatique en Image et Systèmes d'information LIRIS UMR 5205 CNRS/INSA de Lyon/Université Claude Bernard Lyon 1/Université Lumière Lyon.
Stockage dans DIET Groupe de travail du 16 décembre 2002.
Intégration des instruments et des équipements avec FDT/DTM
S. CAGNI, S. PICARD et A. CORDIER Vous avez dit :.
NFE 107 : Urbanisation et architecture des systèmes d'information
Système de stockage réseaux NAS - SAN
Introduction aux Grilles de Calcul
Module 1 : Préparation de l'administration d'un serveur
Plan du Cours Définition de la BI Objectif de la BI Fonctionnement d’une plateforme BI Technologies de la BI Composantes de la BI Les caractéristiques.
Le Travail Collaboratif ...
Protocole 802.1x serveur radius
WINDOWS Les Versions Serveurs
Constitution des bases de données. n Partenaires u Creatis u Liris/Systèmes dinformation communicants n Lot de travail situé entre le lot Applications.
J-L Dufresne Responsable du pôle de modélisation Pôle de modélisation de l'IPSL: travaux en cours en vue de la préparation du prochain rapport du GIEC.
Les TIC pour lenseignement et la recherche en économie et gestion Lotfi Bouzaïane Université Virtuelle de Tunis & Agence Universitaire de Francophonie.
Module 8 : Maintenance des logiciels à l'aide des services SUS
Lyon, 24/04/2007 Ce que l'application a besoin de connaître: Paramètres physiques par scénario de 150 ans Nombre et numéro d'ordre des mois à effectuer.
Projet CONSULTING SA : GSA ( Gestion du suivi d’activités)
4 - Annuaires Les Annuaires d ’Entreprises Offres et solutions
Développement d’application client/serveur
Expose sur « logiciel teamviewer »
Centre de Calcul de l'IN2P3 - Lyon Toulouse - Lyon, 21 décembre 2004 Les projets de grille au Centre de Calcul de l’IN2P3.
SI Recherche « Offre de services aux unités » Octobre 2013.
Earth System Grid Federation
Modèles et protocoles de cohérence des données en environnement volatil Grid Data Service IRISA (Rennes), LIP (Lyon) et LIP6 (Paris) Loïc Cudennec Superviseurs.
D. E ZEGOUR Institut National d ’Informatique
PAPS ESRS Séminaire de lancement des activité 26 mars 2012 Université Mentouri Constantine 1PAPS-ESRS, 26 mars 2012, UMC.
Rôle des CI dans la démarche qualité
1Auteur : Oleg LODYGENSKY XtremWeb-HEP Atelier Opérations France Grille Lyon – Villeurbanne 13 et 14 octobre.
Pôle de modélisation de l'IPSL: simulations en vue de la préparation du prochain rapport du GIEC.
Résumé CHEP 2010 Distributed processing and analysis Grid and cloud middleware Thèmes : 1.
Les espaces numériques de travail Définition : Un espace numérique de travail est un ensemble intégré de services numériques (de communication, de gestion.
Réunion Toulouse Data Node GIEC/IPCC - Prodiguer Lundi 23 novembre Sébastien Denvil Pôle de Modélisation, IPSL PRODIGUER un nœud de distribution.
Présentation rapide de l’état des outils IPSL Marie-Alice Foujols Octobre 2005.
L’environnement Labo : nom du labo (PP, PN, Astro éventuellement dans l’ordre d’importance) Effectif du labo : xxx personnes Nombre d’IT : xxx dont au.
Contribution de l’IPSL au projet CMIP5
Le noeud de grille Tier 3 LAPP.
COMPARAISON ENTRE GNUTELLA ET FREENET
L’enseignement de spécialité SLAM
Palaiseau Réunion CCIN2P3/LCG 22/07/2004 Distribution des données CMS Distribution des données et préparation de l’analyse Production MC distribuée et.
L’environnement Labo : IMNC (interface physique - biomédical) Effectif du labo : 45 personnes Nombre d’IT : 10 dont au SI : 1 ASR et 1DEV ( + 1 DEV rattaché.
PaCO++ André Ribes Réunion Hydrogrid Rennes 15/09/03.
L’environnement Labo : Laboratoire de Physique des Particules d’Annecy-le vieux: LAPP (PP, Astro) Effectif du labo : 144 personnes Nombre d’IT : 76 dont.
Initiation à Oracle Server
Logiciel de surveillance de réseaux informatique
L’authentification Kerberos
Comité d'Orientation du GISClimat - Prodiguer Mardi 18 Novembre PRODIGUER un noeud français de distribution de données GIEC/IPCC Sébastien Denvil.
Recapitulatif des sujets abordés Frédérique Chollet Fabio Hernandez Fairouz Malek Réunion LCG-France Tier-2s & Tier-3s Paris, 20 mars 2008.
2 Demo Extravaganza Fabrice Meillon & Stanislas Quastana, CISSP Architectes Infrastructure Microsoft France
31/05/2007Projet Master 11 Présentation ludique de la recherche opérationnelle à la fête de la science Année universitaire 2006/2007 Sylvain FIX Julien.
Calcul et Grille CMS ou comment on extrait les aiguilles de la botte de foin Conseil scientifique LLR 14/10/2010 C. Charlot.
Calcul pour le spatial & le CC-IN2P3 Jean-Yves Nief (CC-IN2P3)
Climserv à Polytechnique (X) CICLAD à l’UPMC
M2.22 Réseaux et Services sur réseaux
CEGID et environnement réseau Groupe PGI Académie de Grenoble.
Retour d'expérience de l'utilisation du cloud comme infrastructure de service Guillaume PHILIPPON.
01/06/ :281 F.Girault LAPP Microsoft Exchange 2007 Microsoft Exchange Server 2007.
Mésocentre ESPRI IPSL Importance des données pour la recherche à l’IPSL – Campagnes de mesure terrain – Observations satellites – Simulations Services.
1 Master Data Management au SANDRE. ADD 27/11/ Une philosophie de diffusion des référentiels 3 grands blocs dans les systèmes d’information environnementaux:
Stratégie technique G. Mathieu – V. Breton. Stratégie vers les fournisseurs de services et de ressources France Grilles2 Jouer le rôle central dans le.
ADES : Portail National d’Accès aux Données Eaux Souterraines du SIE Les méthodes d’évaluation de l’état des eaux : situation et perspectives dans le contexte.
Transcription de la présentation:

Réunion calcul simulations GIEC/IPCC - Prodiguer Lundi 23 Mars PRODIGUER un noeud français de distribution des données GIEC/IPCC Sébastien Denvil Pôle de Modélisation, IPSL

Réunion calcul simulations GIEC/IPCC - Prodiguer Lundi 23 Mars Stockage global des simulations Stockage brute borne basse  565 TB Stockage brute borne haute  1000 TB Distribution CMIP5 (25-50%)  ( ) ( ) TB Stockage global  TB LMDz 0.5° (50 Km)

Réunion calcul simulations GIEC/IPCC - Prodiguer Lundi 23 Mars Exercices GIEC/IPCC : quelques chiffres AR 4 (Assessment Report #4), 2007  35 Terabytes, 77,000 fichiers  Quantité de données distribuée : 300 Terabytes fichiers.  Les groupes ont généré et exploité probablement 10x plus de données AR 5 (Assessment Report #5), 2013  Un facteur 50 à 100  Volonté de distribuer une plus grande proportion des données  La base de données doit être distribuée

Réunion calcul simulations GIEC/IPCC - Prodiguer Lundi 23 Mars Gestion des données depuis 7 ans Principalement centralisée, stocké sur un san Accès OpenDAP pour les centres de calcul (dods) Système basique de récupération de données Accès à des données brutes Sécurité/Authentification/Restriction d’accès aux données : pas un problème Pas de post-processing à la demande Pas d’intégration des metadata Ne supporte pas les requêtes d’interrogation de haut niveau

Réunion calcul simulations GIEC/IPCC - Prodiguer Lundi 23 Mars Gestion des données par Prodiguer Bouger les données un minimum, les garder proche des centres de calcul d’origine quand c’est possible  Protocole d’accès aux données, liens forts avec les centres de calcul Quand on doit bouger les données, le faire vite et avec un minimum d’intervention humaine  Management des ressources de stockage, réseaux rapides Garder une trace de ce que l’on a, de ce qui est sur “deep storage”, suive des accès  Metadata et Catalogues de données Exploiter une fédération de sites  Intergiciel de grille  Grille de données

Réunion calcul simulations GIEC/IPCC - Prodiguer Lundi 23 Mars Cas simple d’intercomparisons Scénario AR4 Scénario AR Parcourir la base de données PCMDI centralisée Télécharger les données Organiser les données en local Regriller les données en local Faire les diagnostics Produire les résultats Rechercher, Interroger, Parcourir des données distribuées Site distant  Demande de données  Regriller  Diagnostics Le portail renvoie le résultat

Réunion calcul simulations GIEC/IPCC - Prodiguer Lundi 23 Mars publications scientifiques basées sur l’analyse des données CMIP3 IPCC AR4 Downloads 300 TB fichiers 300 GB/jour (moyenne) Supporter l’infrastructure nécessaire aux communautés climats nationales et internationales. ESG procure une technologie cruciale pour accéder de manière sécurisé, monitorer, cataloguer, transporter, distribuer les données dans la grille d’aujourd’hui. 818 utilisateurs enregistrés 35 TB de données au PCMDI fichiers Expériences coordonnées par l’IPCC Données de modèles provenant de 11 pays. Portail CMIP3 IPCC AR4 ESG Objectif ESG Nov 2004 – Oct 2006 IPCC Téléchargements (10/12/06) Worldwide ESG user base Le Earth System Grid

Réunion calcul simulations GIEC/IPCC - Prodiguer Lundi 23 Mars Evolution d’ESG Base de données centrales Archive centralisée de données traitées Agrégation temporelle Distribution par transfert de fichiers Pas d’implication dans l’analyse Portail orienté caddy de supermarché Connexion d’ESG au poste de travail orienté analyse (i.e., CDAT et CDAT-LAS) 2006 Test grandeur nature Metadata fédérées Portails fédérés Interface utilisateur unifiée “Quick look server-side” analyse avec CDAT Indépendant de la localisation Partage de données manuel Publication manuel Début 2009 Partage de données complet Fédération synchronisée  metadata, données Suite complète d’analyse “server-side” Intégration Modèles/Données ESG intégrée dans les postes de travail orientés analyse avec CDAT Intégration SIG Métrique d’intercomparison Support, maintenance … 2011 AR5, satellite, In situ biogéochimie, écosystèmes Archive de Données ESG Terabytes Petabytes AR4 Le plan de route ESG vers l’AR5

Réunion calcul simulations GIEC/IPCC - Prodiguer Lundi 23 Mars Fédération de sites Earth System Grid

Réunion calcul simulations GIEC/IPCC - Prodiguer Lundi 23 Mars Earth System Grid en 3 Tiers.

Réunion calcul simulations GIEC/IPCC - Prodiguer Lundi 23 Mars Architecture Earth System Grid

Réunion calcul simulations GIEC/IPCC - Prodiguer Lundi 23 Mars Conclusions Étroite collaboration avec les centres de calculs Espace de stockage adéquate (cache système, disponibilité des fichiers) Interconnections des centres de calcul (utilisation croisée des données) Logiciel de Tiers3 ESG sur les centres  Installation couche logicielle  Ouverture de services