Centre de Calcul de l’Institut National de Physique Nucléaire et de Physique des Particules iRODS Jean-Yves Nief, 17/04/14.

Slides:



Advertisements
Présentations similaires
Serveur jeu Le serveur fait partie d'un logiciel de jeu en ligne multi joueur en architecture client serveur. Il répond à des demandes.
Advertisements

Système de stockage réseaux NAS - SAN
Exercice Votre client CBEAUCBON.COM h é berge actuellement son site sur deux machines accessibles directement depuis internet. Aucun service de s é curit.
Réunion de collaboration du 9-10 Juillet 2008 J.L. Béney 1 Logiciel At  Client-Serveur Tcp/ip de la station autonome  Influence de l'architecture matérielle.
FORUM REGIONAL DE NORMALISATION DE L'UIT POUR L'AFRIQUE (Dakar, Sénégal, mars 2015) Outils et méthodes pour tester la qualité de services (QoS) de.
Historique L’évolution des architectures du début à nos jours.
Calcul pour le spatial & le CC-IN2P3 Jean-Yves Nief (CC-IN2P3)
I. Framework : Généralités II. Hibernate III. CakePHP Plan de l’exposé : 1.
Présentation de EAS Un logiciel distribuéé exclusivement par Brain2tech SARL.
SARL créée en 2003 par Olivier Maréchal – Architecte des systèmes d’information. Un intervenant pour les besoins informatiques des entreprises d’aujourd’hui.
Outils bibliographiques Philippe Carrère, UAG 2013.
Espace collaboratif du CODEV Blog, WIKI, Forum: c’est quoi?  Blog - Publication périodique et régulière d’articles La vocation d’un Blog est d'être un.
JI Les systèmes d’autorisation et d’authentification dans AMI Fabian Lambert.
FACTORY systemes Module 1 Section 2 Page 1-7 Introduction InSQL FORMATION InSQL 7.1.
Question de gestion 13 : Le document peut-il être vecteur de coopération ? Le document : - Dématérialisation des documents - Partage, mutualisation, sécurisation.
Création d’un site WEB 1 – Un site WEB c’est quoi ? 2 – Questions à se poser avant la construction d’un site WEB 3 – Principes de fonctionnement d’un site.
Présentation de Warehouse Un logiciel distribué exclusivement par Brain2tech SARL.
Roger Boll, avril 2006 Equipe de Biologie des Populations en Interaction Institut National de la Recherche Agronomique UMR 1112 : Réponses des Organismes.
Motiver les élèves avec des échéanciers automatisés et personnalisés AQIFGA 2015 Cette présentation de David Larochelle est mise à disposition sous licence.
THEME: IMPLEMENTATION D’UNE SOLUTION DE VOIP A BASE D’ASTERISK ET FREEPBX : AUTO PROVISIONNING SOUTENU PAR: ATCHOM SANDJI DANIEL.
Mediator 9 - Un outil de développement multimédia 3AC Techno/Informatique.
Chapitre10 Prise en charge des utilisateurs distants Module S41.
Comment nous améliorons notre travail à travers la communication numérique Cas de la société SEFITA au Maroc Comment nous améliorons notre travail à travers.
Développement d’application avec base de données Semaine 3 : Modifications avec Entité Framework Automne 2015.
Gabriel Dumouchel, doctorant Université de Montréal Atelier Jouvence 2011 Atelier Jouvence 2011.
Présentation Embarquer une librairie de ressource indexée dans Moodle.
V- Identification des ordinateurs sur le réseau??? ? ? ? ?
UNIX AVANCE Yves PAGNOTTE – Janvier – QUELQUES RAPPELS SUR LES SYSTEMES D’EXPLOITATION 1.
1 Monopalme Projet 4 Info Spécifications LE LAY Olivier MAHE Jocelyn FORM Nicolas HENRY Gurvan BONNIN Thomas BASSAND Guillaume Décembre 2009 MONNIER Laurent.
1 Les bases de données Séance 7 Les fonctions avancées : Opérateurs ensemblistes, Sous-requêtes et transactions.
Tutoriel n°4 : Administration Technique Formation : profil Administrateur.
Développement d’application avec base de données Semaine 8 : WPF avec Entité Framework Automne 2015.
Centre de Calcul de l’Institut National de Physique Nucléaire et de Physique des Particules iRODS Jean-Yves Nief (CC-IN2P3) Bruno Bzeznik (GRICAD, Université.
PARCOURS DE Professionnalisation
Un outil de communication : la liste de diffusion Mis à jour en juillet 2008 Anne Maincent-Bourdalé CRDoc IUT Paul Sabatier.
La Performance en ligne. Le métier d’ICIGEF Édition d’un logiciel de gestion intégrée Dédié aux PME/TPE Commercialisé en mode SaaS ( Software as a Service)
1 Les logiciels en général sont classés en deux familles:  Logiciels de base  Logiciels d’applications (applications) 2.
Projet Personnel (Epreuve 6) Projet réalisé dans le cadre de mon épreuve E6 au sein de mon alternance au conseil départemental du val de marne Arnaud PICANO.
Migration Plan adressage EPLE Migration Plan d'adressage EPLE.
© 2016 IBM Corporation 1 IBM Datacap Nouveautés de la version 9 Stéphane Montri ECM Technical Sales
Migration du système de sauvegarde d’une infrastructure locale à un système centralisé IN2P3 101/06/2016 HEPIX Spring 2013 Muriel Gougerot (LAPP) and Remi.
StratusLab is co-funded by the European Community’s Seventh Framework Programme (Capacities) Grant Agreement INFSO-RI La technologie « cloud » M.
LPSC, journée de lancement TIDRA B. Boutherin 1/12 Tier 3 du LPSC Grenoble Une infrastructure solide, originale et éco-responsable Des ressources importantes.
Gestion Electronique des Documents pour l’IN2P3 COMUTI 06 juin 2014.
A.I.P. Saint Michel 2011 A.I.P. Saint Michel 2011 Inside ASCOM v6 Nicolas CUVILLIER
Supervision EC-Net AX Serveurs Web EC-BOS AX. ARCHITECTURE Les solutions EC-Net AX EC-Net AX Supervisor EC-Net AX EnerVue EC-Net AX Security  EC-Net.
Biennale du LPNHE 2011, 20/09/ Le projet GRIF-UPMC : évolution et utilisation Liliana Martin Victor Mendoza Frédéric Derue
Une introduction à iRODS (Jean-Yves Nief). Introduction à iRODS - JI 08 - Obernai2 Introduction à iRODS Collaborations scientifiques internationales:
1 Projet d'établissement Action 10.2 Créer un portail intranet dédié aux agents de l’Inrap Présentation des choix technologiques de l’Inrap.
6-7 Octobre 2008J-P MEYER1 Conclusions du groupe de travail thématique 7 Physique subatomique: - physique des particules, - physique nucléaire, - astroparticules.
CSI 3531 Systèmes d’exploitation Nathalie Japkowicz 1.
Human Task Service (2008) Oscar Barrios et François Charoy Human Task Service Service de tâches dans un système de gestion de workflow Oscar Barrios
INFSO-RI Enabling Grids for E-sciencE Sécurité sur la Grille C. Loomis (LAL-Orsay) Tutorial EGEE Utilisateur (LAL) 8 octobre 2007.
Com. info., 7 avril 2011 Vincent Poireau 1. Rôle de la commission informatique Faire un bilan de l’informatique Evaluer les besoins des utilisateurs Proposer.
Classe virtuelle et réunion en ligne CENTRA Présentation dU dispositif Octobre 2010Pôle de compétences FOAD Formation Ouverte et A Distance.
 rechercher et coordonner l'engagement des acteurs nécessaires, Christine=> Helene,Gilles (permet de réduire les groupes de travail comme mentionné dans.
Introduction Depuis le début des sites web les urls sont utilisé pour la navigation. Avec l’arrivée des bases de données, les urls ont prit de l’importance.
PROJET FIN D’ÉTUDE 4 ÈME ANNÉE OPTION : INGÉNIERIE DES SYSTÈMES AUTOMATISÉ ET CONTRÔLE QUALITÉ « SYSTÈME DE CONTRÔLE ET DE COMMANDE D’ACCÈS À DISTANCE.
Chapitre 9 Gestion des maîtres d'opérations
Universit é Mohamed Kheider de Biskra Facult é de science et technologie D é partement de g é nie é lectrique Sp é cialit é : t é l é communication Le.
INSCRIPTIONS SPORTIVES
Université Ferhat Abbas –Sétif 1 Centre des Systèmes et Réseaux d’Information Et de Communication, de Télé-enseignement et D’Enseignement à Distance Rapport.
INFSO-RI Enabling Grids for E-sciencE Adaptation de GRIDSITE à WEBDAV Cédric Duprilot CNRS/IN2P3/LAL.
Gestion et distribution des données: de SRB à iRODS Jean-Yves Nief.
Le contenu est basé aux transparents du 7 ème édition de «Software Engineering» de Ian Sommerville«Software Engineering» de Ian Sommerville B.Shishedjiev.
ONEMA/DCIEGPA du 17/10/ Interopérabilité Web de la toile Eaufrance GVI mai 2015.
Colloque LCG France14-15 mars SURVEILLANCE ET GESTION D’INCIDENTS Cécile Barbier (LAPP)
Hadoop distributions Hadoop Hadoop est un framework Java libre destiné à faciliter la création d'applications distribuées.
Eric Fede : Obernai Intégration des services grille dans l'exploitation des systèmes informatiques du laboratoire.
Transcription de la présentation:

Centre de Calcul de l’Institut National de Physique Nucléaire et de Physique des Particules iRODS Jean-Yves Nief, 17/04/14

Vue d’ensemble iRODS - Journées ARAMIS17/04/14 2 Gestion des données scientifiques: ◦ Contexte. ◦ Besoins. ◦ Virtualisation du stockage. ◦ Politiques de gestion des données. iRODS: ◦ Architecture d’un service iRODS. ◦ Fonctionnalités. ◦ Interfaces côté utilisateurs et administrateurs. ◦ Définition de la politique de gestion des données: moteur de règles. ◦ Quid du hardware nécessaire ? ◦ Utilisateurs de iRODS. Exemple d’utilisation de iRODS: le CC-IN2P3. Perspectives.

 Centre de données travaillant souvent pour des collaborations dispersées géographiquement (du campus à l’international).  Exemples: ◦ Physique des particules: CERN, SLAC (USA), Fermilab (USA) etc… ◦ Astrophysique/astroparticule: Auger (Argentine), HESS (Namibie), AMS (ISS), CFHT (Hawaï), etc... ◦ Sciences Humaines: Huma-Num, CLARIN, etc… ◦ Campus: plateforme d’échanges de données (bureau virtuel…)  Environnements distribués. Gestion des données scientifiques: contexte iRODS - Journées ARAMIS17/04/14 3

 Archivage.  Gestion du cycle de vie des données.  Distribution de données multi-sites.  Partage de données pour accès longue distance.  Recherche de données.  Traitement distribué de données.  Moyens de stockage hétérogène: ◦ Au niveau du format des données (faiblement ou fortement structurées): fichiers plats, bases de données (RDBMS…), flux de données. ◦ Au niveau des media (disques, bandes), serveurs. ◦ Protocoles d’accès aux données Gestion des données scientifiques: besoins iRODS - Journées ARAMIS17/04/14 4

 Système d’exploitation hétérogènes: ◦ Côté serveurs. ◦ Côté clients.  Fédérer tout ceci d’une façon homogène.  Besoin de virtualiser le stockage: ◦ Vue logique des données unique à l’ensemble des utilisateurs (qque soit sa localisation). ◦ Organisation physique des données découplées de l’organisation logique.  Migration des données vers nouveau matériel/soft transparent pour l’utilisateur final. ◦ Organisation virtuelle (OV) des utilisateurs:  ID unique par utilisateur.  Organisation par groupes, rôle (simple utilisateur, admin,…).  Droits d’accès aux données au sein de l’OV. Virtualisation du stockage iRODS - Journées ARAMIS17/04/14 5

Virtualisation du stockage iRODS - Journées ARAMIS17/04/14 6

 Virtualisation du stockage pas suffisante.  Pour les application clientes: ◦ A priori pas de protection. ◦ Pas de garantie de la stricte application d’une politique de gestion des données.  Réel besoin pour un projet de distribution/archivage/… des données de définir une politique cohérente pour: ◦ La gestion des données. ◦ La gestion des ressources de stockage.  Aucun intergiciel grille/cloud/… pouvant répondre à ce besoin jusqu’en Au-delà de la virtualisation du stockage iRODS - Journées ARAMIS17/04/14 7

 Chausse-trappes typiques: ◦ Non respect des règles de gestion préétablies. ◦ Plusieurs applicatifs gérant les données peuvent coexister avec différentes politiques (réplication, etc…). ◦ Plusieurs versions du même applicatif peuvent être utilisées en même temps.  Incohérences potentielles.  Solution: ◦ Politique de gestion des données exprimée du côté serveur:  Virtualisation de cette politique de gestion pour les utilisateurs. ◦ Politique exprimée sous forme de règles.  Capacité à gérer des workflows complexes sans déployer de code côté client. Vers la virtualisation de la politique de gestion des données iRODS - Journées ARAMIS17/04/14 8

 Droits d’accès aux fichiers sur mesure: ◦ Interdire l’effacement des fichiers d’un répertoire donné y compris par le propriétaire.  Sécurité et vérification d’intégrité des données: ◦ Checksum automatique déclenché en arrière-plan. ◦ Anonymisation à la volée des données même si pas effectué côté client.  Enregistrement de métadonnées: ◦ Enregistrement automatique de métadonnées associées à des objets.  Paramètres de transfert sur mesure: ◦ Nbre de flux, taille de la fenêtre TCP suivant l’adresse IP du client.  Etc…. Gestion des données: exemple de règles simples iRODS - Journées ARAMIS17/04/14 9

 Fournit une solution aux besoins formulés précédemment.  Virtualisation des données présentes depuis + de 15 ans.  2006: iRODS premier intergiciel à fournir une politique de gestion des données basée sur des règles.  « customisable » pour s’adapter à de très nombreux cas d’utilisation.  I/O parallèles intensifs (analyse de données): iRODS pas adapté. Qu’est ce que iRODS ? iRODS - Journées ARAMIS17/04/14 10

 iRule Oriented Data Systems (DICE team: UNC, San Diego + RENCI plus tard): ◦ Début ◦ Open source. ◦ CC-IN2P3 collaborateur.  Dans une zone (domaine administratif: /zone1): ◦ 1 ou plusieurs serveurs connecté à un catalogue central iCAT (RDBMS: Oracle, PostGres, mySQL) + n serveurs hébergeant le stockage. ◦ Le iCAT contient:  Métadonnées fichiers.  Informations sur les utilisateurs (auth, droits d’accès etc…).  Informations sur les ressources physiques (type de stockage, localisation etc…).  Localisation des données  vue logique des données dans une zone. Qu’est-ce que iRODS ? iRODS - Journées ARAMIS17/04/14 11

iRODS: architecture (1 zone) iRODS - Journées ARAMIS17/04/14 12 OU iRODS iCAT iRODS (….) iCAT iRODS iCAT (….) (Maître) (esclave) iCAT: métacatalogue (base de données: PostGres ou mySQL ou Oracle)

 Possibilité d’avoir plusieurs zones: ◦ Chacune avec 1 iCAT + n serveurs de données. ◦ Indépendantes les unes des autres.  Domaines administratifs distincts: ◦ /zone1/… ◦ /zone2/… ◦ /zone3/…  Chaque zone avec ses propres: ◦ Utilisateurs, groupes d’utilisateurs. ◦ Ressources physiques. ◦ Règles de gestion des données.  Zones indépendantes les unes des autres.  Mais peuvent être interconnectées. Qu’est-ce que iRODS ? iRODS - Journées ARAMIS17/04/14 13

iRODS: architecture (n zones) iRODS - Journées ARAMIS17/04/14 14 iRODS iCAT iRODS (….) iCAT iRODS (….) iCAT iRODS (….) [/zone1] [/zone2] [/zone3]

 Politique de gestion des données sous forme de règles dans un langage de type C: ◦ Briques de base: micro-services  permettent d’effectuer des opérations de base sur iRODS.  Langage riche: ◦ Tests conditionnels. ◦ Boucles. ◦ Fonctions. ◦ Opérations arithmétiques. ◦ Manipulations de chaînes de caractères, expressions régulières. ◦ …..  Possibilité de stocker les règles dans le catalogue: ◦ Versionning.  Règles exécutables manuellement.  Peuvent aussi tourner en arrière plan: ◦ Tâche à effectuer de façon asynchrone. ◦ Tâche à exécuter périodiquement. Les règles dans iRODS iRODS - Journées ARAMIS17/04/14 15

 Peuvent être déclenchées automatiquement lors d’une action côté client (put, get, list, rename…): ◦ Actions automatiques stockés dans un fichier de configuration des serveurs. ◦ Exemple (action après un put):  Par défaut: acPostProcForPut { }  rien n’est fait.  Possibilité: acPostProcForPut { on ($objPath like "/ccin2p3/xxxxx/*") { # si fichier dans /ccin2p3/xxxxx msiSysReplDataObj('stageResc1','null'); # réplication dans ressource stageResc1 } } Les règles dans iRODS iRODS - Journées ARAMIS17/04/14 16

 Installation rapide.  Compile sur un grand nbre d’OS: ◦ Linux. ◦ BSD. ◦ Mac OS. ◦ AIX. ◦ Solaris.  Pour le iRODS iCAT: ◦ Catalogue: au choix PostGres, Oracle, mySQL.  Pour les serveurs de données: ◦ Utilisation d’un grand nombre de ressources physiques:  Systèmes de fichiers.  Bases de données.  Systèmes de stockage de masse.  Amazon S3.  …… ◦ Briques type « DAS » suffisantes pour un grand nombre de besoins. iRODS côté serveur iRODS - Journées ARAMIS17/04/14 17

 Authentification: ◦ User / mot de passe. ◦ Kerberos V. ◦ GSI: certificat X509. ◦ PAM: LDAP….  Clients: ◦ Commandes shell. ◦ API C, Java, Python, PHP, REST (en développement). ◦ Fuse. ◦ Parrot: utilisation de iRODS avec les commandes shell habituelles.  Portables sur un grand nombre de plateformes. ◦ Clients graphiques par défaut:  iDrop (drop box like).  Interfaces web. iRODS côté client iRODS - Journées ARAMIS17/04/14 18

iRODS côté client: exemples de icommands iRODS - Journées ARAMIS17/04/14 19 Unix-like ipasswd irsync ichksum imv icp ienv [etc…] FTP-like iinit iexit iput iget Métadonnées imeta: écriture/recherche de metadonnées personnelles. iquest: recherche de metadonnées système. idbo: interrogation d’objet de type bases de données Divers ireg: enregistrement de fichiers dans iRODS. ibun: gestion de fichiers tar/zip dans iRODS. irepl: replication de fichiers sur diverses ressources. ils ipwd icd ichmod irm imkdir

> iinit Mot de passe demandé. > ipwd /tempZone/home/nief/test > ils /tempZone/home/nief/test: test1.txt test2.txt > ils -L /tempZone/home/nief/test: nief 0 demoResc :29 & test1.txt generic /irods/Vault/test/demo/home/nief/test/test1.txt nief 0 demoResc :29 & test2.txt 2d22d8057a96f13cde4b4a0219d13fbf generic /irods/Vault/test/demo/home/nief/test/test2.txt nief 1 diskcache :33 & test2.txt 2d22d8057a96f13cde4b4a0219d13fbf generic /irods/Vault/test/cache/home/nief/test/test2.txt iRODS côté client: exemple d’utilisation de icommands iRODS - Journées ARAMIS17/04/14 20

> iput localfile.txt test3.txt > ils -A /tempZone/home/nief/test: ACL - nief#tempZone:own Inheritance - Disabled test1.txt ACL - nief#tempZone:own test2.txt ACL - nief#tempZone:own test3.txt ACL - nief#tempZone:own > ichmod read cardenas /tempZone/home/nief/test/test3.txt > ils -A /tempZone/home/nief/test: ACL - nief#tempZone:own Inheritance - Disabled test1.txt ACL - nief#tempZone:own test2.txt ACL - nief#tempZone:own test3.txt ACL - nief#tempZone:own cardenas#tempZone:read object iRODS côté client: exemple d’utilisation de icommands iRODS - Journées ARAMIS17/04/14 21

iRODS côté clients: interfaces graphiques iRODS - Journées ARAMIS17/04/14 22 Interface web: PHP + javascript iDROP: Interface Java autonome Ou iDROP-web: interface Web avec applet à la mode DropBox

 Gère les données de plus de 30 groupes.  8.3 Po (70 milllions de fichiers) actuellement stockés dans iRODS: ◦ Accès aux données à partir de sites distants pour projets internationaux. ◦ Certaines zones interfacées avec des zones distantes. ◦ Serveurs de données peuvent être hors CC-IN2P3. ◦ Taux d’accroissement observé: 20 To / jour. ◦ Sur le campus:  LBBE.  INSA (Creatis …). Utilisation de iRODS au CC-IN2P3 iRODS - Journées ARAMIS17/04/14 23

Exemple d’utilisation de iRODS iRODS - Journées ARAMIS17/04/14 24 BaBar: expérience HEP à SLAC (Stanford). archive à Lyon de la totalité des données(2 Po). transfert automatique de bande à bande (côté client: simple icp): 3-4 To/jour (pas de limitation). possibilité pour un admin à SLAC de récupérer des fichiers perdus dans la zone de Lyon.

 Neurosciences: ◦ Archivage, partage de données. ◦ Imagerie animalière:  Extraction automatique de métadonnées de fichiers DICOM pour effectuer des recherches de fichiers ultérieurement.  Sciences du vivant, biomédical: ◦ Accès, archivage de données en phylogénie etc..  Réplication automatique de données sur plusieurs supports (disques, bandes). ◦ Partage de données pour un projet travaillant sur les thromboses:  Extraction automatique de métadonnées sur les fichiers mis dans iRODS.  Divers domaines: ◦ Workflow sur les données:  Extraction d’archive tar, enregistrement dans un système d’information extérieur (Fedora-Common). Exemples d’utilisation de iRODS iRODS - Journées ARAMIS17/04/14 25

 Utilisateurs de iRODS dans de nombreux domaines (exemples): ◦ France: BnF, Obs de Strasbourg, CINES. ◦ USA: NASA, NOAO. ◦ Projets européens: EUDAT. ◦ Entreprises: DDN.  Usage de iRODS très intéressant pour: ◦ Le partage et distribution de données sur plusieurs supports ou sites. ◦ La gestion du cycle de vie de données. ◦ L’archivage. ◦ Intégration de workflow complexe.  Outil multi OS.  Perspectives: ◦ Nouvelle version majeure pilotée par le consortium iRODS: ◦ Architecture plus modulaire. Conclusion, perspectives iRODS - Journées ARAMIS17/04/14 26

  Références iRODS - Journées ARAMIS17/04/14 27