Stockage dans les systèmes Pair à Pair

Slides:



Advertisements
Présentations similaires
Mais vous comprenez qu’il s’agit d’une « tromperie ».
Advertisements

Le Nom L’adjectif Le verbe Objectif: Orthogram
ORTHOGRAM PM 3 ou 4 Ecrire: « a » ou « à » Référentiel page 6
LES NOMBRES PREMIERS ET COMPOSÉS
Ma surprise du Zoo.
[number 1-100].
Qualité du Premier Billot. 2 3 Défauts reliés à labattage.
1. Résumé 2 Présentation du créateur 3 Présentation du projet 4.
Vocabulaire 6.2 Français II Bon voyage ! 1.
Licence pro MPCQ : Cours
Distance inter-locuteur
1 Plus loin dans lutilisation de Windows Vista ©Yves Roger Cornil - 2 août
1. ami 2. compagnon 3. amant 4. frère 5. père 6. maître 7. éducateur 8
Réseau ATB du CClin Paris-Nord – résultats 2011 LL, 22/11/ Réseau antibiotiques du CClin Paris-Nord : Résultats 2011 Coordination: Dr François LHÉRITEAU.
Évaluation des requêtes relationnelles
Les numéros 70 –
Les numéros
Sud Ouest Est Nord Individuel 36 joueurs
Les identités remarquables
Le, la, les words Possessive Adjectives MINE!!. 2 My in french is mon, ma,mes... Le word/ begins with a vowel: Mon La word: Ma Les word: Mes.
Sirop de Liège « industriel »
La diapo suivante pour faire des algorithmes (colorier les ampoules …à varier pour éviter le « copiage ») et dénombrer (Entoure dans la bande numérique.
LES TRIANGLES 1. Définitions 2. Constructions 3. Propriétés.
1 7 Langues niveaux débutant à avancé. 2 Allemand.
Mr: Lamloum Med LES NOMBRES PREMIERS ET COMPOSÉS Mr: Lamloum Med.
SERABEC Simulation sauvetage aérien avec un Hercule C130. Départ de St-Honoré le 4 octobre Durée de vol 3 heures. Premier vol en Hercule pour les.
1 5 octobre 2011 / paw Présentation du 7 octobre 2011.
Le soccer & les turbans Sondage mené par lAssociation détudes canadiennes 14 juin 2013.
Synchronisation et communication entre processus
1 Choisir une catégorie. Vous recevrez la réponse, vous devez donner la question. Cliquez pour commencer.
Présentation générale
1 Guide de lenseignant-concepteur Vincent Riff 27 mai 2003.
GRAM 1 CE2 Je sais transformer une phrase affirmative en phrase négative.
PM18 MONTAGE DU BLINDAGE AUTOUR DE LA QRL F. DELSAUX - 25 JAN 2005
Le Concours de Conaissance Francais I novembre 2012.
Détection de co-évolution de gènes Master 2 : Informatique à Finalité Professionnelle et Recherche Unifiée (IFPRU) Parcours Ingénierie de lIntelligence.
Titre : Implémentation des éléments finis sous Matlab
1 Journée de regroupement des correspondants "Egalité et genre" - 21 novembre 2011 Rectorat de Rouen - SAIO - CD-HD Résultats scolaires, appréciations.
Projet poker 1/56. Introduction Présentation de léquipe Cadre du projet Enjeux Choix du sujet 2.
LES NOMBRES PREMIERS ET COMPOSÉS
Logiciel gratuit à télécharger à cette adresse :
Les chiffres & les nombres
1.Un rang de données multicolores 2. Deux permutations des n premiers entiers 3. b permutations des k premiers entiers 4. Choix de n points dans [0,1]
1 INETOP
1 Délégation FSA 2008: Cycle de formations prédépart __ Quest-ce que la mondialisation ?
RACINES CARREES Définition Développer avec la distributivité Produit 1
Représentation des systèmes dynamiques dans l’espace d’état
Représentation des systèmes dynamiques dans l’espace d’état
Représentation des systèmes dynamiques dans l’espace d’état
DUMP GAUCHE INTERFERENCES AVEC BOITIERS IFS D.G. – Le – 1/56.
1 Licence dinformatique Algorithmique des graphes Problèmes dordonnancement. Utilisation de ce document strictement réservée aux étudiants de l IFSIC dans.
Année universitaire Réalisé par: Dr. Aymen Ayari Cours Réseaux étendus LATRI 3 1.
1 10 pt 15 pt 20 pt 25 pt 5 pt 15 pt 20 pt 25 pt 5 pt 10 pt 15 pt 20 pt 25 pt 5 pt 10 pt 15 pt 20 pt 25 pt 5 pt 10 pt 15 pt 20 pt 25 pt 5 pt Les fonctions.
Titre : Implémentation des éléments finis en Matlab
MAGIE Réalisé par Mons. RITTER J-P Le 24 octobre 2004.
1 INETOP
Influenza: le modèle épidémiologique belge 29 Mai 2009
Architecture des systèmes pair-à-pair de gestion de données Gabriel Antoniu Projet PARIS IRISA/INRIA.
Aire d’une figure par encadrement
Comment rendre une femme heureuse…
P.A. MARQUES S.A.S Z.I. de la Moussière F DROUE Tél.: + 33 (0) Fax + 33 (0)
MAGIE Réalisé par Mons. RITTER J-P Le 24 octobre 2004.
Vocabulaire 7.1 Français II Bon voyage ! 1.
Traitement de différentes préoccupations Le 28 octobre et 4 novembre 2010.
1/65 微距摄影 美丽的微距摄影 Encore une belle leçon de Macrophotographies venant du Soleil Levant Louis.
Nom:____________ Prénom: ___________
CALENDRIER-PLAYBOY 2020.
Commission paritaire de suivi des opérations de reclassement repositionnement dans le cadre du droit d’option Statistiques novembre 2010.
Les Chiffres Prêts?
Transcription de la présentation:

Stockage dans les systèmes Pair à Pair Olivier Soyez Directeurs de Thèse : Cyril Randriamaro – Vincent Villain L'action concertée incitative

Un pair? Internet Pas de consensus sur la définition

Emule Pas de consensus sur la définition

Emule 14 Millions d’utilisateurs 1,4 Milliards de fichiers = Plusieurs Po Pas de consensus sur la définition

Qui possède les ressources qui alimentent le système ? Pair à Pair (P2P) ? Qui possède les ressources qui alimentent le système ? l’ensemble des pairs Pas de consensus sur la définition À la base définition fonctionnelle , puis par glissement sémantique définition structurelle et duynamique PAS SIMPLISTE

Plan Les systèmes de stockage Pair à Pair Le projet Us Politiques de distribution Conclusion / Perspectives

Applications du P2P Partage des fichiers Partage de CPU Diffusion de MP3, DIVX Pionnier : Napster (Shawn Fanning) Emule (Open Source) Partage de CPU Applications scientifiques Seti@Home (Berkeley) Décrypthon (Téléthon) XtremWeb (Paris XI - LRI) Partage des disques Système génèrique calcul pair à pair Seti@Home : détecter une vie extraterrestre, de grandes paraboles écoute à la porte du ciel, et grâce au nombre conséquent de participant, il est possible de traiter l’immense masse de données reçues. Le décrypthon pour décrypter le génome humain et analyser des molécules à des fins thérapeutiques. A titre d’exemple, le décrypthon a permis de trouver 45 traitements antivariolique en l’espace de 6 mois, alors qu’il aurait fallu des années de calcul avec des moyens traditionnels.

Projets stockage P2P Projet IRIS (12 M$) Projet DELIS Mnemosyne (sprintlab) Clique (HP) Mammoth (BC U) Ficus (UCLA) Tornado (Tsing Hua U.) ... OceanStore (Berkeley) CFS (MIT) PAST (Rice) PASTA (Microsoft) Farsite (Microsoft) InterMemory (NEC) Ivy (MIT) PlanetP (Rutger U.) Projet IRIS (12 M$) MIT, Berkeley, Rice, ... (http://project-iris.net) Projet DELIS (http://delis.upb.de)

Deux grandes classes Indexation centralisée Indexation distribuée DHT IBP (LoCI) Intermemory (NEC) Indexation distribuée PAST (Rice) PASTIS (Paris VI - LIP 6) Ivy (MIT) OceanStore (Berkeley) DHT Indexation , qui à quoi? OceanStore partage collaboratif et système multi écrivain

Table de Hachage Distribuée (DHT) 1 3 2 5 Ensemble des identifiants codés sur m bits 4

Table de Hachage Distribuée (DHT) Modéle en couches (CFS : Chord File System) Primitives simples (put, get) Application distribuée (Application) put(clé, donnée) get (clé) donnée Table de hachage distribuée (Pérennité) (DHT) lookup(clé) Adresse IP (Routage) (Overlay) Service de localisation (Pairs)

Routage dynamique (Overlay) 1 9 Chaque pair mémorise k pairs de distance 2i, 1  i  k 64 32 16 8 4 2 128 137 REDONDANCE DES CHEMINS + maintenir à jour les chemins Du au caractère dynamique des nœuds, chaque nœud mémorise k successeurs. Et un algorithme autostabilisant s’exécute de manière périodique pour mettre à jour les k successeurs de chaque nœud. Chord

Écriture d’un fichier (DHT) 1 4 56 8 41 12 14 30 19 12

Lecture d’un fichier (DHT) 1 4 56 8 41 12 14 30 fichier 12? 19

Écriture d’un fichier (DHT) 1 4 56 8 41 12 14 30 19 12

Pérennité? (DHT) 1 4 56 8 12 41 12 14 30 19 12

Le projet Us

Sauvegarde

Incident

Restauration

Reconstruction = s quelconques parmi s+r Redondances k = 2 vs (s,r)=(4, 4) A)Réplication (DHT) - Données dupliquées : k fois - Espace utile : 1/k - Tolérance : k-1 pannes B)Codes Correcteurs (Us…) - Données fragmentées : s - Redondance : r - Espace utile : s / (s+r) - Tolérance : r pannes Exemple avec 10 Mo et 20 Mo, 50% N’impçorte quelle combinaison de s fragments parmi les s+r permet de reconstruire le bloc Reconstruction = s quelconques parmi s+r

Redondance : vie des données ? Fragments d’1 bloc avec s=3, r=5 s+r Seuil critique Fragments disponibles s 1 seul bloc inéluctablement le bloc est perdu Temps

Fragments disponibles Redondance + Maintien Fragments d’1 bloc avec s=3, r=5 s+r Fragments disponibles s Comme pour le processus de maintenance de la redondance des chemins dans chord, …. Pour remédier à cela, on utilise un processus dynamique de reconstruction des fragments Temps

Us = Disque Dur Virtuel P2P Pérenne

Architecture Us Us Utilisateur Us Client Us Blocs Fournisseur Système de fichier UsFS Utilisateur Us Client Us Blocs Fournisseur 3 entités : les clients en rouge, les fournisseurs en jaune, les stockeurs en … Fournisseur Fragments Us

Stockage d’un fichier UsFs Us fichier blocs s fragments découpage blocs fragmentation Us s fragments On note f le nombre de fragments Le stockage d’un fichier s’effectue en 3 phases découpage Cette phase est assurée par le système de fichier UsFS. Fragmentation + redondance Ces phases sont gérées par le système de stockage Us. redondance f=s+r fragments

Distribution des données

Contexte Us Environnement Pair à Pair Couche communication Pannes Déconnections fréquentes Couche communication Internet (ADSL) : Réception >> Envoi Bande passante limitée des Pairs Asymétriques

A la mort d’un seul pair Exemple 100*30=3000 fragments  3 Go Chaque pair stocke 100 fragments de taille 1 Mo Un bloc est composé de f=31 fragments Régénérer un fragment perdu Envoi des f-1 fragments A la mort d’un seul pair 100*30=3000 fragments  3 Go Annuaire ils ont choisi d’être centralisé … Mettre origine Labo projet

Exemple 128 Kb 10 Mb 2 minutes ! 4 heures !

Problématique Coût de reconstruction élevé X Y Nombreuses reconstructions X Y Coût de reconstruction = Nombre maximum de fragments envoyés dans le pire des cas

Théorème du repliement Le coût de reconstruction est linéaire et facteur du nombre de blocs stockés X X’ Y Y’ Coût=2  Trouver une distribution optimale de coût de reconstruction = 1

Formulation du problème X Y Maximiser le nombre de blocs Coût de reconstruction = 1 Intersection entre 2 blocs  1 Notre problème est : J’ai prouvé que ce problème équivaut à obtenir une intersection entre 2 blocs distincts  1

Et ça, pour tous les pairs ! Cas idéal Bi Bj  Et ça, pour tous les pairs ! Cas idéal : chaque pair est centre d’une fleur

Formulation mathématique Trouver un ensemble maximal de listes de f éléments parmi N Intersection entre 2 listes distinctes  1 1 liste de f éléments = 1 bloc f=5  X : {1,2,3,4,5} et Y : {5,6,7,8,9} N = nombre total de pair SOLUTION ?

Plan affine fini d’ordre n Nombre de points = n² Nombre de lignes = n²+n Intersection entre 2 lignes  1 1 2 3 5 6 4 7 pairs N= n² blocs NB= n²+n blocs Restrictions sont fortes : Le nombre de fragments doit être un nombre premier Le nombre total de pairs est fixé

Pas toujours de solution Contraintes f fixé : puissance d’un nombre premier Paramètre modulable du système N fixé : dépendant de f Hypothèse non acceptable Pas toujours de solution Bilan Chercher la limite théorique du problème Proposer une heuristique de distribution dans un système pair à pair impossible d’imposer le nombre d’utilisateur Restrictions sont fortes : Le nombre de fragments doit être un nombre premier Le nombre total de pairs est fixé

Limite théorique du problème Schonheim (1966) Trouver une distribution qui approche le plus possible le nombre de blocs stockés NBmax : la distribution pseudo-affine * Annuaire ils ont choisi d’être centralisé … Mettre origine Labo projet C. Randriamaro, O. Soyez, G. Utard and F. Wlazinski Data distribution in a peer to peer storage system Actes de GP2PC05, mai 2005 *

Distribution pseudo-affine Détermine le + grand nombre premier p1 f  p1  N/f  nombre d’ = 0 p1 matrices d’  = 1 + matrices d’  = 0 1 p1+1 2p1+1 … (f-1)p1+1 1 p1+2 2p1+2 … (f-1)p1+2 1 p1+3 2p1+3 … (f-1)p1+2 1 … … … … 1 p1+ p1 2p1+ p1 … (f-1)p1+ p1 p1 lignes 1 centre de la fleur !!!! f colonnes

Distribution pseudo-affine f=5 (fragments) et N=40 (pairs)  p1=7 +1 +2 +3 1 8 15 22 29 1 9 16 23 30 1 10 17 24 31 1 11 18 25 32 1 12 19 26 33 1 13 20 27 34 1 14 21 28 35 2 8 16 24 32 2 9 17 25 33 2 10 18 26 34 2 11 19 27 35 2 12 20 28 29 2 13 21 22 30 2 14 15 23 31 3 8 17 26 35 3 9 18 27 29 3 10 19 28 30 3 11 20 22 31 3 12 21 23 32 3 13 15 24 33 3 14 16 25 34 rotations

Distribution pseudo-affine f=5 (fragments) et N=40 (pairs)  p1=7 1 8 15 22 29 1 9 16 23 30 1 10 17 24 31 1 11 18 25 32 1 12 19 26 33 1 13 20 27 34 1 14 21 28 35 2 8 16 24 32 2 9 17 25 33 2 10 18 26 34 2 11 19 27 35 2 12 20 28 29 2 13 21 22 30 2 14 15 23 31 3 8 17 26 35 3 9 18 27 29 3 10 19 28 30 3 11 20 22 31 3 12 21 23 32 3 13 15 24 33 3 14 16 25 34

Distribution pseudo-affine f=5 (fragments) et N=40 (pairs)  p1=7 1 8 15 22 29 1 9 16 23 30 1 10 17 24 31 1 11 18 25 32 1 12 19 26 33 1 13 20 27 34 1 14 21 28 35 2 8 16 24 32 2 9 17 25 33 2 10 18 26 34 2 11 19 27 35 2 12 20 28 29 2 13 21 22 30 2 14 15 23 31 3 8 17 26 35 3 9 18 27 29 3 10 19 28 30 3 11 20 22 31 3 12 21 23 32 3 13 15 24 33 3 14 16 25 34 On peut encore construire des matrices plus petites … NBp1=p1²

Distribution pseudo-affine * Arithmétique modulaire Théorie des nombres premiers Solution f nombre premier Pour tout N Asymptotiquement optimale Optimale N multiple de f² Ensemble quotient C. Randriamaro, O. Soyez, G. Utard and F. Wlazinski Data distribution in a peer to peer storage system Actes de GP2PC05, mai 2005 *

Analyse Limite théorique Distribution pseudo-affine Nombre de blocs (NB) En plus d’être asymptotiquement optimale, pour des nombres possibles de pairs, notre distribution est toujours très proche de l’optimale. + ZOOM pour : croissance en escalier = éloignement de N par rapport aux multiples de f² La courbe de notre distribution évolue en escalier due à l’éloignement de N par rapport aux multiples de f² Nombre de pairs (N)

Distribution DHT = Aléatoire 1 4 56 8 41 12 14 30 19 12

Coût de reconstruction Comparaison Distribution aléatoire Limite théorique Distribution pseudo-affine Coût de reconstruction Nombre de pairs (N)

Corrélation des pannes

Corrélation des pannes Y X ECHEC PERENNITE

* Métapairs Regroupement de Pairs Architecture à 2 niveaux Corrélation des pannes * Rapprochement topologique Métapair = + proche géographiquement Architecture à 2 niveaux Métapairs Pairs C. Randriamaro, O. Soyez, G. Utard and F. Wlazinski Data distribution for failure correlation management in a peer to peer storage system Actes de GP2PC05, mai 2005 *

Métapairs 1 2 3 4 5 6 7 8 9 Association de la distribution pseudo-affine et d’une distribution aléatoire 1 2 3 4 5 6 7 8 9 On réutilise la distribution statique, chaque pair devient un métapair (un ensemble de pair) Chaque pair devient un métapair, un métapair est un ensemble de pairs géographiquement proche. Each peer become a MetaPeer, one MetaPeer is a set of peers geographically close. And we have the following storage rules: The f fragments of a block are stored inside f differents MetaPeers. In this condition, the failure correlation is managed. And one fragment of a block is stored by a peer selected randomly inside a MetaPeer.

Pseudo-affine sur Métapairs Blocs 1 2 3 4 5 6 7 8 9 Métapairs Pairs

Exemple avec f=3 9 pairs répartis dans 3 Métapairs Taille des Métapairs = 3 MP 1 MP 2 MP 3 MP 1 MP 2 MP 3 1 1 1 Mieux que aléatoire, on peut faire du pseudo affine à l’intérieur des Métapairs. 2 3 2 3 2 3

Exemple avec f=3 Répartition cyclique MP 1 MP 2 MP 3 MP 1 MP 2 MP 3 1

Exemple avec f=3 Algorithme de la distribution pseudo-affine MP 1 MP 2 MP 3 1 2 3 2 1 MP 1 MP 2 MP 3 1 1 1 1 1 2 2 3 2 2 3 2 3 3 3

Coût de reconstruction Analyse (1) Coût de reconstruction Nombre de pairs (N)

Coût de reconstruction Analyse (2) Distribution aléatoire RSUW05 avec 7 Métapairs RSUW05 avec 294 Métapairs Coût de reconstruction Temps

Développements Us (Java) UsFS (C) Prototype fonctionnel Système de fichier Module noyau Journalisation Espace Utilisateur Noyau ls –l /home/oli/UsFS glibc libfuse UsFS /home/oli/UsFS VFS NFS Fuse Ext3 JE Quantification de l’impact de la corrélation des pannes sur

Conclusion / Perspectives Distribution pseudo-affine Coût de reconstruction Corrélation des pannes Etude quantitative de la pérennité de la distribution Métapairs Expérimentation à grande échelle Grid5000 Etude comportementale des pairs Profil utilisateur JE Quantification de l’impact de la corrélation des pannes sur