Présentation de PANDORA ELFE Séminaire « Appariements sécurisés » 19 janvier 2012 Ando Rakotonirina – Sophie de Visme - Rainer Kugel Présentation de PANDORA ELFE Séminaire « Appariements sécurisés » 19 janvier 2012 Ando Rakotonirina – Sophie de Visme - Rainer Kugel
Le contexte L’étude Elfe est une étude de cohorte sur une période de 20 ans : accumulation des données au fil des enquêtes réalisation de nombreuses enquêtes sur la base des données collectées Pas d’anonymisation complète des données Prendre toutes les précautions permettant de garantir l’anonymat des enquêtés et de protéger les fichiers Respecter les règlementations et donc, recevoir l’agrément de autorités (Cnil, Cnis, Cctirs,etc.) Un système disponible pendant 20 ans.
SI ELFE : Pandora Système de gestion des données de la cohorte Objectifs : Stocker de façon sécurisée des données de haute qualité Fournir des données de la cohorte Contraintes : La sécurité et la qualité des données Garantir l’accès aux données malgré les évolutions technologiques
Description fonctionnelle Solution retenue : C’est une plate-forme composée de plusieurs entités fonctionnelles et séparées physiquement entre elles dont les échanges sont initiés uniquement par le CADE. la séparation des identifiants et des données l’atomisation des données collectées Une solution basée sur : séparation des environnements de travail des entités génération d’identifiant unique par donnée collectée. la volatilité de l’entité de l’opérateur de jointure mécanisme de chiffrement des échanges contractualisation des échanges entre les entités selon les processus organisationnel du CADE. C’est PANDORA
Architecture fonctionnelle cible du système d’information ELFE ETUDE Une équipe de recherche veut mener une étude sur la base d’un sous ensemble de données de la cohorte. Elle souhaite recevoir les données d’une série de variables regroupée par individu Une équipe de recherche veut mener une étude sur la base d’un sous ensemble de données de la cohorte. Elle souhaite recevoir les données d’une série de variables regroupée par individu Décideur Donne son accord pour cette étude. Fournit 3 instructions aux 3 gestionnaires (I2, I3, I4) Donne son accord pour cette étude. Fournit 3 instructions aux 3 gestionnaires (I2, I3, I4) B - Gestionnaire des IDentifiants Il a en sa possession la liste de tous les identifiants des variables associées aux individus ELFE Il reçoit l’instruction (I4) pour : A.Générer de nouveaux identifiants B.Fournir la liste des identifiants Il a en sa possession la liste de tous les identifiants des variables associées aux individus ELFE Il reçoit l’instruction (I4) pour : A.Générer de nouveaux identifiants B.Fournir la liste des identifiants Opérateur de jointure Assure la jointure entre les identifiants et les données des individus Fournit un ensemble de données regroupés par individus extraites du SIELFE Assure la jointure entre les identifiants et les données des individus Fournit un ensemble de données regroupés par individus extraites du SIELFE A - Gestionnaire des Données Stocke les données Fournit les données Stocke les données Fournit les données Collecte Collecte les données à partir d’une enquête ou à partir de prélèvements de ressources biologiques Associe à une donnée, un identifiant fourni par le gestionnaire des Identifiants Collecte les données à partir d’une enquête ou à partir de prélèvements de ressources biologiques Associe à une donnée, un identifiant fourni par le gestionnaire des Identifiants 1 I I3 I Gestionnaire des Identités Stocke les données nominatives Fournit les données nominatives Remarques : Ces données ne sont jamais fournies dans le cadre d’une étude, elles sont réservées exclusivement aux collectes Stocke les données nominatives Fournit les données nominatives Remarques : Ces données ne sont jamais fournies dans le cadre d’une étude, elles sont réservées exclusivement aux collectes 7 I3
Gestionnaire des Identifiants Gestionnaire des Données.. Gestionnaire des Identités.. Matthieu Théo 120 cm23 kg 96 cm12 kg ID1 ID2 PANDORA : Un système de stockage SECURISE
Gestionnaire des Identifiants Gestionnaire des Données.. Gestionnaire des Identités.. PANDORA : Un système de fourniture de données de la cohorte. Opérateur de jointure ID1 ID2 Matthieu Théo 120 cm 23 kg 96 cm 12 kg SORTIE DES DONNEES.. Matthieu Théo 120 cm 23 kg 96 cm12 kg ID1 ID2
Gestionnaire des Identifiants Gestionnaire des Données.. Gestionnaire des Identités.. PANDORA : Un système de fourniture de données de la cohorte Opérateur de jointure SORTIE DES DONNEES.. Matthieu120 cm 23 kgID1 Théo 96 cm12 kgID2
Gestionnaire des Identifiants Gestionnaire des Données.. Gestionnaire des Identités cm23 kg 96 cm12 kg PANDORA : Principe d’atomisation des données Matthieu Théo 120 cm23 kg 96 cm12 kg ID1 ID2
Gestionnaire des Identifiants Gestionnaire des Données.. Gestionnaire des Identités cm23 kg 96 cm12 kg PANDORA : Principe d’atomisation Matthieu Théo ID 1 ID
Gestionnaire des Identifiants Gestionnaire des Données.. Gestionnaire des Identités.. PANDORA : stockage sécurisé Opérateur de jointure Matthieu Théo 120 cm 23 kg 96 cm 12 kg ID ID2 nomtaillepoids Matthieu Théo 120 cm 96 cm 23 kg 12 kg nom taille poids
PANDORA
PANDORA est un système de stockage sécurisé des données de cohorte. Il permet également de fournir des données conformément à un processus de demande. PANDORA doit garantir le stockage et l’accès des données sur une très longue période (20 ans pour Elfe) limiter les risques de collusions limiter les défaillances garantir la pérennité du système sur 20 ans