QUALITÉ DES DONNÉES la méthode générale modèle de données mesurer données non conformes corriger données corrigées / S.I. amélioré prévenir programmes corrigés gestion des exceptions
MESURER LA QUALITÉ DES DONNÉES BD collecte des données fait schéma ? traitement système d'extraction Le modèle des données est le point central de toutes les actions
MESURER LA QUALITÉ DES DONNÉES application A programmes bd qualité du système d’informations données modèle A qualité des données application B bd programmes qualité du système d’informations données modèle A qualité des données monde réel modèle de l’organisation (A+B+ liens fonctionnels) qualité du système d’informations de l’organisation
MESURER LA QUALITÉ DES DONNÉES
MESURER LA QUALITÉ DES DONNÉES
MESURER LA QUALITÉ DES DONNÉES
QUALITÉ DES DONNÉES la méthode générale modèle de données mesurer données non conformes corrections données corrigées mesures de prévention programmes corrigées gestion des exceptions
Pour le système d’information CORRIGER Pour les données inadéquation des concepts segmentation et normalisation des champs nettoyage des valeurs des champs détection des données « orphelines » déduplication des occurrences Pour le système d’information Amélioration du modèle des données et de l’application
CORRIGER
La mise en oeuvre de processus de qualité des données doit permettre : PRÉVENIR La mise en oeuvre de processus de qualité des données doit permettre : de nettoyer ponctuellement le fond du fleuve d’endiguer l’arrivée de nouveaux flux d’information de qualité douteuse
QUALITÉ DES DONNÉES la méthode générale modèle de données mesurer données non conformes corrections données corrigées mesures de prévention programmes corrigées gestion des exceptions
Importance des résistances PRÉVENIR Objectif : (Ré)organiser les flux de données de manière à garantir un niveau déterminé de qualité et donc minimiser les processus correctifs. Principe : Les données sont des produits sortant d'une chaîne de fabrication. On devrait donc leur appliquer les principes de contrôle de qualité de l'industrie. Mesure en différents points Validation par rapport au monde externe … Implique tout autant l'organisation (management, processus administratifs) que la technologie. Importance des résistances
Technique Organisationnel PRÉVENIR Correction des programmes Consolidation du dictionnaire de données (méta-données complètes). Réingénierie des BD Organisationnel Identification des processus et des flux des données Identification des points critiques et des responsabilités Formation des utilisateurs Restructuration organisationnelle : flux
les étapes de la qualité des données selon Gartner SYNTHÈSE les étapes de la qualité des données selon Gartner data profiling standar- disation dédoublo- nage nettoyage suivi enrichis sement mesurer corriger prévenir l’apport de la démarche proposée data profiling rétro- ingénierie définition des règles fusion des données correction des programmes évolution du modèle dictionnaire gestion des exceptions précisions des concepts détection des données « orphelines » extraction logique des données
SYNTHÈSE mesurer corriger prévenir ce qu’il faut faire 1 Comment garantir la conformité des données après la fusion des S.I. ? 2 Comment gérer les données anciennes du SI vis-à-vis des nouvelles règles de gestion ? 3 Comment gérer la qualité des flux de données entrant ou sortant du SI ? 4 Comment gérer les règles de gestion des données vis-à-vis des applications ? mesurer corriger prévenir ce qu’il faut faire 1 data profiling rétro- ingénierie préciser et compléter les règles gérer le dictionnaire des données les concepts corriger les données 2 data profiling rétro- ingénierie préciser et compléter les règles les concepts corriger les données gérer le dictionnaire des données 3 gérer les exceptions corriger les programmes rétro- ingénierie préciser et compléter les règles les concepts 4 rétro- ingénierie préciser et compléter les règles les concepts gérer les exceptions corriger les programmes