Master 2ième année Informatique du Document Soutenance de stage Master 2ième année Informatique du Document La « Cartographie Sémantique » Stage du 16/02 au 31/07 – Brice Sommacal 29/08/2008
Sommaire Présentation de l’environnement du stage Problématique Cas pratique : le projet SAFT Retour d’expérience
Présentation de l’environnement PCO Innovation et son pôle conseil Contexte: la cartographie sémantique et ses outils
PCO Innovation et son pôle conseil Société de service dans le domaine du PLM Le conseil/ L’intégration / L’éducation Pôle conseil Conduite de projets PLM Stratégie et organisation de l’innovation
La cartographie sémantique et ses outils La méthodologie But: Cartographier l’espace informationnel Comment: Analyse globale/détaillée Résultat: Un nuage de « mots-clé » Le SemanticCartographyPackage Ensemble d’outils et de documents utilisés pour la création d’un domaine conceptuel Création d’une ontologie métier avec Protégé
Problématique
Comment l’approche et les outils de Cartographie Sémantique peuvent se Problématique Comment l’approche et les outils de Cartographie Sémantique peuvent se mettre en œuvre dans le contexte de chaque projet ?
Le projet SAFT Phase 1: Représentation et visualisation de l’information Phase 2: Extraction et traitement de l’information
Phase 1: Représentation et visualisation de l’information Objectif: Coordonner la restitution des données Identification des concepts Modèle de données Renseignement du domaine Création d’un site Web
Modéliser les concepts identifiés chez SAFT Modèle de données Besoins Solutions Modéliser les concepts identifiés chez SAFT But: Cartographier le domaine de connaissance du client Analyse macroscopique puis microscopique du domaine Création d’une ontologie métier suivant l’architecture d’entreprise Outil: Protégé Remarque: La structuration du modèle de données évolue constamment.
Référencer la totalité des informations récoltés chez SAFT Renseignement du domaine Besoins Solutions Référencer la totalité des informations récoltés chez SAFT But: Alimenter le domaine de connaissance étudié Réifier les concepts précédemment créés. Renseigner les propriétés correspondantes Créer les relations N-aires correspondantes. Création d’un loader de documents Excel Remarque: La qualité de l’information entrée est déterminante.
Visualisation de l’information Besoins Solutions Présenter une visualisation simplifier de l’interaction entre les documents et leurs propriétés. But: Améliorer la communication entre les ‘key-users’ SAFT et les consultants PCO pour coordonner l'analyse et la validation des données. Caractérisation des classes business par des lentilles de Fresnel ( outil principal Longwell) Mise en place d’une feuille de style pour la création de tableaux > Paramétrage de l’outil de façon à incorporer les informations client et celles de PCO (logo) Site: http://saft-repository.pco-innovation.com/ Login: SAFTPLM Pwd:Saft2009Rep Remarque: La disponibilité de ce site depuis l’extérieur a permis aux employés de SAFT de vérifier les informations qu’ils nous ont fournis. Le navigateur à facette permet de trier les types de documents et d’accéder directement au document recherché.
Phase 2: Extraction et traitement de l’information Pré-requis: une ontologie IT isolée Deux programmes de migration : Ontologie métier vers IT Ontologie IT vers PDMLink
Développer une ontologie propre aux notions émergentes de PDMLink Ontologie IT Besoins Solutions Développer une ontologie propre aux notions émergentes de PDMLink But: Modéliser les concepts utilisés dans PDMLink pour faciliter la génération de fichier d’import. Analyse de l’outil et du formalisme employé dans les fichiers d’imports. Modélisation conceptuelle Outil Protégé Remarque: Amorcer le travail entre les concepts techniques et l’outil PDMLink pendant que l’analyse du modèle de données continuait. On veut pouvoir réutiliser cette ontologie, et le plugin associé dans les futurs projets.
Importer les data de l’ontologie métier vers l’ontologie IT Ontologie métier vers IT Besoins Solutions Importer les data de l’ontologie métier vers l’ontologie IT But: Convertir les instances crées dans le modèle de données client vers les concepts émergents de l’ontologie IT. Avec un plugin, lecture des instances de l’ontologie métier puis écriture dans un fichier temporaire suivant les concepts à réifier pour la couche IT. Insertion des données de ce fichier dans le fichier source de l’ontologie IT ( premier fils du document) Remarque: Le fichier source de Protégé est en RDF/XML. La librairie Jena et les technologies associées ne permettent pas de manipuler des triples sans préfixes. => Usage du XML
Fournir une base PDMLink prête à l’emploi Ontologie IT vers PDMLink Besoins Solutions Fournir une base PDMLink prête à l’emploi But: Extraire et traiter les données de Protégé pour les inclure dans PDMLink Mise en place d’un plugin d’extraction et de traitement de l’information (couche IT) afin de créer des documents XML à importer dans PDMLink Remarque: L’architecture des données est importée. Comment peupler notre base PLM ?
Retour d’expérience
Where are we? De la conceptualisation à la visualisation Définition des paradigmes métiers dans une ontologie Saisie des données Stockage Traitement Output FONCTIONS Capture des connaissances du domaine But: extraire et retourner une information correspond--ante aux besoins Modélisation des concept du domaine métier Base de données But: Lire et comprendre l’information Spécification Classes Propriétés Définition d’une Ontologie APPLICATIONS Paramétrage interne Représentation textuelle Représentation graphique > Editeur d’instances > Triple Store > Fichiers isolés > Requêteur > Spécification Mise à plat des concepts émergeants grâce à des logicielles de bureautique > Editeur d’ontologie > Serializer > Outil PLM > Reader > Grapheur > Loader > Outil documentaire > Navigateur à facettes OUTILS -NORMES Plusieurs outils de lecture d’ontologie (AGWebViewer, GRUF) Protégé 3.4 Instance Browser Requête SparQL via Twinkle, TopBraid, Protégé Protégé 3.4 – Class Browser yEd RDF/XML PDMLink AllegroGraph TopBraid Treebolic TopBraid Exhibit Sesame Serializer « fait maison » Personnalisation de l’affichage par des lentilles (Longwell)
Compétence acquises KO OK Généralités Exemples Apprentissage Utilisation KO OK PCO Innovation SAFT - Carto Présentation PCO - Ze Matrix Spécification PCO - Ze Matrix Proof of concept PCO Conseil SAFT - Meta-Ref Présentation SAFT - Meta-Ref Génération Doc PCO - SCP4P SelfDoc Présentation Le métier Client / Projet GE – Mikado Présentation GE - Mikado REX Technique Principes Exemples détaillés Bonnes Pratiques Mise en œuvre Démarche Templates La méthodologie Enterprise Architecture Exemples Bibliographie Clef Protégé Utilisation Basique Paramétrage avancé Développement des Plug-in Plug-in Protégé Paramétrage de base Ontologie de mapping L’outillage Programmes de migration entre applications Outils du Web Semantique Yed, Treebolic GraphViz Exhibit, Longwell Import/Export PDMLink Web Semantique Normes & Outils RDF OWL SPARQL Construct SPARQL Select Fresnel Lens SWT Faceted Classification Freebase et Co GXL, Graphml, … OPML, … SPIN Remarque: Ce schéma est issue de la feuille de route de mon stage (encadré par Bernard Chabot). Il représente l’évolution suivie durant mon stage.
Merci de votre attention Made by: Brice Sommacal