Journée Doctorant PSI le 04/06/2002 Reconstruction dobjets en XML par approche statistico-structurelle pour linterprétation de documents techniques Delalandre Mathieu
Journée Doctorant PSI le 04/06/2002 Sommaire Introduction Présentation du sujet Présentation des travaux Conclusions & Perspectives
Journée Doctorant PSI le 04/06/2002 Sommaire Introduction Présentation du sujet Présentation des travaux Conclusions & Perspectives
Journée Doctorant PSI le 04/06/2002 Introduction Avancement Première année de thèse dans la continuité du stage de DEA Directeurs de thèse Eric Trupin (PSI université Rouen) Jacques Labiche (PSI université Rouen) Jean-Marc Ogier (L3I université La Rochelle)
Journée Doctorant PSI le 04/06/2002 Introduction Collaboration doctorant et maîtres de conférence Pierre Héroux, Sébastien Adam, Youssouf Saidali Contexte industriel projet Doc-Mining (RNTL) FT R&D Lannion Laboratoire L3I La Rochelle Département informatique de luniversité de Friboug Équipe ISA de lINRIA Lorraine Sites de thèse
Journée Doctorant PSI le 04/06/2002 Sommaire Introduction Présentation du sujet Présentation des travaux Conclusion & Perspectives
Journée Doctorant PSI le 04/06/2002 Présentation du sujet Système dInterprétation « SI » (1) Système dinterprétation adaptable de documents techniques Reconstruction des résultats de la reconnaissance Documents non-structurés (images) et semi-structurés (PDF, DXF, PS)
Journée Doctorant PSI le 04/06/2002 Présentation du sujet SI (2) Chaîne de Reconnaissance De Formes « RDF » statistico structurelle Base de modèles Base de scénarios Commande -Interface -Pilotage de chaîne -SMA
Journée Doctorant PSI le 04/06/2002 Présentation du sujet Approche statistico-structurelle (1) Modèle de type structurelModèle de type statistique Primitives vectorielles Rapports angulaires Rapports : connexion, distance, etc… Primitives : arc,courbe, pattern
Journée Doctorant PSI le 04/06/2002 Présentation du sujet Approche statistico-structurelle (2) Approche statistique Plus robuste aux bruits, meilleurs résultats de reconnaissance Plus facile de mise en oeuvre Inapplicable dans les cas connectés Approche structurelle Seule approche pour détecter les objets composites, ou connectés Sensible aux bruits Approche NP complexe
Journée Doctorant PSI le 04/06/2002 Présentation du sujet Approche statistico-structurelle (3) Près- Traitement de lImage (TI) Extraction de Modèle (EM) structurel Extraction de Modèle (EM) statistique Chaîne de TI et EMChaîne RDF Classifieurs structurels Classifieurs statistiques Reconstruction de modèles OptimisationFusion de données
Journée Doctorant PSI le 04/06/2002 Présentation du sujet XML (1) Présentation XML eXtensible Markup Language Norme du W3C Langage de description de données Documents électroniques (statiques et dynamiques) Flots de données (Communications entre applications, BDD)
Journée Doctorant PSI le 04/06/2002 Présentation du sujet XML (2) Présentation XML Document CSS : Style XML : Données DTD : Structure & types de données Document HTML : Données Style
Journée Doctorant PSI le 04/06/2002 Présentation du sujet XML (3) Présentation XML Meta-langage : SVGVecteurs XGMMLGraphes MathMLMathématiques DAML-OILOntologies Langages de traitement Langage de requêtes XML-QL Langage transformation de données XSLT
Journée Doctorant PSI le 04/06/2002 Présentation du sujet XML (4) XML en interprétation de documents Cest un outil informatique, il apporte : 1.Conversion de formats Interne au système : Interfaçage entre outils Externe au système : Export tous formats (format pivot) 2.Permet de structurer et de représenter les résultats de la reconnaissance (XML & DTD, SVG) 3.Contrôle des modèles de représentation des formes (XSLT) Sélection de primitives Choix de modélisation du graphe
Journée Doctorant PSI le 04/06/2002 Présentation du sujet Conclusions (1) Les approches statistique et structurelle sont nécessaires et complémentaires pour linterprétation de documents techniques dans les cas connectés
Journée Doctorant PSI le 04/06/2002 Présentation du sujet Conclusions (2) Pourquoi XML : Système de RDF = Première brique dun SI, il faut prendre en compte son exploitation dans le SI, XML simpose : 1.Représentation des résultats de la reconnaissance (DTD et SVG) 2.Contrôle des modèles (XSLT) La qualité de la RDF est fonction de lefficacité de létape dextraction de modèles, de lefficacité de létape de classification, de la qualité du modèle de représentation pour une forme donnée dans un contexte donnée
Journée Doctorant PSI le 04/06/2002 Sommaire Introduction Présentation du sujet Présentation des travaux Conclusions & Perspectives
Journée Doctorant PSI le 04/06/2002 Présentation des travaux Chaîne de RDF statistico structurelle Base de modèles Base de scénarios Commande -Interface -Pilotage de chaîne -SMA Introduction (1) Partie 1 : Système de RDF statistico structurel & linterface XML avec le SI Partie 2 : Base de modèles commune au système de RDF
Journée Doctorant PSI le 04/06/2002 Présentation des travaux Introduction (2) Près-TI EM structurel EM statistique Chaîne de TI et EMChaîne RDF Classifieurs structurels Classifieurs statistiques Reconstruction de modèles OptimisationFusion de données
Journée Doctorant PSI le 04/06/2002 Présentation des travaux Introduction (3) Thématique une (T1) : Reconnaissance statistico-structurelle de symboles Thématique deux (T2) : Bibliothèque de traitements pour la RDF statistico-structurelle Thématique trois (T3) : Extraction de modèle structurel à base dobjets complexes
Journée Doctorant PSI le 04/06/2002 Présentation des travaux T1 : Reconnaissance statistico-structurelle de symboles (1) Stage de DEA Travaux de thèse Deux articles SSPR (accepté) CIFED (en cours de soumission) Collaborations Travaux de thèse de S.Adam et P.Héroux Projet étudiants (Maîtrise EEA) Stage de DEA (Stéphane Nicolas)
Journée Doctorant PSI le 04/06/2002 Présentation des travaux T1 : Reconnaissance statistico-structurelle de symboles (2)
Journée Doctorant PSI le 04/06/2002 Présentation des travaux T1 : Reconnaissance statistico-structurelle de symboles (3) Perspectives (court terme)
Journée Doctorant PSI le 04/06/2002 Présentation des travaux T2 : Bibliothèque de traitements pour la RDF statistico-structurelle (1) Travaux de thèse Collaborations Projets étudiants (DESS GIE)
Journée Doctorant PSI le 04/06/2002 Présentation des travaux T2 : Bibliothèque de traitements pour la RDF statistico-structurelle (2) Regroupement doutils du laboratoire PSI Bibliothèque doutils de traitement dimages PSI Image Processing Library (psi.ipl) Bibliothèque doutils pour la classification PSI Classification Tool Library (psi.ctl) Bibliothèque dinterfaces dédiées au document PSI Document Interface Library (psi.dil)
Journée Doctorant PSI le 04/06/2002 Présentation des travaux T2 : Bibliothèque de traitements pour la RDF statistico-structurelle (3) Quelques caractéristiques : Écrite et interfaçable en Java/C-C++ Mécanisme des librairies dynamiques Portable Windows/Linux Documentée à la JavaDoc Flot XML et dérivé (SVG,XGMML) JAI, LibTIFF, STL
Journée Doctorant PSI le 04/06/2002 Présentation des travaux T2 : Bibliothèque de traitements pour la RDF statistico-structurelle (4) Perspectives (moyen terme) Réflexion conjointe sur les modèles en terme de: Traitements Scénarios Représentation des formes Comparaison avec les bibliothèques existantes sur Internet
Journée Doctorant PSI le 04/06/2002 Présentation des travaux T3 : Extraction de modèle structurel à base dobjets complexes (1) Stage de DEA et Travaux de thèse Collaborations Travaux de DEA de A.Lassaulzais & S.Adam Projets étudiants (Maîtrise EEA et IUP2) Voyage GDR-ISIS La Rochelle Collaborations futures Xavier Hilaire « ISA » (vectorisation robuste stable et précise) Philippe Dosh « ISA » (signatures vectorielles)
Journée Doctorant PSI le 04/06/2002 Présentation des travaux T3 : Extraction de modèle structurel à base dobjets complexes (2)
Journée Doctorant PSI le 04/06/2002 Présentation du sujet T3 : Extraction de modèle structurel à base dobjets complexes (3) Problèmes de complexité, solutions envisagées : Pas de tout structurel (applications simples, exploitation lapproche structurelle en émission-validation dhypothèses) Exploitation de primitives complexes (arcs, courbes, patterns) isomorphisme à base dobjets complexes Contrôle du modèle = Restriction du graphe à un modèle exploitable Problèmes de sensibilité aux bruits, solutions envisagées : isomorphisme inexact, tolérance dans lappariement
Journée Doctorant PSI le 04/06/2002 Présentation des travaux T3 : Extraction de modèle structurel à base dobjets complexes (4) Perspectives (court terme) Méthodes de réduction unitaire Détection de contours Squelettisation Taconnet, Dibaja, suivi de traits Primitives Vecteurs : Polygonisation la corde & Merge, Wall & Danielson, degré intériorité Arc de cercle : Courbes : Approximation par polynômes de Bézier Détection des nœuds par reconstruction Correction du modèle et calcul dattributs
Journée Doctorant PSI le 04/06/2002 Présentation des travaux T3 : Extraction de modèle structurel à base dobjets complexes (5) Perspectives (court terme) Tolérance dans lappariement de graphe Isomorphisme de sous-graphes Isomorphisme à base dobjets complexes
Journée Doctorant PSI le 04/06/2002 Sommaire Introduction Présentation du sujet Présentation des travaux Conclusions & Perspectives
Journée Doctorant PSI le 04/06/2002 Conclusions et Perspectives Conclusions (1) Intérêt de lapproche statisitico-structurelle Pour les cas connectés Intérêt dXML dans un système dinterprétation de documents Manipulation de données Manipulation des modèles de représentation
Journée Doctorant PSI le 04/06/2002 Conclusions et Perspectives Conclusions (2) Limite de lapproche structurelle Extraction de primitives complexes Pas de tout structurel
Journée Doctorant PSI le 04/06/2002 Conclusions et Perspectives Perspectives (1) Court terme Finalisation de la chaîne structurelle (EM et classifieur) afin dobtenir un système de RDF statistico-structurel suffisant Exploitation depuis un SI Moyen terme Réflexion sur les modèles, constitution dune bases de modèles de représentation et de scénarios commune au système
Journée Doctorant PSI le 04/06/2002 Conclusions et Perspectives Perspectives (2) Long terme Extension du système de RDF (TI, EM, Classifieurs) Exploitation depuis un SMA et confrontation avec un système de pilotage classique
Journée Doctorant PSI le 04/06/2002 Conclusions et Perspectives Merci de votre attention Sites de thèse