Algèbre de composants : une approche fonctionnelle à la sémantique de documents Bart Lamiroy LORIA/INPL QGar - École des Mines de Nancy.

Slides:



Advertisements
Présentations similaires
MOT Éditeur de modèles de connaissances par objets typés
Advertisements

Les Web Services Schéma Directeur des Espaces numériques de Travail
Première expérience d’utilisation des Web Services dans SmartTools Didier Parigot Projet OASIS INRIA Sophia www-sop.inria.fr/oasis/SmartTools Journée.
Affichage interactif, bidimensionnel et incrémental de formules mathématiques Hanane Naciri et Laurence Rideau INRIA Sophia Antipolis CARI'2000.
Spécification et qualité du logiciel
Cours MIAGE Henry Boccon-Gibod 1 XML, Extensible Mark up Language Un esperanto des langages informatiques.
M.E.D.A.L. Module dEnseignement à Distance pour lArchitecture Logicielle Alain VAILLY Diapositive n° 1 IUP MIAGE - Université de NANTES IUP-MIAGE 3ème.
2002 Compétitif XMiner : Plate-forme de structuration texte libre multi-approches par balisage XML de Tags Actifs Lobjectif du projet est de développer.
Simplification et abstraction de dessins au trait
Les méthodes formelles en ingénierie des connaissances Damien Lhomme-Desages Jérémie Barlet.
Navigation Interactive dans les documents Brigitte Grau et Jean-Paul Sansonnet J.P. Fournier, N. Hernandez, M. Hurault-Plantet, J-C. Martin, G. Pitel,
Continuité des apprentissages Ecole-Collège mars 2008 J Borréani IA-IPR mathématiques.
Documents investigation
JOME, un Composant Logiciel pour le Télé-Enseignement des Mathématiques via le WEB, Compatible OpenMath et MathML Laurent DIRAT OVE / I3S-UNSA.
Projet 4info.
Vers une approche de construction de composants ontologiques pour le web sémantique – synthèse et discussion. Nesrine Ben Mustapha (RIADI, ENSI Tunis)
Méthodologie de la recherche universitaire
Un système de médiation basé sur les ontologies
Laboratoire Sciences Pour l’Environnement
Initiation à la conception des systèmes d'informations
Processus DE Capitalisation
Analyses des situations didactiques
Loïc Thibaut, 05/2002 STATBASE un outil générique pour la gestion de statistiques de pêche dorigines multiples THIBAUT Loïc, CHAVANCE Pierre, DAMIANO Alain.
Graphes Conceptuels J.F. Baget Inria.
Annotations sémantiques pour le domaine des biopuces
4 - Les automates et les lexiques morphologiques : le contenu mot fléchilemmepartie du discourstraits de flexion Habituellement, un lexique morphologique.
Résolution de Problèmes au Cycle 2 La géométrie comme exemple pour une recherche de la compréhension. Rôle historique que les humanités lui ont confié
Espaces vectoriels Montage préparé par : S André Ross
MOT Éditeur de modèles de connaissances par objets typés
Définir des caractéristiques chercher de linformation? sur un support électronique? Élaborer un cadre théorique pour comprendre les enjeux et proposer.
Conservatoire National des Arts et des Métiers de Paris Représentation et édition de documents XML.
WikiViz La visualisation dun réseau sémantique Travail de diplôme 2005 Urs Richle / 31 it.
Présentation du mémoire
Démonstrateur Lingway
Date / references Systèmes Terre et Interarmées Projet OUTILEX Rapport détude final Octobre 2006.
La résolution de la référence et son évaluation: un Atelier de Traitement de la Référence mettant en œuvre les « représentations mentales » Andrei Popescu-BelisISSCO,
Révisions - IA Généralité: problèmes de lIA Recherche Logique Traitement de lincertitude Apprentissage Langue naturelle.
Mise en oeuvre des MMCs L'utilisation des MMCs en reconnaissance des formes s'effectue en trois étapes : définition de la topologie de la chaîne de Markov,
Introduction Evolution technologique –Puissance des machines –Réseau rapides (ADSL : 30 euros/mois) –Manipulation digitale de l'audio et de la vidéo Applications.
Typologie des outils L ’exerciseur Le tutoriel :
Les feuilles de style CSS
Y a t-il une vie avant SI et CIT ?
La progressivité des apprentissages par niveaux
Soutenance de Thèse Mardi 13 Décembre 2005 Analyse des documents graphiques, une approche par reconstruction d’objets Mathieu Delalandre Mardi 13 Décembre.
28/05/20021 DOE : une mise en œuvre d’une méthode de structuration différentielle pour les ontologies Raphaël TroncyAntoine Isaac
Hatainville Les Moitiers d’Allonne – Tel : Website : stratic.online.com La démarche projet Mars 2001.
Approches Formelles en Systèmes d'information
1 Alain Casali Christian Ernst Extraction de Règles de Corrélation Décisionnelles 29 Janvier 2009.
Les épreuves du BTS Systèmes photoniques
Arkhênum Patrimoine du Futur. Répartitions par types d’erreurs mineures.
Le langage Racket (Lisp)
Initiation à la conception des systèmes d'informations
François CARCENAC,Frédéric BONIOL ONERA-DTIM Zoubir MAMMERI IRIT
Présentation AICHA REVEL INGENIEUR D’ÉTUDE STERIA DEPARTEMENT TRD
Management de la qualité
1 Initiation aux bases de données et à la programmation événementielle Responsable : Souheib BAARIR. (le sujet de votre .
TEXT MINING Fouille de textes
GPA-779 Application des systèmes experts et des réseaux de neurones.
Le Traitement Automatique des Langues (TAL)
L’enseignement de l’Analyse Fonctionnelle et Structurelle S 5 en S. T
Pierre Malenfant Technologie 9 École du Carrefour
Apéro Techno Romain Maragou - Aliou Sow Web sémantique.
Architectures articulant des représentations hétérogènes L’exemple de Gate (Mini tutoriel, journée Atala du 12 février 2005) Thierry Poibeau LIPN (CNRS.
Générateur d’applications WEB de gestion de données Module List.
Introduction à la Recherche
Modélisation des Actions Mécaniques Première sti2d
TECHNOLOGIE – Avril 2008 Projet de programme 4 e : Thème : Confort et domotique Equipement intérieur Equipement extérieur Electroménager Vidéo, photo Son.
19 avril Spécification d’un cadre d’ingénierie pour les réseaux d’organisations Laboratoire de recherche : OMSI à l’EMSE.
LE PROJET EN TERMINALE.
1 Initiation aux bases de données et à la programmation événementielle VBA sous ACCESS Cours N° 4 Support de cours rédigé par Bernard COFFIN Université.
Transcription de la présentation:

Algèbre de composants : une approche fonctionnelle à la sémantique de documents Bart Lamiroy LORIA/INPL QGar - École des Mines de Nancy

Notre approche Présentation de recherche prospective Aborder la notion de sémantique dun document (à des fins de manipulation de documents par leur contenu) Réinvestissment de lexistant et aller vers la généricité Rester pragmatique

Plan Situation du contexte de travail Exemple : Scan2XML Définition de la notion « Algèbre de composants » Pistes et outils pour la formalisation de la sémantique et sa manipulation

Analyse de documents : buts Rétroconversion Interprétation Recherche dinformation Aide à la navigation/consultation Appuyé sur des méthodes d'analyse du signal et des structures visuelles

Formes de document Avant : origine papier, format bitmap Maintenant : bitmap électronique, mais pauvrement structuré Documents électroniques complètement structurés lourdeur à la saisie extrêmement lié au contexte de création

Contenu de documents Propriété principale : produit par des humains pour des humains TexteGraphique Analyse linguistique Sémantique Reconnaissance de formes Matching Indexation ? ?

Conclusion Texte beaucoup de progrès (rétroconversion) hors domaine QGar frein linguistique Graphique ad hoc performant dans des cas particuliers sémantique « figée » au contexte Objectifs : Exploiter le contenu sémantique des parties graphiques et établir des liens entre le texte et le graphique

Scan2XML : cas détude Images de type « éclaté » Démarche identifier 3 types de zones : dessin - légende - index associer les zones se correspondant rendre le document navigable In fine : navigation intra- et inter-document

Exemple

Scan2XML : suite Extraction de sémantique à plusieurs niveaux : notion de zone (connecté, déconnecté) type de zone (dessin, texte, légende, index …) lien (association entre zones) sens (analyse de la légende, du graphique)

Scan2XML : analyse Preuve de faisabilité (démo) Composition de briques existantes Mise en pipeline Généralisation à la majorité des applications d'analyse de documents (toutes ?)

Algèbre de composants Préambule : syntaxe + métrique + contexte = sémantique C métr, ctxt (syntaxe) = sémantique Pipeline : C 1 (C 2 (...C n (syntaxe)))) = sémantique syntaxe = sémantique !

Algèbre de composants Domaine = données initiales + données produites Opérateurs = composants élémentaires (implémentations d'algorithmes) Sémantique = « preuve » par combinaison d'opérateurs Contexte ? Enfoui dans le composant et dans le pipeline.

Formalisation : définitions Composant : C : D D ' s | C (s) Contexte applicatif : ensemble K de tous les C disponibles Sémantique : D ' = D 1 ' D 2 ' D n ' Sémantique intrinsèque d'un document I est la fermeture de I sur K.

Sémantique intrinsèque Contraintes : ordre d'application des composants disponibilité des données Structure hiérarchisée en forme de semi- treillis (origine = document) noeuds = sémantique chemins = contexte (plusieurs chemins peuvent mener au même noeud)

Récapitulatif Sémantique bornée par les composants Géométrie variable (modularité, extensible,...) Structuration hierarchique avec expression des interdépendances (héritage ?) Pragmatique, puisque construit sur des composants opérationnels

Avantages Expression des interdépendances (automatisable) Extraction partielle du contexte Support de raisonnement inférence prédiction/vérification validation

Besoins Composants Langage d'expression des chaînes de composants (liant entre composants) Scripting ? Représentation des documents et des résultats produits SVG++ ?

Applications possibles : Inférence de connaissances pour l'aide à la navigation ou la recherche d'information Combinaison text/graphique Evaluation de fiabilité par combinaison de chaînes de composants Articulation/intégration web sémantique et outils formels de raisonnement

Défis Les paramètres : données ou contexte ? Evaluation de la validité du contexte Pertinence des données...

Questions ?