Graphes d'annotation – une introduction

Slides:



Advertisements
Présentations similaires
Les concepts de bases de la simulation
Advertisements

YAMBO La Guerre Franco-Allemagne ( )
La Guerre Franco-Allemagne [ ]
Analyse du poème Les Aveugles de Charles Baudelaire
Gérer son parc hétérogène depuis MOM et SMS avec QMX de Quest Software Laurent CAYATTE Consultant avant-vente Quest Software.
« Les Mercredis du développement » Introduction Office « 12 » Présenté par Bernard Fedotoff Microsoft Regional Director Agilcom.
Algèbre de composants : une approche fonctionnelle à la sémantique de documents Bart Lamiroy LORIA/INPL QGar - École des Mines de Nancy.
Modélisation d’informations temporelles
RECONNAISSANCE DE FORMES
CULTURES in BOXES n°1 France - Turkey An e-twinning project.
Reconnaissance de la parole
Séance 4 Poésie et description Un poème comme un tableau
Projet n°4 : Objecteering
Groupe France Télécom Projet Cilia : collaboration LIG Adèle – Orange Labs/MAPS/MEP slide 1 Cilia, un framework de médiation ouvert, léger, multi-personnalités.
JXDVDTEK – Une DVDthèque en Java et XML
Introduction à Java - les paquetages -
XHTML EXtensible HyperText Markup Language. HTML et XML HTML (HyperText Markup Language) et XML (eXtensible Markup Language) sont deux spécifications.
Architecture de réseaux
Reconstitution de texte…
Génération interactive dimages projectives : Application à la Radiothérapie Pierre BLUNIER Du 01/12/2002 au 28/03/2003 Centre Léon Bérard.
LICENCE MIAGE Introduction Programmation Orientée Objet JAVA philippe
Design Pattern MVC En PHP5.
La Guerre Franco-Allemagne
Démarche Analyse des OGL et des Méthodes Objectifs : Activités :
Communiquer avec ELYX.
le profil UML en temps réel MARTE
La Guerre Franco Allemagne et Le Dormeur du Val - Arthur Rimbaud et La Dernière Classe - Alphonse Daudet Annick R.
Initiation à la conception de systèmes d'information
Lycée Louis Vincent Séance 1
Rennes, le 18 septembre 2006 Support du paradigme maître-travailleur dans les applications à base de composants Tâche 2.2 Hinde Bouziane Réunion LEGO.
Université Mouloud Mammeri de Tizi-Ouzou
Articuler les traitements sur corpus Projet ATO-MCD (Atala )
RDF(S)
VOC 1 CE2 Je sais utiliser des mots de la vie quotidienne.
ISICIL SWEETDEKI Intégration du logiciel Mindtouch Core dans la plate-forme ISICIL Guillaume HUSSON.
Le dormeur du val (Rimbaud,in Poésies 1870)
Amélie Dubois La Guerre Franco-Allemagne
La Guerre Franco-Allemagne Le Dormer du Val par Arthur
Vers des composants TAL réutilisables
Word Gabarit les étapes à suivre? C) Synthèse /rapport personnel (disponible sur votre site dans la site section travaux) et la version graphe finale.
Web sémantique : Web de demain
Adaptée du cours de Richard Grin
Chapitre 3 Les bibliothèques de balises JSP et la JSTL
UN THESAURUS Pourquoi ? Pour qui ? Comment ?
I MAGIS est un projet commun CNRS - INPG - INRIA - UJF iMAGIS-GRAVIR / IMAG Optimisation à base de flot de graphe pour l'acquisition d'informations 3D.
JEE 5 F.Pfister 2 institut eerie JEE – Une plateforme serveur  Développement et exécution d'applications réparties.
ISICIL Mai 2010 Nicolas Delaforge Architecture serveur(s) et prototypes de social bookmarking/tagging dans ISICIL Avancement technique.
‘‘Open Data base Connectivity‘‘
Arthur Rimbaud Le dormeur du val Par Nanou et Stan.
Graphes 1. Introduction 2. Définition 3. Représentation mémoire
Les Réseaux Le modèle à 7 couches
Présentation du démonstrateur ATLAS Projet ANR 07 TLOG
SoundEngine Un serveur d ’effets sonore en temps réel Juillerat Nicolas.
Architecture Logicielle Les blocs d’applications
Ethereal Analyseur de trafic réseau Romain AUFFRET Maxime HERVÉ Soutenance orale de Réseaux.
Les réseaux - Internet Historique Réseau local Internet Les protocoles
Réalisé par : Mr IRZIM Hédi Mr JRAD Firas
La Guerre Franco-Allemagne By: MaRiAmA.
Web sémantique est pratique documentaire
François CARCENAC,Frédéric BONIOL ONERA-DTIM Zoubir MAMMERI IRIT
Simulation du rôle de la communication dans l’établissement d’un réseau de liens sociaux Projet GPL :
Iup MIAGe 3° année Projet MIAGe Toulouse – Groupe 21 Charte graphique.
Vers une intégration plus poussée de la recherche Web avec les Systèmes d’Information Géographiques Adapté de «Toward Tighter Integration of Web Search.
Les partages poétiques de Myrisimo
Stage à Ontomantics Master Pro TILDE
XML : un métalangage pour la description de documents structurés XML a été défini par le consortium W3 en fonction de 2 objectifs: Compenser les limitations.
d’études pédagogiques
L'annotation structurelle François Daoust Centre ATO,Université du Québec à Montréal Yves Marcoux EBSI, Université de Montréal Jean-Marie Viprey LASELDI,
Le Sonnet.
Le dormeur du val Le dormeur du val
Transcription de la présentation:

Graphes d'annotation – une introduction Claude Barras, LIMSI-CNRS figures et exemples de Steven Bird et al., Linguistic Data Consortium University of Pennsylvania http://www.ldc.upenn.edu/AG

Un exemple d'interface de transcription 12/02/2005 C. Barras - Graphes d'annotation

Format des données associées <?xml version="1.0" encoding="ISO-8859-1"?> <!DOCTYPE Trans SYSTEM "trans-13.dtd"> <Trans scribe="cb" audio_filename="dormeur" version_date="050208"> <Topics><Topic id="to1" desc="Le Dormeur du val"/></Topics> <Speakers><Speaker id="spk1" name="Serge Reggiani"/></Speakers> <Episode> <Section type="report" topic="to1" startTime="0" endTime="74.0"> <Turn speaker="" startTime="0" endTime="7.41"> <Background type="music" level="high" time="0"/> </Turn> <Turn speaker="spk1" startTime="7.41" endTime="74.0"> <Sync time="7.41"/> C'est un trou de verdure où chante une rivière <Sync time="10.891"/> Accrochant follement aux herbes des haillons <Sync time="14.714"/> D'argent : où le soleil, de la montagne fière, <Sync time="19.138"/> Luit : c'est un petit val qui mousse de rayons. <Sync time="24.38"/> Un soldat jeune, bouche ouverte, tête nue, <Sync time="29.671"/> … 12/02/2005 C. Barras - Graphes d'annotation

Nombreux autres environnements… BAS Partitur www.phonetik.uni-muenchen.de/Bas/ CHILDES/CHAT childes.psy.cmu.edu DAMSL www.cs.rochester.edu/research/cisd/resources/damsl/ GATE gate.ac.uk LDC (TIMIT, Switchboard, SGML) www.ldc.upenn.edu TEI, CES www.tei-c.org www.cs.vassar.edu/CES/ 12/02/2005 C. Barras - Graphes d'annotation

Résultat, un bazar de formats et d'outils SGML base de données texte tabulé 12/02/2005 C. Barras - Graphes d'annotation

Cadre unificateur pour les annotations linguistiques Problèmes interopérabilité adaptation des données à de nouveaux domaines de recherche développement d'outils flexibles et génériques Diagnostic les différents formats de données masquent des similitudes structurelles dans toutes les annotations linguistiques A formal framework for linguistic annotation, S. Bird & M. Liberman, ICSLP'98/SpeechCom'01 12/02/2005 C. Barras - Graphes d'annotation

Annotation linguistique appliquée à des signaux Il faut préciser Le signal source annoté La région particulière du signal sur laquelle doit porter l'information Le contenu de l'annotation appliquée à cette portion du signal Signal Region Annotation 12/02/2005 C. Barras - Graphes d'annotation

Le modèle des graphes d'annotation (AG) Cas des signaux mono-dimensionnels région = intervalle entre deux nœuds annotation = arc étiqueté entre deux nœuds l'arc porte des champs d'information (couples attributs/valeurs) graphe d'annotation = une collection d'annotations 0.00 1 7.41 2 10.9 3 14.7 15 74.0 speaker:Serge Regianni background: music transcription: C'est un trou de verdure… Accrochant follement… 12/02/2005 C. Barras - Graphes d'annotation

Définition des graphes d'annotation Les nœuds peuvent être ancrés dans le signal i.e. ils sont associés à un instant précis dans le signal pour d'autres cette information est inconnue ou inutile Définition formelle graphe acyclique orienté, étiqueté, et partiellement ou totalement ancré tout nœud est borné par le graphe entre des nœuds ancrés Cadre unificateur séparation du niveau physique et logique pas d'hypothèse a priori sur le sens des étiquettes 1 7.41 2 10.9 1-1 1-2 1-3 W: C' W: est W: un W: trou 12/02/2005 C. Barras - Graphes d'annotation

Architecture à 3 couches Graphes d'annotation texte tabulé 12/02/2005 C. Barras - Graphes d'annotation

Caractéristiques des AG Pas de contrainte dans la structure des graphes chevauchements, discontinuités… Evenements instantanés ? pas de boucle sur un nœud (graphe acyclique) possibilité de créer 2 nœuds renvoyant au même instant Annotations non temporelles utilisation e.g. des conventions Dublin Core /S 1 2 3 je oui 12/02/2005 C. Barras - Graphes d'annotation

C. Barras - Graphes d'annotation Le cas d'un dialogue Il existe des parties de parole superposée comment associer les transcriptions à un locuteur donnée? Hiérarchie implicite structure du graphe regroupe les arcs portés par les mêmes noeuds Hiérarchie explicite classes d'équivalence utilise un identifiant associé aux arcs spk: Client; A trans: Bonjour Monsieur; A trans: Je voudrais des informations sur …; A 1 2 3 4 5 trans: Bonjour Madame; B spk: Agent; B 12/02/2005 C. Barras - Graphes d'annotation

C. Barras - Graphes d'annotation AG Interchange Format <AGSet id="dormeur" version="1.0"> <Metadata> <dc:title>Le dormeur du Val</dc:title> </Metadata> <Timeline id="T1"> <Signal id="S1" mimeClass="audio" mimeType="wav" xlink:href="dormeur.wav"/> </Timeline> <AG id="t1" type="transcription" timeline="T1"> <Anchor id="A0" offset="0.00"/> <Anchor id="A1" offset="7.41"/> <Anchor id="A2" offset="10.89"/> <Anchor id="A3" offset="14.71"/> … <Annotation id="Ann1" type="speaker" start="A1" end="A15"> <Feature name="label">Serge Reggiani</Feature> </Annotation> <Annotation id="Ann2" type="transcription" start="A1" end="A2"> <Feature name="label">C'est un trou de verdure où chante une rivière</Feature> <Annotation id="Ann3" type=" transcription" start="A2" end="A3"> <Feature name="label">Accrochant follement aux herbes des haillons</Feature> 12/02/2005 C. Barras - Graphes d'annotation

Implémentation par le LDC code open source sur http://agtk.sourceforge.net/ code en C++, interface avec Tcl/Tk et Python plateformes Unix et Windows support de différents formats de données (xlabel, TIMIT, Penn Treebank, Switchboard, BAS Partitur, CSV, LDC Callhome, AIF level 0) 12/02/2005 C. Barras - Graphes d'annotation

C. Barras - Graphes d'annotation Perspectives et bilan Extensions généralisation à des sources non-linéaires (images, annotations): ATLAS proposé avec le NIST traitement efficace de requêtes dans un graphe d'annotation Bilan sur les graphes d'annotation un cadre formel, simple et clair des librairies logicielles, pas nécessairement un format de données spécifique permet de factoriser l'effort sur la structure de données la signification des annotations reste à la charge de l'application 12/02/2005 C. Barras - Graphes d'annotation