La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Graphes d'annotation – une introduction Claude Barras, LIMSI-CNRS figures et exemples de Steven Bird et al., Linguistic Data Consortium University of Pennsylvania.

Présentations similaires


Présentation au sujet: "Graphes d'annotation – une introduction Claude Barras, LIMSI-CNRS figures et exemples de Steven Bird et al., Linguistic Data Consortium University of Pennsylvania."— Transcription de la présentation:

1 Graphes d'annotation – une introduction Claude Barras, LIMSI-CNRS figures et exemples de Steven Bird et al., Linguistic Data Consortium University of Pennsylvania

2 12/02/2005C. Barras - Graphes d'annotation2 Un exemple d'interface de transcription

3 12/02/2005C. Barras - Graphes d'annotation3 C'est un trou de verdure où chante une rivière Accrochant follement aux herbes des haillons D'argent : où le soleil, de la montagne fière, Luit : c'est un petit val qui mousse de rayons. Un soldat jeune, bouche ouverte, tête nue, … Format des données associées

4 12/02/2005C. Barras - Graphes d'annotation4 Nombreux autres environnements… BAS Partitur CHILDES/CHAT childes.psy.cmu.edu DAMSL GATE gate.ac.uk LDC (TIMIT, Switchboard, SGML) TEI, CES

5 12/02/2005C. Barras - Graphes d'annotation5 Résultat, un bazar de formats et d'outils SGML base de données texte tabulé

6 12/02/2005C. Barras - Graphes d'annotation6 Cadre unificateur pour les annotations linguistiques Problèmes interopérabilité adaptation des données à de nouveaux domaines de recherche développement d'outils flexibles et génériques Diagnostic les différents formats de données masquent des similitudes structurelles dans toutes les annotations linguistiques A formal framework for linguistic annotation, S. Bird & M. Liberman, ICSLP'98/SpeechCom'01

7 12/02/2005C. Barras - Graphes d'annotation7 Annotation linguistique appliquée à des signaux Il faut préciser Le signal source annoté La région particulière du signal sur laquelle doit porter l'information Le contenu de l'annotation appliquée à cette portion du signal Signal Annotation Region

8 12/02/2005C. Barras - Graphes d'annotation8 Le modèle des graphes d'annotation (AG) Cas des signaux mono-dimensionnels région = intervalle entre deux nœuds annotation = arc étiqueté entre deux nœuds l'arc porte des champs d'information (couples attributs/valeurs) graphe d'annotation = une collection d'annotations speaker:Serge Regianni background: music transcription: C'est un trou de verdure… transcription: Accrochant follement…

9 12/02/2005C. Barras - Graphes d'annotation9 Définition des graphes d'annotation Les nœuds peuvent être ancrés dans le signal i.e. ils sont associés à un instant précis dans le signal pour d'autres cette information est inconnue ou inutile Définition formelle graphe acyclique orienté, étiqueté, et partiellement ou totalement ancré tout nœud est borné par le graphe entre des nœuds ancrés Cadre unificateur séparation du niveau physique et logique pas d'hypothèse a priori sur le sens des étiquettes W: C'W: estW: unW: trou

10 12/02/2005C. Barras - Graphes d'annotation10 Architecture à 3 couches texte tabulé Graphes d'annotation

11 12/02/2005C. Barras - Graphes d'annotation11 Caractéristiques des AG Pas de contrainte dans la structure des graphes chevauchements, discontinuités… Evenements instantanés ? pas de boucle sur un nœud (graphe acyclique) possibilité de créer 2 nœuds renvoyant au même instant Annotations non temporelles utilisation e.g. des conventions Dublin Core 123 oui je /S

12 12/02/2005C. Barras - Graphes d'annotation12 Le cas d'un dialogue Il existe des parties de parole superposée comment associer les transcriptions à un locuteur donnée? Hiérarchie implicite structure du graphe regroupe les arcs portés par les mêmes noeuds Hiérarchie explicite classes d'équivalence utilise un identifiant associé aux arcs spk: Client; A trans: Bonjour Monsieur; Atrans: Je voudrais des informations sur …; A 24 trans: Bonjour Madame; B spk: Agent; B

13 12/02/2005C. Barras - Graphes d'annotation13 AG Interchange Format Le dormeur du Val … Serge Reggiani C'est un trou de verdure où chante une rivière Accrochant follement aux herbes des haillons …

14 12/02/2005C. Barras - Graphes d'annotation14 code open source sur code en C++, interface avec Tcl/Tk et Python plateformes Unix et Windows support de différents formats de données (xlabel, TIMIT, Penn Treebank, Switchboard, BAS Partitur, CSV, LDC Callhome, AIF level 0) Implémentation par le LDC

15 12/02/2005C. Barras - Graphes d'annotation15 Perspectives et bilan Extensions généralisation à des sources non-linéaires (images, annotations): ATLAS proposé avec le NIST traitement efficace de requêtes dans un graphe d'annotation Bilan sur les graphes d'annotation un cadre formel, simple et clair des librairies logicielles, pas nécessairement un format de données spécifique permet de factoriser l'effort sur la structure de données la signification des annotations reste à la charge de l'application


Télécharger ppt "Graphes d'annotation – une introduction Claude Barras, LIMSI-CNRS figures et exemples de Steven Bird et al., Linguistic Data Consortium University of Pennsylvania."

Présentations similaires


Annonces Google