Coord.: Etienne, Landragin, Parisse, Poudat, Taudirascu, Tutin CORLI-GT1 - Interopérabilité / Exploration de corpus / Annotation de haut niveau Coord.: Etienne, Landragin, Parisse, Poudat, Taudirascu, Tutin Présenté à la réunion MULTICOM-CORLI, 15 juin 2016, Paris Céline Poudat
GT1 CORLI: directions et orientations
1. Formations à venir
Formation Outils Formation outils Outils ELAN, CLAN Iramuteq, Trameur, Lexico 5 Corpus arborés comme Tigersearch Lieu: Paris, à déterminer (SFL?) Dates: novembre - semaine de la mi-novembre (semaine du 14 novembre): deux jours
CORLI-TEI + CORLI-JLC CORLI-TEI comment interpréter, représenter et appliquer les balises TEI? + Présentation des propositions de CORLI pour annoter les éléments non documentés par la TEI-P5 (chaînes de coréférence, TEI-CMC, TEI corpus oraux…). Lieu: Paris Date: mi-janvier Formation CORLI sur deux jours aux prochaines JLC Grenoble juillet 2017 Prévoir en outre une session CORLI aux JLC pour discuter standards et bonnes pratiques.
2. Projet d’extension de la table des usages du GT10 – site web
Table des usages Réalisation Contenu et organisation de la table USAGES (orientation utilisateurs) OUTILS (orientation développeurs-concepteurs) Objectif de recherche L'objectif poursuivi par la recherche : ce qui motive l'utilisation de cette fonctionnalité sur ce corpus Pratique Concordance, mettre au jour la structure d’un corpus, dégager les spécificités d’une partition, annotation… Outil (nom, visée, scénarios) Corpus (type, annotation, format, volume) Visée Fonctionnalités Accessibilité SE Format des corpus Plateforme, modules Langage de programmation Encodage Ergonomie, interface Etc.
Site web http://explorationdecorpus.corpusecrits.huma-num.fr/
Actions GT1 Intégrer les outils et les pratiques de traitement de corpus oraux Objectif: livraison envisagée d’ici la fin de l’année Réunion Adobe connect à prévoir rapidement Participants: Linda, Stéphane, Carole, Frédéric, Christophe, Agnès, Amalia, Sarra, Mai Sarra nous démarrerait un drupal.
3. Vers des formats communs – TEI, métadonnées Adopter la méthodologie d’IRCOM: partir d'exemples pour discuter des métadonnées, en privilégiant les personnes qui aident les autres à construire et traiter les corpus dans les laboratoires Prévoir une réunion à la rentrée prochaine Nicolas suggère que si l’on pouvait intégrer une annotation POS + éventuellement un parsing minimal, ce serait un livrable utile pour la communauté. Carole suggère un proto avant la réunion de septembre, avec un formulaire qui permettrait aux collègues d’entrer simplement leurs métadonnées. Christophe pourrait encadrer un stagiaire dans cet objectif, et Sarra se propose de donner un coup de main.