Système de transcription semi-automatique Vers une intégration de la RAP dans le logiciel Transcriber Projet de Master1 31 mai 2007 IUP GMI -Avignon Nicolas.

Slides:



Advertisements
Présentations similaires
Mustapha EL FEDDI Tests Mustapha EL FEDDI
Advertisements

Intégration de logiciels Open-Source dans un ordinateur simplifié basé sur Linux Stage du 6 avril au 30 juin 2006.
BIENVENUE ASTOU TALL Chargé de documentation de l’équipe Informpro. Présentation d’un projet.
Les Systèmes d’Information Financière Atelier conjoint ACBF / Banque Mondiale / AFRITAC de l’Ouest Gérer l’application dans le temps, sur les plans fonctionnel,
E-learning Evolutif Albarelli Corinne Behem Patrice Guillot Jérôme
Résolution de problèmes et logiciel de calcul symbolique
Etudiants : Benjamin BLANC Cyrille KLUZEK Encadreur :
UV Libre Calculatrice Scientifique
Prototype de plate-forme de Tribus Instantanées :
Les tests et les logiciels de gestion de tests
Les outils de gestion du cycle de vie logiciel Par Julien Furgerot Enseignant : D. Revuz Exposés de système 2006.
Compresser et/ou redimensionner automatiquement vos photographies avec Xnview.
06 Juillet 2009 Projet Checker daccessibilité de fichiers SVG Rami BALI Toufic HADDAD Aroussia MAADI Encadrants Annie DANZART Christine POTIER Jérôme HUGUES.
Projet Webase. I. La définition du projet 1. Lexistant : Webase 4 2. Cahier des charges 3. La répartition des données 4. Le modèle de données 5. Le choix.
Etudiant : Julien SIGNOLES Sous la direction de : Jean-Claude MARTIN
Les démarches de développement
Les démarches de développement
simulateur de réseau de machines UML connectées par WiFi mode ad-hoc
Tests et Validation du logiciel
Maîtrise des données et des métadonnées de l’ODS
Introduction aux CMS.
04/06/2008Dématérialisation ds marchés Christian VANGELUWE Marchés publics en France Dématérialisation des Marchés Aperçu.
Pourquoi MIPS Assembler ?
SIMULATION WATERFALL & INSPECTION
N. Le Gall A. Jaouën E. Morin C. Coelo Cuzon D. Le Toux
Interaction audio sur le site web du LIA
© Nuance Communications, Inc. Tous droits réservés. Page 1 OmniPage Ultimate mai 2013.
Techniques de test Boulanger Jean-Louis.
Analyse de processus Projet de reconnaissance de caractères
système de gestion de version
Présentation du mémoire
© Petko ValtchevUniversité de Montréal Janvier IFT 2251 Génie Logiciel Notions de Base Hiver 2002 Petko Valtchev.
Ca veut dire quoi APPRENDRE ?
Projet du cours MMI Lecteur multimeodial
Salon Interactif Université dAvignon Projet M2 MUNOZ Nicolas Année 2007/2008.
Projet de Master première année 2007 / 2008
Sandrine BUENDIA Guillaume GALLET.
Retour dexpérience Supportech INSA.NET Daniel Boteanu – Michaël Piffret.
Marc Bouissou, Guillaume Torrente, EDF
Supports de formation au SQ Unifié
Le contenu est basé aux transparents du 7 ème édition de «Software Engineering» de Ian Sommerville«Software Engineering» de Ian Sommerville B.Shishedjiev.
Université de Cergy-Pontoise, 7 juin 2006 Aibo Compagnon.
SLAM 1 Exploitation d’un schéma de données
Initiation à Access: Interfaces
Présentation AICHA REVEL INGENIEUR D’ÉTUDE STERIA DEPARTEMENT TRD
MOCK.
Power AMC-Rational Rational Rose, Étude comparative
4/13/2017 3:41 PM Intégration Visio SharePoint 2010 Application à la création de Workflows Genève -15 Avril 2010 Michel LAPLANE MVP Visio - WGroupe.
Toolkit WEB de contrôle en SVG Equipe Koala d’ILOG Encadré par Colas Nahaboo Isabelle LAFAYE.
L’enseignement de spécialité SLAM
1 Interface Web-Service pour une application génie logiciel Equipe : LIP6 Team Move Date : 02/09/2008 Auteur : S. HONG Encadrants : F. KORDON / J.B. VORON.
OPTIMISATION DE LA PLANIFICATION
Les démarches de développement
L T I Laboratoire de Téléinformatique 2 Projet de semestre Parseur XML basé sur la DTD : Buts –Utiliser la grammaire définissant un type de fichiers XML.
Sensibilisation aux projets logiciels
1 Logiciels de confection automatique d’horaires.
Pour le 16/03/15. Que faisons nous en classe de 3ème ? Au cours de toute l'année scolaire, nous aurons à réaliser un « projet » qui est la construction.
POIRIER Kévin (Chef de projet) HUCHEDÉ Cédric BEUTIER Kévin LEBRUN Jérémy BESNIER Richard Simulation de décisions de Jury 1.
31/05/2007Projet Master 11 Présentation ludique de la recherche opérationnelle à la fête de la science Année universitaire 2006/2007 Sylvain FIX Julien.
Initiative pour une méthode publique   +33 (0) 
FORMATION SUR LA NORME ISO VERSION 2015
PRÉSENTATION AGL LES TESTS LOGICIELS LES TEST LOGICIELS 1 Mickael BETTINELLI Brandon OZIOL Gaétan PHILIPPE Simon LUAIRE.
Analyse de la prise en charge des douleurs induites par les actes infirmiers chez les patients opérés de la hanche Lebrun florence Lebrun florence.
GdR MoMaS Novembre 2003 Conditions d’interface optimales algébriques pour la vibro-élasticité. François-Xavier Roux (ONERA) Laurent Sériès (ONERA) Yacine.
PREMIÈRE APPROCHE DE « PRESENT.ME ». Plan  C’est quoi ?  Quand l’utiliser ?  Les avantages  Les conditions d’utilisation  En quelques clics…  Conclusion.
1 Monopalme Projet 4 Info Présentation finale LE LAY Olivier MAHE Jocelyn FORM Nicolas HENRY Gurvan BONNIN Thomas BASSAND Guillaume Décembre 2009 MONNIER.
1 Master Data Management au SANDRE. GPA 17/10/ Une philosophie de diffusion des référentiels 3 grands blocs dans les systèmes d’information environnementaux:
Les IDE orientés conception C ycle de V ie D es A pplications
Intégration continue avec Jenkins OTHMAN Maroua - DUCROT Lauriane - ESCURE Philippe - JOLY Aurélien & DESPREZ Jérome 1.
1 Master Data Management au SANDRE. ADD 27/11/ Une philosophie de diffusion des référentiels 3 grands blocs dans les systèmes d’information environnementaux:
Transcription de la présentation:

Système de transcription semi-automatique Vers une intégration de la RAP dans le logiciel Transcriber Projet de Master1 31 mai 2007 IUP GMI -Avignon Nicolas BIGOUROUX, Master 1 TAIM – sous la direction de Pascal NOCERA (LIA)

Présentation Transcriber est un outil open-source de transcription et dannotation pour les corpus audio. Il est conçu dans le langage de script Tcl/Tk. Speeral, système de reconnaissance automatique de la parole basé sur lalgorithme A* et développé au LIA. Transcriber représente une base logicielle intéressante pour intégrer les résultats de Speeral, dans loptique dune transcription automatique… ou presque. Deux types dintégration sont en fait envisageables

1 - Fonctionnalités à implémenter 1.1. Du point de vue de lutilisateur On voudrait importer les résultats de Speeral Facile pour une transcription unique Mais ce sont les hypothèses multiples qui nous intéressent le plus Si Speeral a vu juste, le travail est fini Dans le cas contraire le transcripteur pourrait choisir une autre hypothèse Quelle interface pour ce protocole ? Deux approches possibles A. Le transcripteur est passif, il va corriger les erreurs de Speeral (en espérant quil ny en aura pas !) = Conception statique du workflow B. Speeral est passif, ne proposera des hypothèses quà la demande (le transcripteur hésite, ou devine que la RAP sera assez efficace) = Conception plutôt dynamique Approches non exclusives En fait on aimerait avoir les deux !

Fonctionnalités à implémenter 1.2. Du point de vue du développeur Quelles sont les données ? Transcriber utilise un format XML - En externe (formats de fichier) - En interne (= le modèle de données) Les conversions sont possibles à partir de nombreux formats Et redéfinir un convertisseur facile Du côté de Speeral ? On travaille sur les sorties Convertir vers Transcriber facile… …sauf pour les hypothèses multiples > Réinventer une DTD spécifique ? > …ou ne modifier que linterface ? (le but conserver les hypothèses)

2 - Organisation du projet 2.1. Répartition du travail pendant lannée - Etude du format des données proposées par Speeral - Réflexion sur le type dinterface à mettre en place Semestre 1 = en binôme - Recherche dun angle dattaque adéquat - Résolution des problèmes sinon > documentation Durant tout le projet, tests sur la base du corpus ESTER Semestre 2 = en solo

Organisation du projet 2.2. Divers types de difficultés Langage de script : facile à apprendre Mais pas à déchiffrer… Documentation satisfaisante Mais pas toujours utile pour modif. profonde du logiciel Processus de développement assez laborieux et ingrat… -> planification hasardeuse Données de Speeral : plus difficile à apprendre Mais très simple à déchiffrer Modélisation directe : une hypothèse = une ligne Mais dans Transcriber ? -> on ne fait que choisir une hypothèse en fait

3 - Résultats obtenus - Je me suis familiarisé avec Tcl/Tk - et les variables globales de Transcriber Compréhension du code source de Transcriber - Linterface de validation est presque terminée - Impasse pour synchroniser les données internes… Implémentation des fonctionnalités

Conclusions Projet très intéressant mais développement ardu Peu adapté à larticulation habituelle des projets de Master… = il faudrait beaucoup coder dabord et ensuite étudier la faisabilité ! Donc ma documentation sera la meilleure contribution au projet Et je continuerai à améliorer Transcriber… et Transreader

Système de transcription pas encore automatique Vers une synchronisation des données internes de Transcriber Merci de votre attention !