Toulouse, les 4 et 5 juillet 2003 Intégration doutils danalyse de la prosodie dans PFC Cyril Auran Laboratoire Parole et Langage, UMR 6057 CNRS 5èmes Journées.

Slides:



Advertisements
Présentations similaires
Expérience du GELT dans la prise en charge des lymphomes T
Advertisements

Tests et Validation du logiciel
Distance inter-locuteur
Codage de la parole à très bas débit avec des unités ALISP avec les partenaires du projet SYMPATEX : ENST ELAN Informatique Thomson => Thales.
MESURES ET INSTRUMENTATION
Septembre 2001Y. Schutz - ALICE / WP6 France1 Activités GRILLE dALICE.
LA COMPREHENSION EN LECTURE L'extension du lexique La compréhension des phrases La compréhension des textes Conclusion Introduction Le travail sur la compréhension.
Bases de données Objet singleton pour la connexion
Architecture et changement organisationnel : Le cas du déménagement d’un service de consultations externes au sein d’un nouvel hôpital Thierry Nobre Caroline.
Cours n°1 Présenté par : Aurélien Baillard Aboubacar Camara Sébastien Simon Jeremy Landre Brown Ebiémi.
Projet Combien? Ma première machine : la machine Construction Ensemble G. Tisseau, J. Duma, H. Giroire, F. Le Calvez, M. Urtasun.
Marchés de la Biométrie
Méthodes alternatives
Quelles ressources TICE, en physique chimie, dans le cadre de l'accompagnement des élèves ? Compte-rendu datelier Réunion IATICE – Strasbourg 2010.
Problèmes de distribution, problèmes de partage.
Zaida Conesa del Valle SUBATECH, Nantes Mai 2005, IPN Orsay
Les résonances de quarks lourds comme sonde du Plasma de Quarks et de Gluons Optimisation du spectromètre à muons de lexpérience ALICE et étude de la production.
DGA REI RECHERCHE EXPLORATOIRE ET INNOVATION Réseau d’ Observation Océanique Automatisé par Gliders 2007 – 2009/2010.
LEDOUX B, JARNO P, RIOU F, PINEL JF, LE BEUX P
Réinformatisation, Sudoc et aspects libres
Mutualisation d'informations sur les revues et leurs accès dans les bases en ligne Journées ABES 2010
Microsim : Pourquoi l’utiliser?
Le plan des cours d’analyse ‘Etude des phénomènes variables’
1 Projets Contexte - Motivations Nouveau site web Remise en forme de la plaquette pédagogique Support de cours informatique Support de cours électronique.
CONDITIONS D’AUTORISATIONS DES DÉPÔTS DE SANG
1 2. A léchelle de létablissement. 2 Des espaces de travail sécurisés: les ENT.
RES-AGRI TIC-PME 2010 – Réunion Région du 8 février 2007 Rappel des grandes lignes du projet (1) Objectifs Améliorer les échanges électroniques entre les.
Traitement des sons de parole (4)
Masseur-Kinésithérapeute salarié ou libéral
Modèles de choix discrets (III) Mirta B. Gordon Laboratoire Leibniz-IMAG Grenoble Dynamique des systèmes complexes et applications aux SHS : modèles, concepts.
Département fédéral de lintérieur DFI Office fédéral de la santé publique OFSP Unité de direction Politique de la santé Le rôle de la concurrence orientée.
Recherche d'un dossier patient
La lecture, une porte ouverte sur un monde enchanté. (François Mauriac) Séance dinformation sur lapprentissage de la lecture à lécole St-André, Tournai.
Point sur la migration STAR - Elyx.
LE SECTEUR MINIER EN MAURITANIE ÉVOLUTION RÉCENTE ET PERSPECTIVES
Petite introduction au logiciel de traitement statistique SPSS
L’approche par les revenus – Les comptes de secteurs
M. Prieur- E. Sanchez- J. Barrère
Synthèse des travaux. Clarifier les concepts et la terminologie Faire du contrôle interne, un enjeu majeur Bien identifier les acteurs Professionnaliser.
Les traitements à plat Cette partie du cours abordera les traitements élémentaires d’une enquête. Les analyses uni-variées, ou tris à plat, sont en fait.
Stratégie sur les océans du Canada Participation à léchelle nationale de juin à septembre 2002 LA STRATÉGIE SUR LES OCÉANS DU CANADA Nos océans, notre.
Expériences de coopération et pratiques intéressantes sur la femme.
Protocole pour la phase terrain de lenquête sur la mobilité Modalité 1: Enquête quantitative puis qualitative Linformation sur la population mère Données.
Réunion des Chefs de Travaux Bilan de Rentrée sur les Enseignements dExploration Lycée Baggio 1 er Octobre 2010.
Aurélie Sgro Chargée de Projet ICMPD Bruxelles
Handicap et politiques de coopération internationale Etat des lieux du handicap dans la coopération internationale.
Recherche sur internet pour une pratique fondée sur des données probantes.
Reconnaissance de la parole
ETUDE SUR L’ADEQUATION FORMATION-EMPLOI
Gestion et Suivi axés sur les résultats
Contrôle daccès et qualité de service dans les réseaux basés sur ATM Olivier Paul.
J. Fabre 14/10/2008 Rénovation du calcul du taux de chômage : du taux BIT au taux localisé
1 LA PLATE FORME DAPPUI AUX PROFESSIONNELS DE SANTE Une nouvelle approche du site PAPS Michel CHIARA/Elodie AGOPIAN - CCOP - 31/01/2013.
Mise en commun des savoirs antérieurs sur les autochtones Activité de lecture Manuel p LA CONCEPTION DU MONDE.
Geneviève FRANCHET - SPV
Injection de dépendances
Ecole thématique Dynamique de la production écrite : approche pluridisciplinaire Poitiers, 09 juillet 2013 Ecole thématique Dynamique de la production.
Phonétisation, alignement et association
TM.
Un concept pour la modélisation de la recherche qualitative, pp
Département fédéral de lintérieur DFI Office fédéral de la statistique OFS La qualité de lemploi en Suisse Silvia Perrenoud Journées suisses de la statistique.
SCIENCES DE L ’INGENIEUR
Les outils de simulation multiphysique et d’acquisition de données au service de l’enseignement des sciences de l’ingénieur Baccalauréat Scientifique Éric.
Modélisation et analyse de la variabilité dans une chaîne logistique par Laurence Morlet Promoteur : Philippe Chevalier Lecteurs : Laurence.
P1 La participation des étudiants : une méthode particulière Grégory Piet & David Stans (assistant-doctorant) Département de Science politique Unité dEtudes.
Séminaire Doc Mining Paris 13/11/2002 PSI Librairie Adam Sébastien Delalandre Mathieu Héroux Pierre.
Traitement de la parole : Synthèse et reconnaissance
Dans cet article, une nouvelle approche relative à l’indexation de la bande sonore de documents audiovisuels est proposée, son but est de détecter les.
Présentation RFIA janvier 2002
À la recherche d’indices discriminant des accents ouest- africains en français Philippe Boula de Mareüil LIMSI-CNRS, Orsay.
Transcription de la présentation:

Toulouse, les 4 et 5 juillet 2003 Intégration doutils danalyse de la prosodie dans PFC Cyril Auran Laboratoire Parole et Langage, UMR 6057 CNRS 5èmes Journées PFC Disponible sur le site:

Toulouse, les 4 et 5 juillet 2003 Avant-propos Intégration doutils dans PFC : Prise en compte dun cadre méthodologique particulier (type/format des données, outils et protocoles existants) 5èmes Journées PFC Quels outils pour PFC ? Niveau danalyse (orthographe, segments, prosodie, autres ?) Nature des outils (assistance à lanalyse, analyse à proprement parler) Prise en compte des finalités du projet (description de la variabilité) Pourquoi intégrer des outils ??

Toulouse, les 4 et 5 juillet 2003 Plan Remarques préliminaires XVIIIèmistes : De la motivation de lintégration doutils I)Outils non-prosodiques Niveau orthographique Niveau segmental II) Outils pour la prosodie Ordre tonal Ordre temporel Conclusions et perspectives 5èmes Journées PFC

Toulouse, les 4 et 5 juillet 2003 Remarques préliminaires (1) « […] C'est ainsi que, chaque partie étant pleine de vice Le tout était cependant un paradis. […] Voilà quels étaient les bonheurs de cet État ; Leurs crimes conspiraient à leur grandeur, Et la vertu, à qui la politique Avait enseigné mille ruses habiles, Nouait, grâce à leur heureuse influence, Amitié avec le vice. Et toujours depuis lors Les plus grandes canailles de toute la multitude Ont contribué au bien commun. » Bernard Mandeville (1714). La Fable des abeilles, ou les vices privés font le bien public 5èmes Journées PFC

Toulouse, les 4 et 5 juillet 2003 Remarques préliminaires (2) « […] en échafaudant n'importe quel système de gouvernement Il faut reconnaître en tout homme un fripon qui n'a d'autre fin, dans tous ses actes, que son intérêt privé. » David Hume (1741). « Of the Independence of Parliament » in Essays, Moral and Political, Volume I 5èmes Journées PFC « Ainsi, sans aucune intervention de la loi, les intérêts privés et les passions des hommes les amènent à diviser et à répartir le capital d'une société […] dans la proportion qui approche le plus possible de celle que demande l'intérêt général de la société. » Adam Smith (1776). The Wealth of Nations

Toulouse, les 4 et 5 juillet 2003 Remarques préliminaires (3) Motivations de lintégration : Gain de productivité Systématisation des traitements (et des erreurs) 5èmes Journées PFC

Toulouse, les 4 et 5 juillet 2003 Outils non-prosodiques 5èmes Journées PFC

Toulouse, les 4 et 5 juillet 2003 Outils non-prosodiques (1) Pour linstant, deux niveaux danalyse : Niveau orthographique (Aisance dutilisation, base pour dautres traitements) Niveau segmental 5èmes Journées PFC

Toulouse, les 4 et 5 juillet 2003 Outils non-prosodiques (2) Niveau orthographique : Un idéal : alignement au niveau des mots Mais Espoirs variables en fonction des données PFC 5èmes Journées PFC Listes de lecture de mots : alignement « Nbre-Mot »

Toulouse, les 4 et 5 juillet 2003 Outils non-prosodiques (2) Niveau orthographique : Un idéal : alignement au niveau des mots Mais Espoirs variables en fonction des données PFC 5èmes Journées PFC Lecture de texte : alignement « Syntagme » ou « Phrase »

Toulouse, les 4 et 5 juillet 2003 Outils non-prosodiques (2) Niveau orthographique : Un idéal : alignement au niveau des mots Mais Espoirs variables en fonction des données PFC 5èmes Journées PFC Conversations : ?? (minimalement : tours de parole)

Toulouse, les 4 et 5 juillet 2003 Outils non-prosodiques (3) Niveau orthographique : Outils pour lannotation orthographique (semi-) automatique des listes de mots get_pauses.praat : segmentation automatique à seuil paramétrable, possibilité de vérification manuelle en cours de traitement, option de détection de « souffle ». add_labels.praat : transfert automatique des étiquettes avec conservation des remarques manuelles 5èmes Journées PFC

Toulouse, les 4 et 5 juillet 2003 Outils non-prosodiques (3) Illustration : Get_pauses 5èmes Journées PFC

Toulouse, les 4 et 5 juillet 2003 Outils non-prosodiques (4) Niveau orthographique : Outils pour lannotation orthographique (semi-) automatique des lectures de texte et des conversations Méthode semi-automatique envisageable (segmentation - paramètres prosodiques locaux - puis transfert détiquettes) Méthode automatique (reconnaissance vocale et alignement automatique) plus difficile à envisager de manière réaliste Pbm de la variabilité 5èmes Journées PFC

Toulouse, les 4 et 5 juillet 2003 Outils non-prosodiques (5) Niveau segmental : Préoccupation « originelle » du projet 2 aspects envisageables : Segmentation (identification de la nature et délimitation des frontières des phonèmes) Marquage (pointage dun type de phonème par exemple pour analyse formantique) 5èmes Journées PFC

Toulouse, les 4 et 5 juillet 2003 Outils non-prosodiques (6) Niveau segmental : Segmentation Méthodes : Phonétisation : manuelle ou automatique (dico ou reco) Alignement : automatique (fondé sur lutilisation de modèles phonétiques de type HMM) Pbm de la variabilité 5èmes Journées PFC

Toulouse, les 4 et 5 juillet 2003 Outils non-prosodiques (7) Niveau segmental : Segmentation Evaluation dun test préliminaire dalignement (Espesser, Ghio et Nguyen) 5èmes Journées PFC Unités évaluées : voyelles (111 items) 2 fichiers de lecture de mots (aal1 et agm1) Outil utilisé : Aligneur du LORIA

Toulouse, les 4 et 5 juillet 2003 Outils non-prosodiques (7) Niveau segmental : Segmentation Evaluation dun test préliminaire dalignement (Espesser, Ghio et Nguyen) 5èmes Journées PFC Ecarts frontière gauche : Moyenne absolue : 28 ms Moyenne : - 16 ms (aligneur après manuel) 63% < 20 ms 82 % < 40 ms

Toulouse, les 4 et 5 juillet 2003 Outils non-prosodiques (7) Niveau segmental : Segmentation Evaluation dun test préliminaire dalignement (Espesser, Ghio et Nguyen) 5èmes Journées PFC Ecarts frontière droite : Moyenne absolue : 58 ms Moyenne : - 45 ms (aligneur après manuel) 38% < 20 ms 46 % < 40 ms

Toulouse, les 4 et 5 juillet 2003 Outils non-prosodiques (7) Niveau segmental : Segmentation Evaluation dun test préliminaire dalignement (Espesser, Ghio et Nguyen) 5èmes Journées PFC Ecarts frontière droite : Effets contextuels (phonème suivant) Type A : activité vocalique Moyenne absolue : 47 ms 52 % < 20 ms / 60 % < 40 ms

Toulouse, les 4 et 5 juillet 2003 Outils non-prosodiques (7) Niveau segmental : Segmentation Evaluation dun test préliminaire dalignement (Espesser, Ghio et Nguyen) 5èmes Journées PFC Ecarts frontière droite : Effets contextuels (phonème suivant) Type S : silence ou closure sourde Moyenne absolue : 72 ms 58 % dans [60;120] ms

Toulouse, les 4 et 5 juillet 2003 Outils non-prosodiques (7) Niveau segmental : Segmentation Evaluation dun test préliminaire dalignement (Espesser, Ghio et Nguyen) 5èmes Journées PFC Conclusions : 1) Un alignement « décalé à droite » 2) Fiabilité insuffisante pour : -le type de phonème généralement le mieux détecté -Le type de parole le plus normatif (lecture de la liste de mots)

Toulouse, les 4 et 5 juillet 2003 Outils non-prosodiques (8) Niveau segmental : Marquage Méthodes : Fondée sur une reconnaissance-alignement (phase évaluée dans la section précédente ; source derreur supplémentaire) Fondée sur des modèles auto-regressifs gaussiens caractérisant des zones quasi-stationnaires du signal (puis détection de lactivité vocale et localisation des voyelles cf. Vocalis, développé à lIRIT qui implémente lalgorithme développé par R. André-Obrecht) 5èmes Journées PFC

Toulouse, les 4 et 5 juillet 2003 Outils non-prosodiques (9) Conclusions Solutions disponibles et/ou envisageables pour un alignement orthographique à différents niveaux ; Alignement automatique au niveau phonématique plus délicat : marquage plus envisageable que segmentation 5èmes Journées PFC

Toulouse, les 4 et 5 juillet 2003 Outils prosodiques 5èmes Journées PFC

Toulouse, les 4 et 5 juillet 2003 Outils prosodiques (1) Prosodie Intonation Prosodie = Système de systèmes 3 ordres structurels (Di Cristo, 2001) Ordre Tonal Ordre Temporel Ordre Métrique 5èmes Journées PFC

Toulouse, les 4 et 5 juillet 2003 Outils prosodiques (2) Ordre tonal Différents types de caractérisation (acoustique, phonétique, phonologique) Différentes conceptions (interprétation directe, modélisation holistique ou auto-segmentale) 5èmes Journées PFC

Toulouse, les 4 et 5 juillet 2003 Outils prosodiques (3) Ordre tonal : Momel et Intsint (Hirst, Di Cristo & Espesser, 2000) Caractérisation phonétique/phonologique fondée sur lanalyse automatique des données acoustiques Conception auto-segmentale Réversibilité 5èmes Journées PFC

Toulouse, les 4 et 5 juillet 2003 Outils prosodiques (3) Ordre tonal : Momel et Intsint Approche instrumentale modulaire Outil Momel disponible sous la forme dun exécutable Unix/Windows Outil Intsint disponible sous la forme dun script Perl multi-plateforme Pilotage global à partir de Praat 5èmes Journées PFC

Toulouse, les 4 et 5 juillet 2003 Outils prosodiques (3) Illustration : Momel-Intsint 5èmes Journées PFC

Toulouse, les 4 et 5 juillet 2003 Outils prosodiques (3) Illustration : Momel-Intsint 5èmes Journées PFC

Toulouse, les 4 et 5 juillet 2003 Outils prosodiques (4) Ordre temporel : Motemp (Auran & Di Cristo, 2003) 2 modalités pour la modélisation de la durée subjective: Semi-autonome : catégorisation automatique des unités préalablement isolées (paramètres : durée physique, proximité de silence, vélocité F0) Autonome : Identification de pseudo-syllabes (Farinas, 2002) et catégorisation automatique. 5èmes Journées PFC

Toulouse, les 4 et 5 juillet 2003 Outils prosodiques (4) Illustration : Motemp 5èmes Journées PFC

Toulouse, les 4 et 5 juillet 2003 Conclusion et perspectives (1) 5èmes Journées PFC Intégration doutils automatiques danalyse dans PFC : Niveau orthographique -> alignement de macro-unités pour les textes lus ; alignement plus fin envisageable pour la liste de mots ; Niveau segmental -> segmentation délicate mais marquage envisageable ; Niveau prosodique -> implémentation aisée dans les ordres tonal et temporel ; ladoption dun cadre danalyse unique constitue cependant un problème …

Toulouse, les 4 et 5 juillet 2003 Conclusion et perspectives (2) 5èmes Journées PFC Nécessité de délimitation précise : De normes concernant lacquisition des données (respect des normes denregistrement, consignes compatibles avec un traitement automatique) ; De la politique de gestion des ressources informatiques (problèmes de la diffusion des sources, des exécutables, …) De la place de lanalyse de la prosodie dans le cadre de PFC (caractère obligatoire ou optionnel, méthode unique ou pas, …)