Proposition Projet RNRT 2002 SCRITP : Synthèse Compression Restitution pour lIvre ParlanT
Plan de la présentation Description du projet Liste des partenaires Description des sous projets
Description du projet Projet exploratoire (R&D) afin de proposer, sur le livre électronique (tablette de lecture nomade) de CYTALE (produit CYBOOK) les services suivants : Synthèse à partir du texte. Codage très bas débit (<600 bps) par indexation de segments naturels de parole. Sécurisation du terminal (vérification d’accès vocale). Restriction des certaines fonctionnalités du terminal à des utilisateurs particuliers (identification vocale).
Liste des partenaires LIA (Laboratoire d’Informatique d’Avignon): JF. Bonastre ESIEE (École Supérieure d’Électronique et d’Électrotechnique): Geneviève Baudoin ENST (École Nationale Supérieure des Télécommunication): Gérard Chollet ELAN informatique: Jacques Toen CYTALE: Laurence Zaysser. THALES COMMUNICATIONS: Bertrand Ravera et François Capman
Gestion du projet/Analyse besoin et marché : (THALES,CYTALE,ELAN) Sous projet 1 Gestion du projet/Analyse besoin et marché : (THALES,CYTALE,ELAN) Sous projet 11 : (THALES) Suivi des prestations des partenaires (jalons temporels, respect du cahier des charges). Communication entre partenaires et le ministère. Intégration des travaux des partenaires. Gestions des coûts. Sous projet 12 : Analyse des besoins : (CYTALE) Analyse du marché : (CYTALE) Valorisation : (CYTALE,ELAN)
Sécurisation du terminal : (LIA, THALES) Sous projet 2 Sécurisation du terminal : (LIA, THALES) Sous Projet 31 : Système de référence LIA (vérification/identification) basé sur une modélisation statistique du locuteur GMM (Gaussian Mixture Model) et décision par test de vraisemblance. Sous Projet 32 : Axe de recherche (en relation avec la partie segmentation automatique du codeur bas débit) concernant la mise en collaboration sur une tache de vérification/identification de méthodes statistiques et de modèles segmentaux. Axe de recherche sur la prise en compte du bruit. Sous Projet 33 : Optimisation (taille et CPU) en vue d’une utilisation temps-réel.
Synthèse à partir du texte : (ELAN, THALES,CYTHALE) Sous projet 3 Synthèse à partir du texte : (ELAN, THALES,CYTHALE) Sous Projet 31 : Système de référence ELAN incluant une modélisation HMN (Harmonique +bruit) sur la base d’unités segmentales (type diphone) avec fonctionnalités de base de modification de prosodie, de rythme.
Synthèse à partir du texte : (ELAN, THALES,CYTALE) Sous projet 3 Synthèse à partir du texte : (ELAN, THALES,CYTALE) Sous Projet 32 : Axe de recherche : Conversion de voix à partir d’un dictionnaire de segments de type ALISP (Automatique Language Independent Speech Processing) ou de type ASU (Automatique Speech Unit) (en relation avec la partie synthèse du système de codage très bas débit). Les fonctionnalités de base de modification de prosodie (modèle de prosodie) et de rythme seront aussi concernées. Axe de recherche : Prise en compte des spécificités du livre parlant (dictionnaire d’exception, typographie, …). Sous Projet 33 : Optimisation (taille et CPU) en vue d’une utilisation temps-réel.
Sous projet 4 Codage bas débit par indexation de segments naturels de parole : (ESIEE, ENST, THALES) Sous Projet 41 : Système de référence ESIEE/ENST/THALES : Apprentissage et segmentation automatique avec création du dictionnaire de segments (unité ALISP mono-locuteur ou ASU mono-locuteur) en vue d’un codage/décodage incluant une synthèse HMN (Harmonique +bruit) sur la base d’unités segmentales (type ALISP ou ASU). Le débit visé est <600 bps.
Sous projet 4 Codage bas débit par indexation de segments naturels de parole : (ESIEE, ENST, THALES) Sous Projet 42 : Axe de recherche : Prise en compte des conditions particulières d’apprentissage (durée et qualité maîtrisée) dans le cas mono-locuteur Modélisation N-ALISP ou N-ASU (issue des technique N-grammes de modélisation du langage) Axe de recherche : Améliorations de la qualité du dictionnaire par inclusion d’une phase de synthèse au niveau de l’analyse (et dans la phase de segmentation) Axe de recherche : Conversion de voix à partir d’un dictionnaire de segments de type ALISP ou de type ASU. Sous Projet 43 : Optimisation (taille et CPU) en vue d’une utilisation temps-réel.
Réalisation/Démonstrateur : (THALES,CYTALE,ELAN,LIA) Sous projet 5 Réalisation/Démonstrateur : (THALES,CYTALE,ELAN,LIA) Sous Projet 51 : Spécification : une phase intermédiaire avec un PC portable de traitement (interfacé avec le CYBOOK) peut être envisagée (l’interface fonctionnelle serait porté sur le CYBOOK). prise en compte directe sur plate-forme CYBOOK (2nd génération basée sur un StrongArm) Sous Projet 52 : Validation système Intégration système
Evaluation : (ENST/LIA/CYTALE) Sous projet 6 Evaluation : (ENST/LIA/CYTALE) Sous Projet 61 : Évaluation par un laboratoire indépendant de la qualité du codeur très bas débit et de la synthèse. Sous Projet 62 : Évaluation des performances de la sécurisation.