Portail Vocal d’Entreprise Responsable et intégration Conception, maquette Évaluation Reconnaissance Analyse usages
Objectif scientifique : un modèle de dialogue générique Une recherche de raisons de l’action (but, intention, engagement, etc.) plus profondes pour modéliser le comportement dialogique Un souci de trouver les bons cadres de dialogue dans une relation dialogue / tâche la plus indépendante possible Solution ? extension de la logique illocutoire
Objectif économique : développer des services vocaux Le téléphone mobile est un vecteur essentiel de développement de services vocaux innovants Usage répandu Coût décroissant Pratiques en évolution Faible apprentissage Objet personnel Tarification aisée
Usage-utilisabilité Les pratiques : Au CHU entre brancardiers et service de gestion : contraintes de mains libres, mobilité, nécessité de planifier les déplacements de malades Les cadres d’une grande entreprise : utilisent dès qu’ils peuvent les connexions Internet par PC portable Les professions libérales (notaires) : renseignement, recherche de références de documents ou de textes Les secrétaires de l’université : renseignement par téléphone, services divers comme prise de rendez-vous, réservation de salles, redirection d’appel, prise de messages La signification de l’usage : Forte pour des tâches ciblées : résolution de problème, confirmation en face à face
Usage-utilisabilité Concurrence d’autres médias : (faiblesses du téléphone) e-mail : documents attachés, envois groupés, rédaction et réponse différées, traces et archivage, pas d’attente du correspondant, relance automatique Fax : documents authentifiables, sécurité de transmission Forces du téléphone : Mobilité, langage naturel, confidentialité, dispositif très répandu et peu coûteux Utilisé pour : messages courts (renseignement, confirmation), sémantiquement riches, urgence, authentification du correspondant (pas d’intermédiaire) Conclusion : développer des services à l’aide d’agents/assistants conversationnels
Un portail vocal d’entreprise… Quoi y trouver ? Des services d’assistance : recherche d’une personne, gestion d’agenda, réservation de salle, organisation de réunions, imprévus, urgences, recherche d’information Des services personnels : mémorisation de messages, envoi de messages différés, annonces, notes personnelles Comment y accéder ? Par téléphone mobile en y harmonisant d’autres médias : e-mail, fax, Internet Dans les deux sens : appel vers le portail et par une procédure de rappel depuis le portail Conclusion : accès multimodal, services intégrés, médiateur conversationnel
Exemple de service intégré Organisation d’une réunion Résultat Rappel correspondant Contraintes Confirmation Appel des participants Réservation salle Appel du service Définition créneaux temps Participants Envoi message Documents Par e-mail : annonce temps
Verrous en dialogue oral La reconnaissance de la parole : aspects multilocuteur et multilingues, canal téléphonique, robustesse, couverture linguistique (en particulier noms propres) L’analyse sémantique : richesse des concepts, complexité des énoncés, sens commun, couverture sémantique L’analyse pragmatique : représentation du discours, référents à la tâche et au discours, connaissances mutuelles La gestion de la tâche : planification vs. action située La gestion du dialogue : pertinence des stratégies, généricité du modèle La génération : degré de force illocutoire, effets perlocutoires La synthèse de la parole : prosodie du dialogue
Études préalables Recueil de dialogues : sur le terrain L’analyse structurelle : articulation du dialogue, connaissances, thèmes L’analyse pragmatique : simulation par Moz
La réservation Expose le problème C (intro ?° générale) C - Dem dispo Salle [+ RSG-mat] ‘’ ‘’ Chambre [date donnée par C ] Modif° C (Act° = modif° annul° + réservat°) Annul° RESA-salle C Donne l’info. Confirm° RESA- chmb C mise en attente - A Consult° agd Possibilité Modif° C Echec PROP° ou SOL° Echec RESA-salle-Série de ?° A Heures ? Quand ? Type salle ? Date ? Organisme ? Nom ? Sujet / Motif ? Série de ?° A Quand ? pour quoi ? Série de ?° RESA-chambre C Prix / Services ? C Itinéraire C (+explic° iti. A) Prop° envoi fax C Dem. Infos div. C Réussite Négoc° C RESA-chamb.-Série de ?° A Nom ? A Organisme ? A Dates / périodes A Série infos fonctionnement-A Paiement de la facture - A C dem coord de A (mail…) Act° = A RESA ou QUASI-RESA Act° = A confirm° Act° : Demande envoi mail de confirm° A Explic° (de A à C..) Pb dates - ERR C. Résumé A Résumé C [Validation - A] Act° = annulation A Remerciements + Salutations (A & C )
Architecture Enoncé oral Modèles Acous. Reconnaissance Modèle Lang. Morpho-syntaxe Chaîne orthographique Référents Tâches Concepts Compréhension Plan Historique Schéma Acte de langage Objets Gestion de la tâche Interprétation Connaissances Gestion du dialogue Contexte tâche But Référence discours Stratégies Génération Buts dialogiques Action sur le monde Synthèse TTS Enoncé oral
Le « jeu de dialogue » est réglé par : Le modèle de dialogue Le « jeu de dialogue » est réglé par : des règles de déclenchement de stratégies, des règles de comportement, un mécanisme de contrôle du but, des règles de reprise/relance par des sous-dialogues. Ce jeu est indépendant de la tâche
Le but du jeu Motive et oriente le dialogue U : "dessine un triangle" M : "pouvez-vous préciser ?" U : "équilatéral" M : "de couleur rouge ?" U : "peu importe" M : "OK" Motive et oriente le dialogue Le dialogue est une action conjointe OK Peu importe De couleur rouge ? Équilatéral Pouvez-vous préciser ? Dessine un triangle
Stratégies Manière de gérer un échange pour satisfaire le but (les rôles peuvent changer au cours des échanges) Direction d’ajustement des buts Soit bX le but de X et by celui de Y en début d’échange. Au cours de l’échange on peut avoir : @ bx au profit de by : X est réactif (by @ bx=Ø) Imposition de bx à Y : X est directif (bx @ by =Ø) Partage des buts : X, Y sont coopératifs (bx by ) Recherche d’un compromis : X, Y négocient (bx b’ by) Détour constructif : X, Y font une incidence (bx Ø by) Causes d’échec : incompréhension, incidence ou rupture, assertion fausse, présupposé erroné, action impossible, erreur ou mensonge
Exemple de modélisation : Directif Règle : Au début l’initiative est à la machine pour lui permettre de “se” présenter et de connaître son interlocuteur. Elle doit être pour cela en mode directif. Elle revient à ce mode dès qu’une incompréhension surgit (pour éviter le risque de bouclage ou d’impasse). ((p = 0)) v (FSU(directif)) v (FSM(erreur)) Þ (ddirectif) Comportement : FAMp Þ CMp Ù CM(Cup) M fait un acte et en enregistre les effets FFMp Þ CM(FAUp) Ù CMp M fait-faire un acte, U est supposé exécuter FSMp Þ CM(Cup) M donne une info. et suppose que U l’accepte FFSMp Þ FSUp v FFSUp M pose une question, et attend de U une réponse FSUp Ù CondS(p) Þ CMp U donne une information, M l’enregistre nonvide(p) Þ CondS(p) FSU(contestation) Þ (dnégociation) si U conteste il y a changement de stratégie FFSUp Ù CMp Þ FSMp U pose une question de clarification, M y répond et reprend l’initiative FDMp Þ CM(FAUp) Ù CMp M fait-faire un acte, U est supposé exécuter
Le contrôle du dialogue USAGER MACHINE FUp • Analyse Découpage de l’énoncé reconnu en segments conceptuels Calcul de la composante locutoire (si échec sous-dialogue de clarification) • Planification du dialogue Recherche du type illocutoire Calcul de la stratégie Recherche du but b (si échec sous dialogue de réparation) Ordonnancement des buts en attente dans la pile • Planification de la tâche Calcul du plan d’action découlant des plans appris de la tâche Construction des connaissances partagées (si échec sous-dialogue d’explication) Mise à jour de l’historique Remise à jour du modèle utilisateur Calcul de la composante illocutoire : quoi faire • Génération Calcul de la composante locutoire : quoi dire Calcul de la composante perlocutoire (degré force illocutoire) : comment le dire Mise à jour de la situation, synthèse de la parole FMp FUp Cycle suivant
Exemple de session Après envoi du message par e-mail… U0 : allô, ici Olivier Causse M0 : bonjour, Vocalisa à votre service monsieur Causse U1 : je voudrais organiser une réunion de travail M1 : oui, pour quelle date ? U2 : quelles sont les disponibilités ? M2 : avez-vous une préférence de salle ? U3 : nous serons moins de 10 personnes M3 : la salle Lafayette est disponible jeudi et vendredi prochains. Voulez-vous que je la réserve ? U4 : préviens d’abord les membres du projet PVE sauf Luc Rodet et tiens-moi au courant M4 : très bien, souhaitez-vous un message particulier ? U5 : non un message standard par e-mail mais avec relance téléphonique M5 : entendu je vous rappelle. Au revoir. M0 : allô, ici Vocalisa. Je vous téléphone pour une réunion. Vous êtes bien Jean Caelen ? U0 : oui. M1 : je vous ai envoyé un e-mail de la part de Olivier Causse pour une réunion jeudi ou vendredi. Serez-vous disponible ? U1 : non, seulement vendredi pour cette semaine. M2 : merci. Je lui en fait part. Au revoir. Après envoi du message par e-mail… M0 : allô, ici Vocalisa. Je vous téléphone pour la réunion que vous souhaitez organiser jeudi. Vous êtes bien Olivier Causse ? U0 : oui. M1 : j’ai recueilli les disponibilités des membres PVE. Jeudi et vendredi pour Solange Hollard et vendredi pour Jean Caelen et Evelyne Millien U1 : bon, eh bien prévenez-les pour vendredi et confirmez la réservation de la salle Lafayette. Au revoir. M2 : entendu, au revoir. Après itération sur tous les membres
Conclusion La reconnaissance : WebSphere La compréhension : UNL et ses analyseurs L’interprétation pragmatique : autour de la SDRT La gestion du dialogue : en JESS La gestion des tâches : avec MAD La génération : UNL et ses générateurs La synthèse : WebSphere Pour PVE, la compréhension et la génération ne sont pas des problèmes centraux (il existera dans le futur des outils à large couverture linguistique) Mais l’interprétation pragmatique reste le problème le plus difficile à résoudre