La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Jeux dialogiques Jean Caelen.

Présentations similaires


Présentation au sujet: "Jeux dialogiques Jean Caelen."— Transcription de la présentation:

1 Jeux dialogiques Jean Caelen

2 Dialogue = jeu Jeu de langage = Wittgenstein en 1952
Théorie des jeux = Von Neumann et Morgensten « The Theory of Games and Economic Behavior » en 1944 Dans le dialogue homme-machine, nous supposons au moins deux acteurs, l’homme et le système, comme étant deux locuteurs qui dialoguent, chacun visant au départ un certain but dans l’arrière-plan. Un dialogue est un jeu au cours duquel chaque participant joue des coups à l’aide d’actes de dialogue pour atteindre son but. Un dialogue se présente comme une suite d’échanges (actions, transactions), les échanges visant à résoudre des sous-buts ou des pré-conditions. Le dialogue lui-même peut être discontinu dans le temps et se dérouler sur plusieurs sessions.

3 Théorie des jeux Définition : un jeu est une situation où des individus rationnels (les "joueurs") sont conduits à faire des choix stratégiques parmi un certain nombre d'actions possibles, et dans un cadre défini à l'avance (les "règles du jeu"), le résultat de ces choix constituant une issue du jeu, à laquelle est associé un gain (ou paiement), positif ou négatif, pour chacun des participants. La théorie des jeux modélise le comportement d'un agent face à des situations de choix, elle étudie toute situation dans laquelle des agents interagissent. On pourrait aussi l'appeler théorie de la décision interactive, car elle modélise des situations dans lesquelles plusieurs agents font des choix, puis des actions conditionnées par ces choix, ces actions ayant à leur tour des effets sur les gains (ou pertes), ceux des uns affectant les gains des autres.

4 Théorie des jeux Un jeu se caractérise par des règles qui définissent : le nombre de joueurs (au moins deux), l’ordre d’intervention des joueurs, les types d’actions, stratégies possibles des joueurs et informations disponibles pour choisir, les informations disponibles ou non sur les stratégies des participants (ce dernier paramètre sépare les types de jeux en jeu coopératif ou de coalition vs. en jeu compétitif), le degré de communication entre joueurs (collusion ou non) le déroulement et les étapes du jeu, les rétributions (gains, pertes) et les résultats, la répétition ou non du jeu. La théorie distingue différents types de jeux suivant qu'ils sont plus ou moins coopératifs, compétitifs, répétitifs. L’intérêt de la modélisation d’un jeu porte sur ses règles.

5 Théorie des jeux Le concept d’utilité est central dans un jeu. C’est non seulement le critère qui permet de mesurer le gain ou la perte à l’issue du jeu, mais c’est aussi le critère qui motive le jeu et maintien les acteurs dans cette situation et leur fait respecter les règles. L’utilité peut se décliner en unités monétaires, biens matériels ou non, etc. On l’associe souvent à un nombre réel. Un jeu est dit jeu stratégique entre deux ou plusieurs personnes lorsque l’utilité est affectée non seulement par l’action du joueur lui-même mais aussi par toutes les actions des autres joueurs (jeu d’échec par exemple). Les conflits peuvent souvent se modéliser par des intérêts contradictoires en terme d’utilité.

6 Théorie des jeux Le jeu est souvent un problème combinatoire que l’on peu représenter sous forme d’arbre de décision (forme dite extensive) ou sous forme duale, la matrice (forme dite normale). Les "formes extensives" : arbre de Kuhn, ayant des branches, des nœuds et des feuilles, où l'issue d'un jeu est assimilée à une feuille dans laquelle nous retrouvons le vecteur des gains (ou "paiements") respectif des joueurs. Les embranchements possibles à partir d’un nœud représentent les choix à ce moment du jeu. Les "formes normales" : tableau de gains (ou "paiements") mais qui sont inadaptés aux jeux répétitifs.

7 Le dilemme du prisonnier
Stratégie Joueur B dénonce A B dénonce A A dénonce B 5, 5 0, 10 A dénonce B 10, 0 3, 3 Jeu à connaissance incomplète Comportement de A dépend de celui de B qu’il ne connaît pas, donc émerge la notion d’intérêt commun et la solution qui offre le moins de « regret » 3,3

8 Équilibre de Nash On appelle équilibre un état ou une situation où aucun joueur ne souhaite modifier son comportement même connaissant le comportement des autres joueurs. Une fois qu’un équilibre a été atteint il n’y a aucune raison de le quitter. L’équilibre de Nash est un concept fondamental en théorie des jeux, c’est pour un joueur la meilleure stratégie possible étant donnée les stratégies des autres joueurs. Mais cet équilibre est relatif, il dépend des stratégies des autres joueurs. Cependant, un équilibre global peut émerger si le risque est partagé par l’ensemble des joueurs. Ainsi le risque pour A de ne pas dénoncer B est moindre si B raisonne de la même manière que lui. L’équilibre de Nash global est alors (3,3).

9 Stratégie dominante Joueur 2 Joueur 1 Stratégie A Stratégie B
Stratégie C 3, 0 4, 0 Stratégie D 4, 3 0, 2 Dans ce jeu la stratégie A du joueur 2 domine faiblement sa stratégie B. Le joueur 1 n’a pas de stratégie dominante mais il pense que le joueur 2 jouera sa stratégie dominante A. Avec cette hypothèse il doit donc jouer la stratégie D qui maximise son gain et devient sa stratégie dominante après élimination des stratégies dominées du joueur 2. Ainsi (4,3) est le point d’équilibre de ce jeu.

10 Équilibres multiples Locut. B Locut. A Appeler Attendre 0, 0 6, 0 0, 6
Dans ce jeu A et B sont en conversation téléphonique et la liaison est coupée. Chacun a la possibilité de rappeler ou d’attendre l’appel de l’autre. Il coûte 6 d’appeler. S’ils attendent tous les deux ou appellent simultanément la conversation ne pourra pas avoir lieu. Supposons que (a) l’intérêt de A et B soit le même alors il y a deux équilibres, le choix in fine de la stratégie de l’un se fera sur la connaissance supposée des préférences de comportement de son interlocuteur (c’est-à-dire par exemple savoir que B est plus impatient que A), sinon (b) c’est celui qui a un intérêt supérieur qui devra appeler l’autre => gains composés (plusieurs jeux composés ou gain externe au jeu)

11 La rationalité La théorie des jeux suppose souvent que les joueurs sont rationnels. En réalité il n’en est pas toujours ainsi, Soit que l’un des joueurs suppose que les autres ne le sont pas, Soit que les critères de choix ne le sont pas , Soit que des stratégies à long terme de type spéculatif sont mises en place, Soit qu’il peut aussi y avoir des connaissances fausses qui biaisent la prise de décision. Exemple de biais psychologique : on dit à deux joueurs de choisir au hasard et de noter un chiffre quelconque compris entre 1 et 10. Si le hasard leur donne le même chiffre ils gagnent tous deux 10 fois ce chiffre et sinon ils ne gagnent rien. Le jeu est répété 10 fois. Y a-t-il une stratégie gagnante ?

12 Limites de la rationalité
La théorie des jeux dite néoclassique suppose que les joueurs sont rationnels et intéressés. Ils ne se préoccupent que de leur propre intérêt et des gains des autres, que dans la mesure où ces derniers conditionnent les leurs (par exemple dans les jeux de marchandage à somme nulle). Or ce comportement est actuellement contesté par certains résultats expérimentaux. On montre que le sentiment de partage équitable ou de rémunération équitable entre en jeu, notamment dans certaines relations de marchandage. Des valeurs humanitaires (ou sentimentales) entrent ainsi en considération dans certaines situations. Par exemple le sentiment de magnanimité en marchandage consiste pour un acheteur à accepter un prix au-dessus de l’équilibre pour des raisons d’effort à marchander ou parce qu’il lui semble que le vendeur a fait une concession plus importante que lui (Hollard, 2005).

13 Tendances actuelles Depuis quelques années, la théorie des jeux s’est ouverte à des concepts plus raffinés qui permettent de réduire le nombre des équilibres comme dans les sous-jeux parfaits ou la renégociation. Dans ces cas la représentation extensive (arbre de choix) n’est pas toujours équivalente à la représentation sous forme normale (matrice). Les sous-jeux parfaits utilisent des notions comme la menace : cela consiste à menacer à l’avance l’un des joueurs, que si le jeu tombe dans une certaine configuration alors il y aura sanction. Un équilibre de sous-jeu parfait devient alors une combinaison de stratégies telle que les actions prescrites par ces stratégies constituent un équilibre de Nash dans tous les sous-jeux

14 Les jeux répétés Un jeu répété est un jeu dans lequel les mêmes joueurs se rencontrent plusieurs fois. On suppose dans un premier temps que les règles du jeu ne changent pas et que les gains acquis à un tour précédent n’influent pas sur les gains espérés du tour suivant. Malgré ces conditions d’autres équilibres se créent du fait de la répétition du jeu, notamment par le phénomène de collusion ou de coopération, selon que les joueurs se font ou non confiance au cours du temps. Ainsi dans le dilemme du prisonnier, si l’interrogatoire recommence touts les mois, il est probable que les choses changent : (a) au début aucun des deux ne dénonce l’autre puis (b) lorsque cet équilibre semble définitivement établi ainsi que la confiance réciproque, alors l’un des deux peut en décider autrement pour sortir de prison (il « craque » dans le jargon policier).

15 Conclusion sur la théorie des jeux
Cadre fécond Beaucoup de travaux, communauté très dynamique Modélisation mathématique puissante (probabilités, logique, optimisation fonctionnelle) Raffinements possibles : Hors du cadre strictement rationnel Par la répétition du jeu et l’introduction de phases stratégiques distinctes Par l’introduction de facteurs humains complexes, individuels ou collectifs autres que les intérêts et les connaissances

16 Retour au dialogue… Nous allons tenter d’étendre la théorie des jeux pour le dialogue dans trois directions : Attacher à la notion de but celle d’utilité (= fonction de satisfaction continue) Appliquer la théorie des jeux à la prise de tour de parole dans un dialogue à plusieurs, Formaliser des stratégies générales de dialogue.

17 But satisfait ? Usager : allô, je voudrais réserver une salle pour lundi prochain Système : désolé, toutes les salles sont déjà prises. Usager : bon… merci, au revoir Le but du dialogue est satisfait mais pas le but du jeu (appelé bU). Ce dialogue n’a pas été « utile ». But du jeu = réussir à obtenir un service But du dialogue = réussir la transaction But illocutoire = réussir un acte de dialogue

18 But bU « mieux » satisfait…
Usager U : allô, je voudrais réserver une salle pour lundi prochain Système : désolé, toutes les salles sont déjà prises… mais je vais me renseigner pour savoir si une permutation est possible. Je vous mets en attente. Usager U : bon… merci… Système : bonjour monsieur A, vous est-il possible de déplacer votre réunion de lundi ? Usager A : ah non désolé, ma réunion est trop importante Système : bonjour monsieur B, vous est-il possible de déplacer votre réunion de lundi ? Usager B : oui, si c’est encore possible le lendemain… Système : merci, je réserve votre salle pour le lendemain, mardi, mais je vous confirmerai par de ce changement Système : allô monsieur U ? Monsieur B accepte de reporter sa réunion. Je peux vous réserver la salle Bleue pour lundi. Cela vous convient ?

19 La satisfaction du but Satisfaction de bA 1 Buts satisfaits
Compromis positif Compromis à somme nulle Compromis négatif Satisfaction de bB 1

20 La gestion des conflits Les tours de parole
Exemple : un dialogue pour gérer les ressources partagées. Dans ce type de problème : Comment gérer les conflits par le dialogue ? Comment gérer les tours de parole entre partenaires ?

21 Résolution par la théorie des jeux
bU = [$x, y=lundi : salle(x) Ù jour(y) Ù réservé(x,y,U)] ce but posé par U est étendu en considérant : b = [bU Ù ($h, $d, A : heure(h) Ù durée(d) Ù réservé(x,y,A)]  [($x, y ≠ lundi : salle(x) Ù jour(y) Ù réservé(x,y,U)] qui permet de chercher soit une heure et une durée en cas de disponibilité de salle, soit les agents A qui ont réservé le jour y soit de relâcher la contrainte sur le jour de réservation de U pour lui proposer une autre date le cas échéant si aucun agent A n’accepte de modifier sa réservation

22 Construire un arbre de conflits
ET OU b1p1 b2p2 b3p3 b4p4 b5p5 Dans cet exemple le but bU est en conflit avec les buts (b1p1 Ù b2p2 Ù b4p4)  (b1p1 Ù b2p2 Ù b5p5)  (b3p3 Ù b4p4)  (b3p3 Ù b5p5) ce qui laisse 4 tactiques pour résoudre le problème. Plus généralement, le problème est de parcourir l’arbre de conflits de manière optimale afin de rechercher le chemin qui offre la meilleure possibilité de lever le conflit en activant des sessions de dialogue de négociation avec les patients concernés Pi. Trouver la solution qui maximise l’espérance de succès de la négociation.

23 Optimiser La recherche de cet optimum, guide la tactique de dialogue qui consiste donc à : énumérer tous les chemins possibles dans l’arbre de conflits, estimer les gains individuels et généraux pour tous les chemins, ordonnancer ces chemins selon l’un des deux critères de choix à savoir intérêts particuliers ou intérêt général, parcourir ces chemins pour organiser les sessions de négociation selon cet ordre et dialoguer avec chaque participant jusqu’à trouver une solution ou constater un échec, revenir au dialogue principal qui a motivé le but, en faisant le compte-rendu à l’appelant.

24 Position du problème La phase de négociation à laquelle nous nous intéressons ici est la phase d’estimation a priori des chances de succès d’une demande de service afin de planifier les sessions de dialogue selon une tactique optimale. Les participants sont en nombre quelconque n, [Ui,i=1,n-1], et U0, pose un problème b0 (demandeur initial) qui se trouve être en conflit avec une situation précédente.

25 Définitions On définit on ensemble de fonctions dans l’intervalle [-1, +1] Gain(Ui) = le gain (resp. perte) que Ui espère retirer (resp. craint de subir) de la réalisation de b0. Ce gain ne dépend que de l’intérêt propre de Ui, considéré indépendamment de l’intérêt des autres participants. Gain_conjoint(Ui, Uj) = le gain (resp. perte) que Ui espère retirer (resp. craint de subir) de l’acceptation (resp. refus) de b0 par Uj. Ici on considère l’intérêt que Ui et Uj partagent. Si ces intérêts sont opposés le gain conjoint prend une valeur négative. Concession(Ui) = réduction de gain (resp. augmentation) que Ui est prêt à accepter (resp. en attend) en cas d’imposition de b0. Cette valeur dite de concession est la borne limite encore acceptable par Ui s’il peut encore influer sur une situation qui lui est défavorable. Une concession positive serait un gain inespéré par lui à ce stade de la négociation, Concession_conjointe(Ui, Uj) = concession faite par Ui suite à une pression subie par Ui de la part de Uj pour imposer b0. On remarque ici que U0 n’est peut-être pas le seul à vouloir réaliser b0, et que de ce fait Ui peut recevoir diverses pressions pour accepter b0. Si b0 est favorable à Ui alors il peut lui-même faire subir des pressions aux autres participants pour réaliser b0.

26 Tactiques Gi = G(Ui) + ΣGc(Ui, Uj) – C(Ui) – ΣCc(Ui, Uj)
La théorie des jeux propose des solutions pour maximiser soit le gain total de certains individus soit le gain total de l’ensemble des participants. Le gain espéré pour Ui est : Gi = G(Ui) + ΣGc(Ui, Uj) – C(Ui) – ΣCc(Ui, Uj) On a donc plusieurs types de tactiques : Max G0 sur l’intérêt du demandeur initial, Max ΣpiGi sur l’ensemble des participants ou de certains participants « prioritaires ». j j i

27 Exemple numérique Problème : U0 souhaite organiser une réunion ; il s’agit de trouver une date T qui permette de réunir l’ensemble des participants {U0, Ui, i=1,n-1} sous la contrainte C. Le « poids » des participants vis-à-vis de leur importance par rapport à l’ordre du jour de la réunion est par définition une valeur pi réelle comprise dans l’intervalle [0, 1] Parmi les contraintes on peut avoir par exemple : C1- tous les participants doivent être présents C2- tous les participants parmi les k plus importants doivent être présents C3- un quorum q doit être atteint Dialogue : on suppose que le dialogue de prise de rendez-vous se fait en face-à-face. La négociation est un jeu répété.

28 Exemple numérique Discussion à trois :
1-U0 : je vous propose une réunion sur le sujet S à la date T1 2-U1 : désolé je ne peux pas à T1, mais plutôt à T2 3-U0 : pourtant il faudrait que tout le monde soit présent 4-U1 : OK mais j’aimerais aussi que U2 soit présent 5-U2 : pour moi pas de problème à T1 mais impossible à T2 6-U1 : bon, je vais m’arranger pour venir Dans cet exemple on note que U0 fait « pression » sur U1 et U2 (à l’aide d’arguments et/ou par sa position hiérarchique), que U1 a un gain conjoint avec U2 (il le manifeste explicitement à l’acte 4) et qu’il finit par faire une concession à U0 à l’acte 6, la contrainte étant ici que tous les participants doivent être présents.

29 Exemple numérique Les valeurs des fonctions sont les suivantes par rapport au sujet S : P = G = Cette matrice Gain n’est pas symétrique, elle peut évoluer au cours du dialogue si le sujet S change ou se modifie. C(T1) = C(T2) =

30 Exemple numérique Au départ : G0(T1) = 1 – 0 = 1 G0(T2) = 1 – 0 = 1
Remarques : la date T1 ou T2 est indifférente pour U0. Il peut subir une pression de la part de U2 mais pas de U1 pour changer de date. La date T1 ne convient pas à U1 il peut subir une pression de la part de U0 et de U2. La date T1 peut convenir à U2 mais pas T2, il peut subir une pression de U0 (mais ressentie moins fortement que U1).

31 Exemple numérique Pour la suite du dialogue on a :
1-U0 : je vous propose une réunion sur le sujet S, à la date T1 Cet acte propose un intérêt pour le sujet S et fait subir une pression sur U1 et U2 pour la date T1 G0(T1) = 1– 0 = 1 G1(T1) = –0.8 = -0.5, G1(T2) = 0.5 G2(T1) = = 0.6 2-U1 : désolé je ne peux pas à T1 mais plutôt à T2 Cet énoncé exprime l’état G1(T1) et fait subir une pression sur U2 mais pas sur U0 (car la concession est nulle) G1(T1) = -0.5 G2(T1) = = 0.2, G2(T2) = -0.5 3-U0 : pourtant il faudrait que tout le monde soit présent Cet énoncé exprime une insistance de U0 sur U1 G1(T1) = = 0.3

32 Exemple numérique 4-U1 : OK mais j’aimerais aussi que u2 soit présent
Le gain G1 devient positif donc U1 acquiesce mais exerce une pression sur U2 pour augmenter son gain conjoint G2(T1) = = 0.4, G2(T2) = = -0.1 5-U2 : pour moi pas de problème à T1 mais impossible à T2 Fait état de son gain positif et répond à U1 G1(T1) = = 0.8 6-U1 : bon, je vais m’arranger pour venir La réunion a donc lieu à T1 avec les trois participants avec les gains (1, 0.8, 0.4)

33 Discussion Ce modèle de gestion de la négociation est relativement indépendant du modèle de tâche. Il travaille seulement sur l’état du but de dialogue et il permet donc de séparer le gestionnaire de dialogue du gestionnaire de la tâche, c’est-à-dire le quoi et le comment. La théorie des jeux est une alternative intéressante pour modéliser le dialogue et dépasser les deux types de modèles habituellement utilisés, le modèle intentionnel et le modèle conventionnel. Limites : les valeurs des paramètres, la numérisation

34 Jeu stratégique de dialogue
Gestion des buts de dialogue Stratégies de dialogue

35 Le but du jeu Motive et oriente le dialogue
U : "dessine un triangle" M : "pouvez-vous préciser ?" U : "équilatéral" M : "de couleur rouge ?" U : "peu importe" M : "OK" Motive et oriente le dialogue Le but du dialogue est de maintenir une interaction conjointe OK Peu importe De couleur rouge ? Équilatéral Pouvez-vous préciser ? Dessine un triangle

36 Le but du jeu On appelle but du jeu un état utile que désire atteindre l’usager. Cet état concerne aussi bien un état mental de ce dernier (par exemple connaître une information, acquérir un savoir-faire) qu’un état du monde. On suppose qu’on peut représenter ce but à l’aide d’un prédicat bU, par exemple : • bU = ($x) Ù Cercle(x) Ù Rouge(x) Ù Sur(x, Carré) Mettre un cercle rouge sur le carré • bU = (x) Ù Cercle(x) Ù CU(Ballon(x)) Savoir qu’un cercle représente un ballon

37 Évolution du but au cours du dialogue
nouveau but : ?b, ce but vient d’être exprimé par X, but atteint : †b, l’état de la situation rend le prédicat b vrai, but satisfait : ‡b, X manifeste son accord explicitement ou implicitement sur †b, but mis en attente : -b, l’usager ou la machine résolvent temporairement un autre problème, but réparé : b’, à la suite d’une incompréhension le but est modifié, but déplacé : b’, à la suite d’un compromis le but est modifié, sous-but : sb, le problème est décomposé en sous-problèmes, but abandonné à la suite d’un échec ou d’un souhait d’abandon.

38 L’action Les unités élémentaires sont les actes de langage de la forme Fp, avec : FAp : faire p (action), les effets immédiats obtenus sont p (déclaratif) FFp : faire-faire p, demande de faire p, les effets p sont différés (directif) FSp : faire savoir p, les effets sont obtenus immédiatement (assertif, FS(Ø) note un expressif) FFSp : faire faire-savoir p, demande information sur p, la réponse est différée FPp : faire pouvoir p, offre un choix fermé, la réplique est attendue parmi p (promissif) FDp : faire devoir p, oblige une action dont l’effet sera p (directif)

39 Règles du jeu Consistance de U devant ses buts
FSUb  ¬b  ?b U pose un nouveau but en le manifestant FSUb2  b1  -b1  ?b2 si U manifeste un deuxième but b2 alors qu’un autre but b1 est déjà en cours, on met ce dernier en attente (car on ne traite le dialogue que sur un fil, c’est-à-dire échange par échange) ‡b  FSUb U n’a pas de raison de maintenir un but satisfait †b  ¬FSUb  ‡b si un but est atteint et que U ne le conteste pas, il est satisfait de manière implicite †b  FSU (¬b) si un but est atteint et que U le conteste, on l’abandonne FSU U peut décider d’abandonner un but de propos délibéré

40 Règles du jeu Consistance de U devant les buts de M
b  FUp les actes a de U sont motivées par le but courant ¬FUp la non-action est une incompréhension FSM b  ¬b  ?b si elle pose un but, il est accepté par U FPMb  FSUb si elle donne un choix à U sur les buts, celui-ci le fait FDMb  FAUb si elle donne une obligation à U sur le but, celui-ci le fait Les attentes sont motivées par l’efficacité FAxp Þ Cyp les effets de l’acte sont pris en compte par l’allocutaire FFxp Þ FAyp  FFSyp l’acte attendu est une contribution au FF demandé FPxp  FDxp Þ FAyp  FFyp l’acte attendu est un choix d’action parmi ceux proposés FSxp Þ Cyp  FFSyp une information est prise en compte ou clarifiée FFSxp Þ FSyp  FFSyp une question motive la réponse ou une demande de clarification

41 Gestion des buts FSb Ù ¬b Þ ?b un nouveau but est empilé et devient candidat à la résolution b Þ †b le but est atteint et marqué comme tel FS(†b1) Ú (†b1 Ù FSb2 Ù (b1b2)) Þ ‡b1 le but est satisfait après accord explicite ou implicite de celui qui a posé le but (il est alors dépilé) FSMb’ Ù (b’= sb ) Þ?b’ Ù -b le but est déplacé par M pour des raisons de planification (il est empilé) FSMb’ Ù (b’  sb ) le but est déplacé par M pour des raisons motivées par la situation ou suite à un compromis ou à une réparation (il remplace b) ¬CMb Ù ?b le but est abandonné car M ne sait pas le résoudre (il est dépilé) ¬ FSUb Ú ‡b le but est abandonné si U change d’avis ou s’il est satisfait (il est dépilé)

42 Stratégie Manière de gérer un échange pour atteindre et satisfaire le but (les rôles peuvent changer au cours des échanges) Direction d’ajustement des buts Soit bX le but de X et by celui de Y en début d’échange. Au cours de l’échange on peut avoir : @ bx au profit de by : X est réactif (by  bx) Imposition de bx à Y : X est directif (bx  by) Partage des buts : X, Y sont coopératifs (bx  by ) Recherche d’un compromis : X, Y négocient (bx b’ by) Détour constructif : X, Y font une incidence (bx  Ø  by)

43 Gestion du dialogue Le « jeu de dialogue » est réglé par :
des règles de choix de stratégies, des règles de comportement, un mécanisme de contrôle, des règles de reprise par des sous-dialogues, une ontologie de jeu (description des sous-jeux ou des étapes).

44 Réactif (R) Règle : mode réactif si le nombre de tours de parole p depuis la précédente action (FA) dépasse un certain seuil. Ce mode est également activé en cas de refus d’une autre stratégie ou pour conclure un dialogue. Les conditions de complétude, de vérité et de réussite ne sont pas prises en compte.  (p > p0) v FSU(réactif) v FSM(clôture) Þ (d = réactif) Comportement : FAUp Þ CMp U fait un acte, M en enregistre les effets FFUp Ù CondF(p) Þ FAMp Ù CMp U fait-faire un acte, M exécute et enregistre les effets ($a) Ù attr(a,p) Ù (a = Ø) Þ Défaut(a) si acte incomplet M complète par défaut ("a) Ù attr(a,p) Ù (a ¬= Ø) Ù p·Plan Þ CondF(p) l’acte doit pouvoir déclencher un Plan FSUp Ù CondS(p) Þ CMp U donne une information, M l’enregistre ($a) Ù attr(a,p) Ù (a¬= Ø) Þ CondS(p) FFSUp) Ù CMp Þ FSMp U pose une question, M y répond si elle connaît la réponse FPUp  FDUp Þ FAMp Ù CMp M fait le choix proposé On pose : incomplet(p) = ($a) Ù attr(a,p) Ù (a = Ø), nonvide(p) = ($a) Ù attr(a,p) Ù (a¬= Ø) complet(p) = ("a) Ù attr(a,p) Ù (a ¬= Ø), l’opérateur · se lit « déclencheur de »

45 Directif (D) Règle : Au début l’initiative est à la machine pour lui permettre de “se” présenter et de connaître son interlocuteur. Elle doit être pour cela en mode directif. Elle revient à ce mode dès qu’une incompréhension surgit (pour éviter le risque de bouclage ou d’impasse). ((p = 0)) v (FSU(directif)) v (FSM(erreur)) Þ (d = directif) Comportement : FAMp Þ CMp Ù CM(Cup) M fait un acte et en enregistre les effets FFMp Þ CM(FAUp) Ù CMp M fait-faire un acte, U est supposé exécuter FSMp Þ CM(Cup) M donne une info. et suppose que U l’accepte FFSMp Þ FSUp v FFSUp M pose une question, et attend de U une réponse FSUp Ù CondS(p) Þ CMp U donne une information, M l’enregistre nonvide(p) Þ CondS(p) FSU(contestation) Þ (d =négociation) si U conteste il y a changement de stratégie FFSUp Ù CMp Þ FSMp U pose une question de clarification, M y répond et reprend l’initiative FDMp Þ CM(FAUp) Ù CMp M fait-faire un acte, U est supposé exécuter

46 Coopératif (C1) Règle : Pour un novice, une action est menée en coopération si elle est incomplètement spécifiée et si le nombre de tours de parole depuis la précédente action n’est pas trop élevée. En situation de non-action, M propose une continuation au dialogue dans ce mode (relance). • ((p < p0) v (FSU(coop.)) Ù (FSUp Ù incomplet(p) Ù CM(u,novice) Þ (d = coopératif) • ¬FUp Þ (d = coopératif) Comportement :  FAUp Þ CMp Ù FSMp U fait un acte, M en enregistre les effets et commente FFUp Ù CondF(p) Þ FAMp Ù CMp Ù FSMp U fait-faire un acte, M exécute et commente incomplet(p) Þ FSMp Ù FFSMp si acte incomplet M explicite et questionne alors FFSMp Þ FSUp complet(p) Ù p·Plan Þ CondF(p) l’acte doit pouvoir déclencher un Plan FFUp Ù ¬CondF(p) Þ FSM(¬p) Ù FFSMp’ si l’acte est erroné, M propose un but voisin FSUp Ù CondS(p) Þ CMp Ù FSMp U donne une information, M l’enregistre et commente nonvide(p) Þ CondS(p) FFSUp Þ FSMp U pose une question, M y répond si elle connaît la réponse, informe sinon FPUp  FDUp Þ FAMp Ù CMp Ù FSMp M fait le choix proposé et le commente ¬FU Þ FPMp en cas de non action, M propose des choix à U Pour les cas où M a l’initiative voir la stratégie directive

47 Coopératif (C2) Règle : Pour un expert et chaque fois que cela est possible, mais surtout en début de nouvel échange le dialogue s’établit en mode intentionnel dans le but pour M de se ramener à une situation prototypique. Lorsqu’une situation prototypique est identifiée, acceptée comme telle par U, le plan peut être exécuté. (FSU(coopératif) v (?b Ù CM(u,expert) Þ (d = coopératif) Comportement :  FFSMb Ù CUb Þ FSUb Ù CMb M pose une question sur le but, U y répond si elle connaît la réponse sinon FPMb Þ FSUb Ù CMb M propose des buts possibles et U choisit CMb Ù b·Plan Ù ¬‡b Þ FAMPlan Ù FFSMb M exécute le plan par anticipation et demande confirmation Pour les autres cas où M a l’initiative voir la stratégie directive Pour les cas où U a l’initiative voir la stratégie coopérative précédente

48 Négocié (N) Règle : Une action supporte la négociation si elle est incomplètement spécifiée et si le nombre de tours de parole depuis la précédente action n’est pas trop élevée. La négociation est menée jusqu’à son terme, elle ne peut être rompue par la machine. ((p < p0) v FSU(négocié)) Ù FSUp Ù incomplet(p) Þ (d = négocié) Comportement : FAUp v FDUp Þ (d = réactif) U fait un acte qui interrompt d’autorité la négociation FPUp Þ (d = coopératif) U fait un acte qui interrompt d’autorité la négociation FFUp Ù CondN Þ FAMp Ù CMp U fait-faire un acte, M exécute sous condition Incomplet(p) Þ FFSMp si acte incomplet M négocie FFSMp Þ FSUp v (FSU(contestation) Ù FSUp’) (complet(p) Ù p·Plan) v (complet(p’) Ù p’·Plan) Þ CondN l’acte négocié doit pouvoir déclencher un Plan ¬CondN Þ FFSMp si l’acte n’est pas exécutable, M continue de négocier FSUp Ù CondS(p) Þ CMp U donne une information, M l’enregistre si d’accord nonvide(p) Ù ¬CM(¬p) Þ CondS(p) ¬Cond(p)Þ FSMp(contestation) Ù FFSMp’ si l’information est erronée, M négocie FFSUp Ù CMp Þ FSMp U pose une question, M y répond Pour les cas où M a l’initiative voir la stratégie directive

49 Constructif (K) Règle : La stratégie constructive sert surtout à alerter l’usager ou à attirer son attention sur des sujets voisins de son propos. Elle peut être utilisée si le thème du dialogue n’a pas évolué depuis un certain temps et qu’aucune action n’est été faite. Elle peut être utilisée enfin comme un moyen de détour. ((p > p0) v (FSU(constructif)) Ù (focus = constant)) Þ (d = constructif) Comportement : FUp Þ FSMp Ù FFSMp’ Ù (d = coopératif) pour tout acte de U, M le commente et pose une question dans un propos voisin, puis passe en stratégie coopérative FFSMp’ Þ FSUp’  (FUp Ù (d = réactif))

50 Ontologie de (sous)jeux élémentaires
Un sous-jeu est un jeu (par récursivité)

51 Exemple de dialogue Dialogue acte stratégie jeu
C : Bonjour madame FP D ouverture Je voudrais une chambre pour 2 nuits FF D demande-serv/exp. A : oui, pour quand ? FFS C termes(b1) C : pour les 13 et 14 prochains FS R termes A : les nuits du 13 et du 14 ? FFS D termes C : oui FS R termes A : voulez-vous une chambre avec bain ? FFS C termes(b2) C : oui pour deux personnes FS C termes A : j’ai une chambre à 50 € FS N offre-serv/exp. Ça vous convient ? C : vous n’avez pas moins cher ? FFS N modification A : non tout est complet FS N modification C : bon… eh bien, d’accord FF N concl-serv/accept. Où se trouve votre hôtel ? FFS D demande-serv/exp. A : c’est facile, c’est en face de la gare FS C offre-serv/exp. Pouvez-vous me verser des arrhes ? FF D concl-serv/exec. C : oui bien sûr, voici le n° de ma carte VISA FA R concl-serv/exec. A : merci, je réserve la chambe FA D concl-serv/exec. C : au revoir, merci, à bientôt FD R clôture

52 Le contrôle du dialogue
Les rôles du contrôleur de dialogue sont : Calcul des stratégies, Gestion des buts, Conduite des (sous)jeux et des interventions, Pilote du système de dialogue, Gestion de l’apprentissage, Calcul des tactiques de jeu Gestion des conflits, des tours de parole et des sessions. Sous-jeu (et jeu élémentaire)   C'est la séquence des interventions qui conduit à la satisfaction d'un but de dialogue (ou l'abandon en cas d'échec). Intervention C'est la séquence des actes qui porte sur le même sous-jeu. Acte   Unité élémentaire d’action.

53 Le contrôle du dialogue
Le contrôleur gère les (Sous)Jeux et les Interventions à l’aide d’un automate relativement simple qui maintient le but à travers les jeux et permet de passer d’un jeu au suivant dès que le but courant est satisfait. La succession des (sous)jeux se cale sur l’ontologie. Dialogue  Jeu-Ouverture. Jeu*.Jeu-Clôture Jeu  Intervention* Intervention  Acte*

54 Le cycle local USAGER MACHINE bU FUp FMp cycle suivant bU FUp Niveau
• Analyse pragmatique bU FUp segmentation de l’énoncé en actes de langages recherche du type illocutoire calcul de la composante locutoire (si échec sous-dialogue de clarification) • Planification du jeu recherche du but (si échec sous-dialogue de réparation ou apprentissage) ordonnancement des buts en attente calcul du plan d’action découlant des plans appris • Planification du dialogue calcul de la stratégie calcul du comportement adéquat mise en forme du plan d’action mise à jour du modèle utilisateur • Génération des actes de la composante illocutoire : le type (quoi faire) de la composante locutoire : actants (quoi dire) de la composante perlocutoire : choix du degré de force illocutoire • Mise à jour de l’historique du dialogue via l’interpréteur pragmatique du plan d’activité via le gestionnaire de tâches de la situation. FMp cycle suivant bU FUp Niveau Niveau de profond surface

55 Exemple Jeu présentation interv. Jeu dessin
Dialogue acte stratégie but Jeu présentation M1 : Bienvenue sur ICPtalk FP connaissez-vous le système ? FFS D ?b1=CM(u) U : oui, un peu FS †b1 (u=occasionnel) M2 : je vous présente ses principales fonctions FP C1 ‡b1, ?b2=FFU(tâche) 1. l’édition graphique... FS U : stop FF †b2 je connais FS ‡b2 je veux ICPdraw FF ?b3=Run(ICPdraw) M3 : action (ICPdraw) (U : <silence>) FA R †b3, ‡b3 que voulez-vous faire ? FFS C2 ?b4= CM(b) j’attends votre intention générale FS interv. Jeu dessin

56 Exemple interv. interv. interv. interv. interv.
Dialogue acte stratégie but U : () ¬FS -b4 M4 : j’attends une commande FP D ?b5=CM(b’) Ù (b’ = sb) U : dessine un cercle rouge FF ‡b5, ?b6 =b’=(Cercle1) Ù… M5 : action (dessin cercle) FA R †b6 U : un autre, noir FF ‡b6, ?b7=(Cercle2) Ù… M6 : où ? à droite du premier ? FFS N b7’=b7 Ù A_droite… U : non, à gauche FS b7”=b7 Ù A_gauche… M7 : identique au premier ? FFS N b7”’=b7”Ù (Taille…) U : oui FS †b7”’ M8 : action FA ‡b7”’ que représentent-ils ? des roues ? FFS C2 b4 U : dessine un carré vert FF -b4, ?b8=(Carré1) Ù … M9 : action FA R †b8 interv. interv. interv. interv. interv.

57 Exemple incidence Jeu sauvegarde Clôture Dialogue acte stratégie but
U : et deux autres sur les cercles FF ‡b8,?b9=(Carré2)Ù(Carré3)Ù... M10 : sur chacun des cercles FFS N b9’=Sur(Carré2,Cercle1)Ù... U : non, superposés FS b9”=b9’ÙRéf M11 : je ne comprends pas ce mot FFS D -b9”, ?b10= CM(Réf) U : l’un sur l’autre FS †b10 M12 : bon FS R ‡b10 action (dessin) FA ‡b9” oui, mais en vue de quelle figure ? FFS C2 b4 U : un organigramme FF †b4, ?b10 =Dessin(Orga) M13 : ah ! je comprends FS R ‡b4, †b10 j’aligne donc les figures FA j’équilibre les espaces FA U : oui, merci, c’est çà FS ‡b10 sauve-çà maintenant FF ?b11=Sauver(Orga) M14 : voilà + action FA R †b11 U : merci, c’est tout FF ‡b11 M15 : au revoir FD R incidence Jeu sauvegarde Clôture

58 Discussion Un modèle général basé sur la théorie des jeux stratégiques
service = {jeux, tactiques} jeu = {but, sous-jeux} sous-jeu = {jeu, stratégies, règles} Récursivité : un sous-jeu est un jeu

59 Conclusion Au-delà des modèles intentionnels et conventionnels… théorie des jeux pour le dialogue. Cadre fécond.


Télécharger ppt "Jeux dialogiques Jean Caelen."

Présentations similaires


Annonces Google