La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Jean Caelen Jeux dialogiques. Dialogue = jeu Jeu de langage = Wittgenstein en 1952 Théorie des jeux = Von Neumann et Morgensten « The Theory of Games.

Présentations similaires


Présentation au sujet: "Jean Caelen Jeux dialogiques. Dialogue = jeu Jeu de langage = Wittgenstein en 1952 Théorie des jeux = Von Neumann et Morgensten « The Theory of Games."— Transcription de la présentation:

1 Jean Caelen Jeux dialogiques

2 Dialogue = jeu Jeu de langage = Wittgenstein en 1952 Théorie des jeux = Von Neumann et Morgensten « The Theory of Games and Economic Behavior » en 1944 Dans le dialogue homme-machine, nous supposons au moins deux acteurs, lhomme et le système, comme étant deux locuteurs qui dialoguent, chacun visant au départ un certain but dans larrière- plan. Un dialogue est un jeu au cours duquel chaque participant joue des coups à laide dactes de dialogue pour atteindre son but. Un dialogue se présente comme une suite déchanges (actions, transactions), les échanges visant à résoudre des sous-buts ou des pré-conditions. Le dialogue lui-même peut être discontinu dans le temps et se dérouler sur plusieurs sessions.

3 Théorie des jeux Définition : un jeu est une situation où des individus rationnels (les "joueurs") sont conduits à faire des choix stratégiques parmi un certain nombre d'actions possibles, et dans un cadre défini à l'avance (les "règles du jeu"), le résultat de ces choix constituant une issue du jeu, à laquelle est associé un gain (ou paiement), positif ou négatif, pour chacun des participants. La théorie des jeux modélise le comportement d'un agent face à des situations de choix, elle étudie toute situation dans laquelle des agents interagissent. On pourrait aussi l'appeler théorie de la décision interactive, car elle modélise des situations dans lesquelles plusieurs agents font des choix, puis des actions conditionnées par ces choix, ces actions ayant à leur tour des effets sur les gains (ou pertes), ceux des uns affectant les gains des autres.

4 Théorie des jeux Un jeu se caractérise par des règles qui définissent : le nombre de joueurs (au moins deux), lordre dintervention des joueurs, les types dactions, stratégies possibles des joueurs et informations disponibles pour choisir, les informations disponibles ou non sur les stratégies des participants (ce dernier paramètre sépare les types de jeux en jeu coopératif ou de coalition vs. en jeu compétitif), le degré de communication entre joueurs (collusion ou non) le déroulement et les étapes du jeu, les rétributions (gains, pertes) et les résultats, la répétition ou non du jeu. La théorie distingue différents types de jeux suivant qu'ils sont plus ou moins coopératifs, compétitifs, répétitifs. Lintérêt de la modélisation dun jeu porte sur ses règles.

5 Théorie des jeux Le concept dutilité est central dans un jeu. Cest non seulement le critère qui permet de mesurer le gain ou la perte à lissue du jeu, mais cest aussi le critère qui motive le jeu et maintien les acteurs dans cette situation et leur fait respecter les règles. Lutilité peut se décliner en unités monétaires, biens matériels ou non, etc. On lassocie souvent à un nombre réel. Un jeu est dit jeu stratégique entre deux ou plusieurs personnes lorsque lutilité est affectée non seulement par laction du joueur lui- même mais aussi par toutes les actions des autres joueurs (jeu déchec par exemple). Les conflits peuvent souvent se modéliser par des intérêts contradictoires en terme dutilité.

6 Théorie des jeux Le jeu est souvent un problème combinatoire que lon peu représenter sous forme darbre de décision (forme dite extensive) ou sous forme duale, la matrice (forme dite normale). 1. Les "formes extensives" : arbre de Kuhn, ayant des branches, des nœuds et des feuilles, où l'issue d'un jeu est assimilée à une feuille dans laquelle nous retrouvons le vecteur des gains (ou "paiements") respectif des joueurs. Les embranchements possibles à partir dun nœud représentent les choix à ce moment du jeu. 2. Les "formes normales" : tableau de gains (ou "paiements") mais qui sont inadaptés aux jeux répétitifs.

7 Le dilemme du prisonnier Stratégie Joueur B dénonce A A dénonce B5, 50, 10 A dénonce B 10, 03, 3 Jeu à connaissance incomplète Comportement de A dépend de celui de B quil ne connaît pas, donc émerge la notion dintérêt commun et la solution qui offre le moins de « regret » 3,3

8 Équilibre de Nash On appelle équilibre un état ou une situation où aucun joueur ne souhaite modifier son comportement même connaissant le comportement des autres joueurs. Une fois quun équilibre a été atteint il ny a aucune raison de le quitter. Léquilibre de Nash est un concept fondamental en théorie des jeux, cest pour un joueur la meilleure stratégie possible étant donnée les stratégies des autres joueurs. Mais cet équilibre est relatif, il dépend des stratégies des autres joueurs. Cependant, un équilibre global peut émerger si le risque est partagé par lensemble des joueurs. Ainsi le risque pour A de ne pas dénoncer B est moindre si B raisonne de la même manière que lui. Léquilibre de Nash global est alors (3,3).

9 Stratégie dominante Joueur 2 Joueur 1 Stratégie AStratégie B Stratégie C3, 04, 0 Stratégie D4, 30, 2 Dans ce jeu la stratégie A du joueur 2 domine faiblement sa stratégie B. Le joueur 1 na pas de stratégie dominante mais il pense que le joueur 2 jouera sa stratégie dominante A. Avec cette hypothèse il doit donc jouer la stratégie D qui maximise son gain et devient sa stratégie dominante après élimination des stratégies dominées du joueur 2. Ainsi (4,3) est le point déquilibre de ce jeu.

10 Équilibres multiples Locut. B Locut. A AppelerAttendre Appeler0, 06, 0 Attendre0, 60, 0 Dans ce jeu A et B sont en conversation téléphonique et la liaison est coupée. Chacun a la possibilité de rappeler ou dattendre lappel de lautre. Il coûte 6 dappeler. Sils attendent tous les deux ou appellent simultanément la conversation ne pourra pas avoir lieu. Supposons que (a) lintérêt de A et B soit le même alors il y a deux équilibres, le choix in fine de la stratégie de lun se fera sur la connaissance supposée des préférences de comportement de son interlocuteur (cest-à-dire par exemple savoir que B est plus impatient que A), sinon (b) cest celui qui a un intérêt supérieur qui devra appeler lautre => gains composés (plusieurs jeux composés ou gain externe au jeu)

11 La rationalité La théorie des jeux suppose souvent que les joueurs sont rationnels. En réalité il nen est pas toujours ainsi, Soit que lun des joueurs suppose que les autres ne le sont pas, Soit que les critères de choix ne le sont pas, Soit que des stratégies à long terme de type spéculatif sont mises en place, Soit quil peut aussi y avoir des connaissances fausses qui biaisent la prise de décision. Exemple de biais psychologique : on dit à deux joueurs de choisir au hasard et de noter un chiffre quelconque compris entre 1 et 10. Si le hasard leur donne le même chiffre ils gagnent tous deux 10 fois ce chiffre et sinon ils ne gagnent rien. Le jeu est répété 10 fois. Y a-t-il une stratégie gagnante ?

12 Limites de la rationalité La théorie des jeux dite néoclassique suppose que les joueurs sont rationnels et intéressés. Ils ne se préoccupent que de leur propre intérêt et des gains des autres, que dans la mesure où ces derniers conditionnent les leurs (par exemple dans les jeux de marchandage à somme nulle). Or ce comportement est actuellement contesté par certains résultats expérimentaux. On montre que le sentiment de partage équitable ou de rémunération équitable entre en jeu, notamment dans certaines relations de marchandage. Des valeurs humanitaires (ou sentimentales) entrent ainsi en considération dans certaines situations. Par exemple le sentiment de magnanimité en marchandage consiste pour un acheteur à accepter un prix au-dessus de léquilibre pour des raisons deffort à marchander ou parce quil lui semble que le vendeur a fait une concession plus importante que lui (Hollard, 2005).

13 Tendances actuelles Depuis quelques années, la théorie des jeux sest ouverte à des concepts plus raffinés qui permettent de réduire le nombre des équilibres comme dans les sous-jeux parfaits ou la renégociation. Dans ces cas la représentation extensive (arbre de choix) nest pas toujours équivalente à la représentation sous forme normale (matrice). Les sous-jeux parfaits utilisent des notions comme la menace : cela consiste à menacer à lavance lun des joueurs, que si le jeu tombe dans une certaine configuration alors il y aura sanction. Un équilibre de sous-jeu parfait devient alors une combinaison de stratégies telle que les actions prescrites par ces stratégies constituent un équilibre de Nash dans tous les sous-jeux

14 Les jeux répétés Un jeu répété est un jeu dans lequel les mêmes joueurs se rencontrent plusieurs fois. On suppose dans un premier temps que les règles du jeu ne changent pas et que les gains acquis à un tour précédent ninfluent pas sur les gains espérés du tour suivant. Malgré ces conditions dautres équilibres se créent du fait de la répétition du jeu, notamment par le phénomène de collusion ou de coopération, selon que les joueurs se font ou non confiance au cours du temps. Ainsi dans le dilemme du prisonnier, si linterrogatoire recommence touts les mois, il est probable que les choses changent : (a) au début aucun des deux ne dénonce lautre puis (b) lorsque cet équilibre semble définitivement établi ainsi que la confiance réciproque, alors lun des deux peut en décider autrement pour sortir de prison (il « craque » dans le jargon policier).

15 Conclusion sur la théorie des jeux Cadre fécond Beaucoup de travaux, communauté très dynamique Modélisation mathématique puissante (probabilités, logique, optimisation fonctionnelle) Raffinements possibles : Hors du cadre strictement rationnel Par la répétition du jeu et lintroduction de phases stratégiques distinctes Par lintroduction de facteurs humains complexes, individuels ou collectifs autres que les intérêts et les connaissances

16 Retour au dialogue… Nous allons tenter détendre la théorie des jeux pour le dialogue dans trois directions : Attacher à la notion de but celle dutilité (= fonction de satisfaction continue) Appliquer la théorie des jeux à la prise de tour de parole dans un dialogue à plusieurs, Formaliser des stratégies générales de dialogue.

17 But satisfait ? Usager : allô, je voudrais réserver une salle pour lundi prochain Système : désolé, toutes les salles sont déjà prises. Usager : bon… merci, au revoir Le but du dialogue est satisfait mais pas le but du jeu (appelé b U ). Ce dialogue na pas été « utile ». But du jeu = réussir à obtenir un service But du dialogue = réussir la transaction But illocutoire = réussir un acte de dialogue

18 But b U « mieux » satisfait… Usager U : allô, je voudrais réserver une salle pour lundi prochain Système : désolé, toutes les salles sont déjà prises… mais je vais me renseigner pour savoir si une permutation est possible. Je vous mets en attente. Usager U : bon… merci… Système : bonjour monsieur A, vous est-il possible de déplacer votre réunion de lundi ? Usager A : ah non désolé, ma réunion est trop importante Système : bonjour monsieur B, vous est-il possible de déplacer votre réunion de lundi ? Usager B : oui, si cest encore possible le lendemain… Système : merci, je réserve votre salle pour le lendemain, mardi, mais je vous confirmerai par de ce changement Système : allô monsieur U ? Monsieur B accepte de reporter sa réunion. Je peux vous réserver la salle Bleue pour lundi. Cela vous convient ?

19 La satisfaction du but Satisfaction de b B Satisfaction de b A 01 1 Buts satisfaits Compromis positif Compromis à somme nulle Compromis négatif

20 Exemple : un dialogue pour gérer les ressources partagées. Dans ce type de problème : – Comment gérer les conflits par le dialogue ? – Comment gérer les tours de parole entre partenaires ? La gestion des conflits Les tours de parole

21 Résolution par la théorie des jeux b U = [ x, y=lundi : salle(x) jour(y) réservé(x,y,U)] ce but posé par U est étendu en considérant : b = [b U ( h, d, A : heure(h) durée(d) réservé(x,y,A)] [( x, y lundi : salle(x) jour(y) réservé(x,y,U)] qui permet de chercher soit une heure et une durée en cas de disponibilité de salle, soit les agents A qui ont réservé le jour y soit de relâcher la contrainte sur le jour de réservation de U pour lui proposer une autre date le cas échéant si aucun agent A naccepte de modifier sa réservation

22 Construire un arbre de conflits Dans cet exemple le but bU est en conflit avec les buts (b 1 p1 b 2 p2 b 4 p4 ) (b 1 p1 b 2 p2 b 5 p5 ) (b 3 p3 b 4 p4 ) (b 3 p3 b 5 p5 ) ce qui laisse 4 tactiques pour résoudre le problème. Plus généralement, le problème est de parcourir larbre de conflits de manière optimale afin de rechercher le chemin qui offre la meilleure possibilité de lever le conflit en activant des sessions de dialogue de négociation avec les patients concernés Pi. Trouver la solution qui maximise lespérance de succès de la négociation. ET OU b 1 p1 b 2 p2 b 3 p3 b 4 p4 b 5 p5 ET

23 Optimiser La recherche de cet optimum, guide la tactique de dialogue qui consiste donc à : énumérer tous les chemins possibles dans larbre de conflits, estimer les gains individuels et généraux pour tous les chemins, ordonnancer ces chemins selon lun des deux critères de choix à savoir intérêts particuliers ou intérêt général, parcourir ces chemins pour organiser les sessions de négociation selon cet ordre et dialoguer avec chaque participant jusquà trouver une solution ou constater un échec, revenir au dialogue principal qui a motivé le but, en faisant le compte-rendu à lappelant.

24 Position du problème La phase de négociation à laquelle nous nous intéressons ici est la phase destimation a priori des chances de succès dune demande de service afin de planifier les sessions de dialogue selon une tactique optimale. Les participants sont en nombre quelconque n, [U i,i=1,n-1], et U 0, pose un problème b 0 (demandeur initial) qui se trouve être en conflit avec une situation précédente.

25 Définitions On définit on ensemble de fonctions dans lintervalle [-1, +1] Gain(U i ) = le gain (resp. perte) que U i espère retirer (resp. craint de subir) de la réalisation de b 0. Ce gain ne dépend que de lintérêt propre de U i, considéré indépendamment de lintérêt des autres participants. Gain_conjoint(U i, U j ) = le gain (resp. perte) que U i espère retirer (resp. craint de subir) de lacceptation (resp. refus) de b 0 par U j. Ici on considère lintérêt que U i et U j partagent. Si ces intérêts sont opposés le gain conjoint prend une valeur négative. Concession(U i ) = réduction de gain (resp. augmentation) que U i est prêt à accepter (resp. en attend) en cas dimposition de b 0. Cette valeur dite de concession est la borne limite encore acceptable par U i sil peut encore influer sur une situation qui lui est défavorable. Une concession positive serait un gain inespéré par lui à ce stade de la négociation, Concession_conjointe(U i, U j ) = concession faite par U i suite à une pression subie par U i de la part de U j pour imposer b 0. On remarque ici que U 0 nest peut-être pas le seul à vouloir réaliser b 0, et que de ce fait U i peut recevoir diverses pressions pour accepter b 0. Si b 0 est favorable à U i alors il peut lui-même faire subir des pressions aux autres participants pour réaliser b 0.

26 Tactiques La théorie des jeux propose des solutions pour maximiser soit le gain total de certains individus soit le gain total de lensemble des participants. Le gain espéré pour U i est : G i = G(U i ) + Σ Gc(U i, U j ) – C(U i ) – Σ Cc(U i, U j ) On a donc plusieurs types de tactiques : 1.Max G 0 sur lintérêt du demandeur initial, 2.Max Σp i G i sur lensemble des participants ou de certains participants « prioritaires ». jj i

27 Exemple numérique Problème : U 0 souhaite organiser une réunion ; il sagit de trouver une date T qui permette de réunir lensemble des participants {U 0, U i, i=1,n- 1} sous la contrainte C. Le « poids » des participants vis-à-vis de leur importance par rapport à lordre du jour de la réunion est par définition une valeur p i réelle comprise dans lintervalle [0, 1] Parmi les contraintes on peut avoir par exemple : C1- tous les participants doivent être présents C2- tous les participants parmi les k plus importants doivent être présents C3- un quorum q doit être atteint Dialogue : on suppose que le dialogue de prise de rendez-vous se fait en face-à-face. La négociation est un jeu répété.

28 Exemple numérique Discussion à trois : 1-U 0 : je vous propose une réunion sur le sujet S à la date T1 2-U 1 : désolé je ne peux pas à T1, mais plutôt à T2 3-U 0 : pourtant il faudrait que tout le monde soit présent 4-U 1 : OK mais jaimerais aussi que U 2 soit présent 5-U 2 : pour moi pas de problème à T1 mais impossible à T2 6-U 1 : bon, je vais marranger pour venir Dans cet exemple on note que U 0 fait « pression » sur U 1 et U 2 (à laide darguments et/ou par sa position hiérarchique), que U 1 a un gain conjoint avec U 2 (il le manifeste explicitement à lacte 4) et quil finit par faire une concession à U 0 à lacte 6, la contrainte étant ici que tous les participants doivent être présents.

29 Exemple numérique Les valeurs des fonctions sont les suivantes par rapport au sujet S : P = G = Cette matrice Gain nest pas symétrique, elle peut évoluer au cours du dialogue si le sujet S change ou se modifie C(T1) = C(T2) =

30 Exemple numérique Au départ : G 0 (T1) = 1 – 0 = 1 G 0 (T2) = 1 – 0 = 1 G 1 (T1) = 0.5 – 1 = -0.5 G 1 (T2) = 0.5 – 0 = 0.5 G 2 (T1) = 0.5 – 0 = 0.5 G 2 (T2) = 0.5 – 1 = -0.5 Remarques : la date T1 ou T2 est indifférente pour U 0. Il peut subir une pression de la part de U 2 mais pas de U 1 pour changer de date. La date T1 ne convient pas à U 1 il peut subir une pression de la part de U 0 et de U 2. La date T1 peut convenir à U 2 mais pas T2, il peut subir une pression de U 0 (mais ressentie moins fortement que U 1 ).

31 Exemple numérique Pour la suite du dialogue on a : 1-U 0 : je vous propose une réunion sur le sujet S, à la date T1 Cet acte propose un intérêt pour le sujet S et fait subir une pression sur U 1 et U 2 pour la date T1 G 0 (T1) = 1– 0 = 1 G 1 (T1) = –0.8 = -0.5, G 1 (T2) = 0.5 G 2 (T1) = = U 1 : désolé je ne peux pas à T1 mais plutôt à T2 Cet énoncé exprime létat G 1 (T1) et fait subir une pression sur U 2 mais pas sur U 0 (car la concession est nulle) G 0 (T1) = 1– 0 = 1 G 1 (T1) = -0.5 G 2 (T1) = = 0.2, G 2 (T2) = U 0 : pourtant il faudrait que tout le monde soit présent Cet énoncé exprime une insistance de U 0 sur U 1 G 1 (T1) = = 0.3

32 Exemple numérique 4-U1 : OK mais jaimerais aussi que u2 soit présent Le gain G1 devient positif donc U1 acquiesce mais exerce une pression sur U2 pour augmenter son gain conjoint G2(T1) = = 0.4, G2(T2) = = U2 : pour moi pas de problème à T1 mais impossible à T2 Fait état de son gain positif et répond à U1 G1(T1) = = U1 : bon, je vais marranger pour venir La réunion a donc lieu à T1 avec les trois participants avec les gains (1, 0.8, 0.4)

33 Discussion Ce modèle de gestion de la négociation est relativement indépendant du modèle de tâche. Il travaille seulement sur létat du but de dialogue et il permet donc de séparer le gestionnaire de dialogue du gestionnaire de la tâche, cest-à-dire le quoi et le comment. La théorie des jeux est une alternative intéressante pour modéliser le dialogue et dépasser les deux types de modèles habituellement utilisés, le modèle intentionnel et le modèle conventionnel. Limites : les valeurs des paramètres, la numérisation

34 Jeu stratégique de dialogue Gestion des buts de dialogue Stratégies de dialogue

35 Le but du jeu Motive et oriente le dialogue Le but du dialogue est de maintenir une interaction conjointe U : "dessine un triangle" M : "pouvez-vous préciser ?" U : "équilatéral" M : "de couleur rouge ?" U : "peu importe" M : "OK" Dessine un triangle Pouvez-vous préciser ? Équilatéral De couleur rouge ? Peu importe OK

36 Le but du jeu On appelle but du jeu un état utile que désire atteindre lusager. Cet état concerne aussi bien un état mental de ce dernier (par exemple connaître une information, acquérir un savoir-faire) quun état du monde. On suppose quon peut représenter ce but à laide dun prédicat b U, par exemple : b U = ( x) Cercle(x) Rouge(x) Sur(x, Carré) Mettre un cercle rouge sur le carré b U = ( x) Cercle(x) C U (Ballon(x)) Savoir quun cercle représente un ballon

37 Évolution du but au cours du dialogue nouveau but : ?b, ce but vient dêtre exprimé par X, but atteint : b, létat de la situation rend le prédicat b vrai, but satisfait : b, X manifeste son accord explicitement ou implicitement sur b, but mis en attente : -b, lusager ou la machine résolvent temporairement un autre problème, but réparé : b, à la suite dune incompréhension le but est modifié, but déplacé : b, à la suite dun compromis le but est modifié, sous-but : sb, le problème est décomposé en sous-problèmes, but abandonné à la suite dun échec ou dun souhait dabandon.

38 Laction Les unités élémentaires sont les actes de langage de la forme Fp, avec : F A p : faire p (action), les effets immédiats obtenus sont p (déclaratif) F F p : faire-faire p, demande de faire p, les effets p sont différés (directif) F S p : faire savoir p, les effets sont obtenus immédiatement (assertif, F S (Ø) note un expressif) F FS p : faire faire-savoir p, demande information sur p, la réponse est différée F P p : faire pouvoir p, offre un choix fermé, la réplique est attendue parmi p (promissif) F D p : faire devoir p, oblige une action dont leffet sera p (directif)

39 Règles du jeu Consistance de U devant ses buts F S U b ¬b ?bU pose un nouveau but en le manifestant F S U b2 b1 -b1 ?b2 si U manifeste un deuxième but b2 alors quun autre but b1 est déjà en cours, on met ce dernier en attente (car on ne traite le dialogue que sur un fil, cest-à-dire échange par échange) b F S U na pas de raison de maintenir un but satisfait b ¬F S U b bsi un but est atteint et que U ne le conteste pas, il est satisfait de manière implicite b F S U un but est atteint et que U le conteste, on labandonne F S peut décider dabandonner un but de propos délibéré

40 Règles du jeu Consistance de U devant les buts de M b F U ples actes a de U sont motivées par le but courant ¬F U pla non-action est une incompréhension F S M b ¬b ?b si elle pose un but, il est accepté par U F P M b F S U bsi elle donne un choix à U sur les buts, celui-ci le fait F D M b F A U bsi elle donne une obligation à U sur le but, celui-ci le fait Les attentes sont motivées par lefficacité F A x p C y p les effets de lacte sont pris en compte par lallocutaire F F x p F A y p F FS y p lacte attendu est une contribution au FF demandé F P x p F D x p F A y p F F y p lacte attendu est un choix daction parmi ceux proposés F S x p C y p F FS y p une information est prise en compte ou clarifiée F FS x p F S y p F FS y p une question motive la réponse ou une demande de clarification

41 Gestion des buts F S b ¬b ?b un nouveau but est empilé et devient candidat à la résolution b b le but est atteint et marqué comme tel F S (b 1 ) (b 1 F S b 2 (b 1 b 2 )) b 1 le but est satisfait après accord explicite ou implicite de celui qui a posé le but (il est alors dépilé) F S M b b= sb ) ?b -b le but est déplacé par M pour des raisons de planification (il est empilé) F S M b b sb ) le but est déplacé par M pour des raisons motivées par la situation ou suite à un compromis ou à une réparation (il remplace b) ¬C M b le but est abandonné car M ne sait pas le résoudre (il est dépilé) ¬ F S U b le but est abandonné si U change davis ou sil est satisfait (il est dépilé)

42 Stratégie Manière de gérer un échange pour atteindre et satisfaire le but (les rôles peuvent changer au cours des échanges) Direction dajustement des buts Soit b X le but de X et b y celui de Y en début déchange. Au cours de léchange on peut avoir : b x au profit de b y : X est réactif (b y b x ) 2. Imposition de b x à Y : X est directif (b x b y ) 3. Partage des buts : X, Y sont coopératifs (b x b y ) 4. Recherche dun compromis : X, Y négocient (b x b b y ) 5. Détour constructif : X, Y font une incidence (b x Ø b y )

43 Gestion du dialogue Le « jeu de dialogue » est réglé par : des règles de choix de stratégies, des règles de comportement, un mécanisme de contrôle, des règles de reprise par des sous-dialogues, une ontologie de jeu (description des sous-jeux ou des étapes).

44 Réactif (R) Règle : mode réactif si le nombre de tours de parole depuis la précédente action (F A ) dépasse un certain seuil. Ce mode est également activé en cas de refus dune autre stratégie ou pour conclure un dialogue. Les conditions de complétude, de vérité et de réussite ne sont pas prises en compte. ( > 0) v F S U (réactif) v F S M (clôture) ( = réactif) Comportement : F A U p C M p U fait un acte, M en enregistre les effets F F U p Cond F (p) F A M p C M p U fait-faire un acte, M exécute et enregistre les effets ( ) attr(,p) = Ø) Défaut( ) si acte incomplet M complète par défaut ( ) attr(,p) ¬= Ø) p Plan Cond F (p) lacte doit pouvoir déclencher un Plan F S U p Cond S (p) C M p U donne une information, M lenregistre ( ) attr(,p) ¬= Ø) Cond S (p) F FS U p) C M p F S M p U pose une question, M y répond si elle connaît la réponse F P U p F D U p F A M p C M p M fait le choix proposé On pose : incomplet(p) = ( ) attr(,p) = Ø), nonvide(p) = ( ) attr(,p) ¬= Ø) complet(p) = ( ) attr(,p) ¬= Ø), lopérateur se lit « déclencheur de »

45 Directif (D) Règle : Au début linitiative est à la machine pour lui permettre de se présenter et de connaître son interlocuteur. Elle doit être pour cela en mode directif. Elle revient à ce mode dès quune incompréhension surgit (pour éviter le risque de bouclage ou dimpasse). (( = 0)) v (F S U (directif)) v (F S M (erreur)) ( = directif) Comportement : F A M p C M p C M C u p) M fait un acte et en enregistre les effets F F M p C M (F A U p) C M p M fait-faire un acte, U est supposé exécuter F S M p C M C u p) M donne une info. et suppose que U laccepte F FS M p F S U p v F FS U p M pose une question, et attend de U une réponse F S U p Cond S (p) C M p U donne une information, M lenregistre nonvide(p) Cond S (p) F S U (contestation) =négociation) si U conteste il y a changement de stratégie F FS U p C M p F S M p U pose une question de clarification, M y répond et reprend linitiative F D M p C M (F A U p) C M p M fait-faire un acte, U est supposé exécuter

46 Coopératif (C1) Règle : Pour un novice, une action est menée en coopération si elle est incomplètement spécifiée et si le nombre de tours de parole depuis la précédente action nest pas trop élevée. En situation de non-action, M propose une continuation au dialogue dans ce mode (relance). (( < 0) v (F S U (coop.)) (F S U p incomplet(p) C M (u,novice) ( = coopératif) ¬F U p ( = coopératif) Comportement : F A U p C M p F S M p U fait un acte, M en enregistre les effets et commente F F U p Cond F (p) F A M p C M p F S M p U fait-faire un acte, M exécute et commente incomplet(p) F S M p F FS M p si acte incomplet M explicite et questionne alors F FS M p F S U p complet(p) p Plan Cond F (p) lacte doit pouvoir déclencher un Plan F F U p ¬Cond F (p) F S M (¬p) F FS M p si lacte est erroné, M propose un but voisin F S U p Cond S (p) C M p F S M p U donne une information, M lenregistre et commente nonvide(p) Cond S (p) F FS U p F S M p U pose une question, M y répond si elle connaît la réponse, informe sinon F P U p F D U p F A M p C M p F S M p M fait le choix proposé et le commente ¬F U F P M p en cas de non action, M propose des choix à U Pour les cas où M a linitiative voir la stratégie directive

47 Coopératif (C2) Règle : Pour un expert et chaque fois que cela est possible, mais surtout en début de nouvel échange le dialogue sétablit en mode intentionnel dans le but pour M de se ramener à une situation prototypique. Lorsquune situation prototypique est identifiée, acceptée comme telle par U, le plan peut être exécuté. (F S U (coopératif) v (?b C M (u,expert) ( = coopératif) Comportement : F FS M b C U b F S U b C M b M pose une question sur le but, U y répond si elle connaît la réponse sinon F P M b F S U b C M b M propose des buts possibles et U choisit C M b b Plan ¬ b F A M Plan F FS M b M exécute le plan par anticipation et demande confirmation Pour les autres cas où M a linitiative voir la stratégie directive Pour les cas où U a linitiative voir la stratégie coopérative précédente

48 Négocié (N) Règle : Une action supporte la négociation si elle est incomplètement spécifiée et si le nombre de tours de parole depuis la précédente action nest pas trop élevée. La négociation est menée jusquà son terme, elle ne peut être rompue par la machine. (( < 0) v F S U (négocié)) F S U p incomplet(p) ( = négocié) Comportement : F A U p v F D U p = réactif) U fait un acte qui interrompt dautorité la négociation F P U p = coopératif) U fait un acte qui interrompt dautorité la négociation F F U p Cond N F A M p C M p U fait-faire un acte, M exécute sous condition Incomplet(p) F FS M p si acte incomplet M négocie F FS M p F S U p v (F S U (contestation) F S U p) (complet(p) p Plan) v (complet(p) p Plan) Cond N lacte négocié doit pouvoir déclencher un Plan ¬Cond N F FS M p si lacte nest pas exécutable, M continue de négocier F S U p Cond S (p) C M p U donne une information, M lenregistre si daccord nonvide(p) ¬C M (¬p) Cond S (p) ¬Cond(p) F S M p(contestation) F FS M p si linformation est erronée, M négocie F FS U p C M p F S M p U pose une question, M y répond Pour les cas où M a linitiative voir la stratégie directive

49 Constructif (K) Règle : La stratégie constructive sert surtout à alerter lusager ou à attirer son attention sur des sujets voisins de son propos. Elle peut être utilisée si le thème du dialogue na pas évolué depuis un certain temps et quaucune action nest été faite. Elle peut être utilisée enfin comme un moyen de détour. (( > 0) v (F S U (constructif)) (focus = constant)) ( = constructif) Comportement : F U p F S M p F FS M p ( = coopératif) pour tout acte de U, M le commente et pose une question dans un propos voisin, puis passe en stratégie coopérative F FS M p F S U p F U p ( = réactif))

50 Ontologie de (sous)jeux élémentaires Un sous-jeu est un jeu (par récursivité)

51 Exemple de dialogue C : Bonjour madameF P Douverture Je voudrais une chambre pour 2 nuits F F Ddemande-serv/exp. A : oui, pour quand ?F FS C termes(b1) C : pour les 13 et 14 prochains F S R termes A : les nuits du 13 et du 14 ?F FS D termes C : oui F S R termes A : voulez-vous une chambre avec bain ?F FS C termes(b2) C : oui pour deux personnesF S C termes A : jai une chambre à 50 F S Noffre-serv/exp. Ça vous convient ? C : vous navez pas moins cher ?F FS N modification A : non tout est completF S N modification C : bon… eh bien, daccordF F Nconcl-serv/accept. Où se trouve votre hôtel ? F FS Ddemande-serv/exp. A : cest facile, cest en face de la gareF S Coffre-serv/exp. Pouvez-vous me verser des arrhes ? F F Dconcl-serv/exec. C : oui bien sûr, voici le n° de ma carte VISAF A Rconcl-serv/exec. A : merci, je réserve la chambeF A Dconcl-serv/exec. C : au revoir, merci, à bientôtF D Rclôture Dialogue acte stratégie jeu

52 Le contrôle du dialogue Les rôles du contrôleur de dialogue sont : 1. Calcul des stratégies, 2. Gestion des buts, 3. Conduite des (sous)jeux et des interventions, 4. Pilote du système de dialogue, 5. Gestion de lapprentissage, 6. Calcul des tactiques de jeu 7. Gestion des conflits, des tours de parole et des sessions. Sous-jeu (et jeu élémentaire) C'est la séquence des interventions qui conduit à la satisfaction d'un but de dialogue (ou l'abandon en cas d'échec). Intervention C'est la séquence des actes qui porte sur le même sous-jeu. Acte Unité élémentaire daction.

53 Le contrôle du dialogue Le contrôleur gère les (Sous)Jeux et les Interventions à laide dun automate relativement simple qui maintient le but à travers les jeux et permet de passer dun jeu au suivant dès que le but courant est satisfait. La succession des (sous)jeux se cale sur lontologie. Dialogue Jeu-Ouverture. Jeu*.Jeu-Clôture Jeu Intervention* Intervention Acte*

54 Le cycle local USAGER MACHINE bUbU bUbU FUpFUp Niveau profond Niveau de surface cycle suivant Analyse pragmatique segmentation de lénoncé en actes de langages calcul de la composante locutoire (si échecsous-dialogue de clarification) Planification du jeu recherche du type illocutoire recherche du but (si échecsous-dialogue de réparation ou apprentissage) ordonnancement des buts en attente calcul du plan daction découlant des plans appris Planification du dialogue calcul de la stratégie calcul du comportement adéquat mise à jour du modèle utilisateur Génération des actes de la composante illocutoire : le type (quoi faire) de la composante locutoire : actants (quoi dire) de la composante perlocutoire : choix du degré de force illocutoire Mise à jour de lhistorique du dialogue via linterpréteur pragmatique du plan dactivité via le gestionnaire de tâches de la situation. FMpFMp FUpFUp mise en forme du plan daction

55 Exemple M1 : Bienvenue sur ICPtalkF P connaissez-vous le système ? F FS D?b1=C M (u) U : oui, un peuF S b1 (u=occasionnel) M2 : je vous présente ses principales fonctionsF P C1b1, ?b2=F F U (tâche) 1. lédition graphique...F S U : stopF F b2 je connaisF S b2 je veux ICPdrawF F ?b3=Run(ICPdraw) M3 : action (ICPdraw) (U : )F A Rb3, b3 que voulez-vous faire ?F FS C2?b4= C M (b) jattends votre intention généraleF S Dialogue acte stratégie but Jeu présentation Jeu dessin interv.

56 Exemple U : ()¬F S -b4 M4 : jattends une commande F P D?b5=C M (b) (b = sb) U : dessine un cercle rougeF F b5, ?b6 =b=(Cercle1) … M5 : action (dessin cercle)F A Rb6 U : un autre, noirF F b6, ?b7=(Cercle2) … M6 : où ? à droite du premier ?F FS Nb7=b7 A_droite… U : non, à gaucheF S b7=b7 A_gauche… M7 : identique au premier ?F FS Nb7=b7 (Taille…) U : ouiF S b7 M8 : actionF A b7 que représentent-ils ? des roues ?F FS C2b4 U : dessine un carré vertF F -b4, ?b8=(Carré1) … M9 : actionF A Rb8 Dialogue acte stratégie but interv.

57 Exemple U : et deux autres sur les cerclesF F b8,?b9=(Carré2) (Carré3) M10 : sur chacun des cercles F FS Nb9=Sur(Carré2,Cercle1)... U : non, superposésF S b9=b9 Réf M11 : je ne comprends pas ce mot F FS D-b9, ?b10= C M (Réf) U : lun sur lautreF S b10 M12 : bonF S Rb10 action (dessin)F A b9 oui, mais en vue de quelle figure ?F FS C2b4 U : un organigrammeF F b4, ?b10 =Dessin(Orga) M13 : ah ! je comprendsF S Rb4, b10 jaligne donc les figuresF A jéquilibre les espacesF A U : oui, merci, cest çàF S b10 sauve-çà maintenantF F ?b11=Sauver(Orga) M14 : voilà + actionF A Rb11 U : merci, cest toutF F b11 M15 : au revoirF D R Dialogue acte stratégie but Jeu sauvegarde Clôture incidence

58 Discussion Un modèle général basé sur la théorie des jeux stratégiques service = {jeux, tactiques} jeu = {but, sous-jeux} sous-jeu = {jeu, stratégies, règles} Récursivité : un sous-jeu est un jeu

59 Conclusion Au-delà des modèles intentionnels et conventionnels… théorie des jeux pour le dialogue. Cadre fécond.


Télécharger ppt "Jean Caelen Jeux dialogiques. Dialogue = jeu Jeu de langage = Wittgenstein en 1952 Théorie des jeux = Von Neumann et Morgensten « The Theory of Games."

Présentations similaires


Annonces Google