La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Introduction à la théorie des jeux

Présentations similaires


Présentation au sujet: "Introduction à la théorie des jeux"— Transcription de la présentation:

1 Introduction à la théorie des jeux
INA PG 2006 UV Grands Enjeux Économiques Contemporains Estelle Gozlan - INRA, UMR Economie Publique

2 Séance Introductive / Survol
1. En quoi consiste la théorie des jeux ? 2. D’où vient-elle ? 3. Que peut-elle apporter comme applications pratiques ?

3 1. En quoi consiste la théorie des jeux ?
On parle de jeu dés que des personnes interagissent : Vente aux enchères (avec les autres enchérisseurs) Fixation d’un prix par un vendeur (jeu avec les clients mais aussi avec ses concurrents) Négociation patron /syndicat Kroutchev et Kennedy lors de la crise des missiles de Cuba

4 Qu'est-ce qu'un jeu ? Définition : Un jeu est une situation où
des individus (les joueurs) sont conduits à faire des choix (actions) parmi un certain nombre d'actions possibles dans un cadre défini à l'avance (les règles du jeu).

5  grand nombre de situations de la vie courante peuvent être étudiées comme un jeu
Pourtant il ne faut pas attendre de la théorie des jeux la réponse à tous ces problèmes Théorie des jeux = description de ce qui se passe quand des personnes interagissent de manière rationnelle

6 La théorie des jeux peut être définie comme l’étude des modèles mathématiques de conflit et de coopération entre des décideurs intelligents et rationnels (Myerson 1991) Un joueur est dit rationnel s’il fonde ses décisions sur la poursuite de ses objectifs personnels Ex. maximisation de ses gains espérés

7 On utilise le langage issu des jeux de société (poker, échecs) pour discuter la logique de l’interaction stratégique Ne veut pas dire qu’on trouve amusantes ces situations… …mais qu’on essaye de se la représenter comme un problème soumis à une analyse rationnelle.

8 Réfléchir aux interactions stratégiques : pas toujours intuitif.
Raisonnement circulaire : 2 joueurs A et B Stratégie optimale de A dépend de la stratégie optimale de B (ou de l’idée qu’il s’en fait)… … et réciproquement !  Théorie des jeux (logique involutive) offre de nombreuses solutions inattendues.

9 A votre avis… Est-il possible qu’au sein d’un groupe, quelqu’un vote pour la proposition qui l’attire le moins et puisse considérer ce choix comme rationnel ? Est-ce une bonne idée, pour un général, de jouer à pile ou face pour choisir s’il attaque le jour-même ou le lendemain ?

10 Exemple : le vote stratégique
3 pays : l’Arabie Saoudite, le Koweït et le Venezuela forment un club de pays exportateurs de pétrole Ils envisagent d’accepter (ou pas) un seul nouveau membre 2 pays candidats: l’Irak et le Gabon

11 Chaque pays membre classe les possibilités par ordre de préférence:
Arabie Saoudite Koweït Venezuela 1. GABON 1. Personne 1. IRAK 2. Personne 2. GABON 3. IRAK 3. Personne

12 Pour se départager… Procédure de vote à deux tours :
1er tour : sélectionner le pays candidat 2ème tour : choisir de l’accepter ou pas Représentation du jeu par un arbre de décision

13 1. IRAK ou GABON ? Irak Gabon 2. IRAK ou Personne ? 2. GABON ou IRAK Personne GABON

14 S’il n’y a pas de vote stratégique, le Gabon va entrer dans le club :
Solution préférée de l’Arabie Saoudite, mais n°2 seulement pour les autres. Supposons maintenant que le Koweït choisisse l’IRAK au premier tour… …c’est à dire son dernier choix. Pourquoi ?

15 1. IRAK ou GABON ? Irak Gabon 2. IRAK ou Personne ? 2. GABON ou IRAK Personne GABON

16 Autrement dit, en choisissant l’alternative qui lui plaît le moins
… et en anticipant les votes des autres pays Le Koweït parvient finalement à la solution qu’il préfère (personne n’entre dans le club). Mais si les autres joueurs anticipent que le Koweït vote de manière stratégique ?

17 Pour le Venezuela, le résultat que personne ne rentre dans le club est le pire ;
Lui aussi va donc voter de manière stratégique au premier tour, et choisir le GABON (choix n°2) plutôt que l’IRAK (choix n°1) Pourquoi ?

18 1. IRAK ou GABON ? Irak Gabon 2. IRAK ou Personne ? 2. GABON ou IRAK Personne GABON

19 L’induction à rebours (algorithme de Zermelo)
Raisonnement utilisé pour voter de manière stratégique : Prédire ce qui va se passer dans l’avenir (ici, étape 2 du jeu) et d’en tenir compte pour les choix présents (étape 1). Induction à rebours : un des principes de base de résolution des jeux à plusieurs étapes  On commence tjrs par la fin, et on remonte dans l’arbre.

20 2. D’où vient la Théorie des Jeux ?
XIXème siècle : deux économistes français, Cournot puis Bertrand, formalisent l’interaction stratégique d’entreprises en concurrence sur un marché Mais vraie naissance de la th. des jeux (1944) The theory of games and economic behavior Von Neumann et Morgenstern

21 VNM  Distinction entre deux approches très différentes :
L’approche stratégique ou Théorie des Jeux NON COOPERATIFS L’approche en termes de coalitions ou Théorie des Jeux COOPERATIFS

22 Jeux non-coopératifs Les plus étudiés Principe :
On détermine ce que les joueurs peuvent faire au cours du jeu (Règles du jeu) On recherche une stratégie optimale pour chaque joueur Ce qui est optimal n’est pas tjrs immédiat… Dépend de ce qu’on pense être la stratégie optimale de l’adversaire

23 Cas particulier résolu par Von Neumann & Morgenstern :
Jeux à somme nulle (ou strictement compétitifs) = jeux à 2 joueurs dans lesquels tout gain d’un joueur est immédiatement compensé par une perte correspondante de l’autre Ex. échecs, poker…

24 Théorie des jeux coopératifs
Approche coalitionnelle Principe : cherchent à décrire le comportement optimal dans les jeux à plusieurs joueurs. … beaucoup + difficile  VNM n’ont pas cherché à indiquer la stratégie optimale pour chaque joueur Mais une classification des modèles de coalitions correspondant à un comportement rationnel

25 D’où vient la th. des jeux (suite)
Début des années 50 : John Nash (mathématicien) l’équilibre dans les stratégies (jeux non coop.) … idée déjà suggérée par Cournot (1832), mais sur laquelle VNM avaient buté (d’où leur limitation aux jeux à somme nulle)

26 Equilibre de Nash Outil le + important de la théorie des jeux
Déf. L’équilibre de Nash se produit lorsque le choix stratégique de chaque joueur est la meilleure réponse aux choix stratégiques des autres joueurs

27 Equilibre de Nash (suite)
Implication : on est à l’équilibre (de Nash) si aucun joueur n’a intérêt à dévier unilatéralement de cette situation … c. à d. qu’aucun joueur n’a moyen d’agir individuellement pour améliorer ses gains.

28 3. Que peut apporter la théorie des jeux ?
Applications en économie Applications en sciences politiques Applications en biologie (Applications en philosophie sociale) … quelle fonction objectif ?

29 Applications en économie
Degré de concurrence sur un marché peut varier d’une situation de monopole (firme unique) à ce qu’on appelle la concurrence parfaite. Déf. de la concurrence parfaite: firmes suffisamment nombreuses sur un marché donné pour qu’aucune n’ait individuellement de pouvoir de marché, c. à d. d’influence sur les prix. Rarement le cas en pratique… (mais utile comme situation de référence)

30 Applications en économie (suite)
Très souvent, un nombre réduit de firmes (oligopole) qui ont conscience que leurs profits dépendent non seulement de leurs propres choix (prix, quantités produites) mais également de ceux de leurs concurrents Marchés en concurrence imparfaite sont caractérisés par des interactions stratégiques entre firmes

31 Applications en économie (suite)
Modèle de l’Oligopole de Cournot : N firmes sur un marché On suppose le même coût unitaire c pour toutes Toutes doivent choisir simultanément un niveau de production (quantité) qi La quantité totale offerte Q=q1 +…qi +… +qN détermine le prix de marché p

32 L’oligopole de Cournot
Propriété de la F° de demande (sauf pour des catégories de biens particuliers): décroissante avec le prix. Ex. très simple (linéaire): D(p)= a – p Le prix de marché s’ajuste de manière à ce que l’offre totale Q = la demande  Q = a - p ou de manière équivalente p= a - Q

33 L’Oligopole de Cournot (suite)
Les firmes sont des agents rationnels, leurs stratégies sont cohérentes avec leurs objectifs… Objectif pour chacune : maximiser son profit Le profit dépend non seulement de sa propre stratégie, mais de celle des autres  situation de jeu stratégique (non-coopératif)

34 Oligopole de Cournot (suite)
Fonction objectif à maximiser : i = (p – c)* qi = (a-Q-c)* qi à l’équilibre L’effet d’augmenter son volume de production a deux effets sur le profit : Augmenter ses ventes (+) Faire baisser le prix d’équilibre (-) Marge unitaire

35 Cournot (suite): meilleure réponse
La meilleure réponse que puisse faire la firme i aux choix stratégiques des autres entreprises est de choisir qi tel que : i /qi = 0 Exercice : déterminer les fonctions de meilleure réaction et l’équilibre de Nash dans le cas d’un duopole de Cournot.

36 Applications en sciences politiques
Moins d’impact de la th. des jeux en Sc. Politiques qu’en éco. Comportements moins rationnels quand il s’agit d’idées et non d’argent ?? Quelques applications : modèles de vote stratégique, choix d’un mode de scrutin, choix d’un programme électoral, etc. Littérature

37 Ex. choix d’un programme
On suppose 2 partis politiques : «Formaliste » et «Idéaliste » Aucun n’a de principe: seul le pouvoir les intéresse, et ils choisissent un programme électoral avec pour seul objectif de maximiser leur nombre de suffrage aux prochaines élections

38 Ex. choix d’un programme électoral (suite)
Les électeurs, au contraire, ne se déterminent qu’en fonction des principes, et ne sont pas fidèles à un parti. Représentation des opinions : réel x dans un intervalle [0,1] Hyp. Distribution uniforme des opinions

39 Choix d’un programme électoral (suite)
Choix d’un programme = choix d’une position sur le spectre politique Electeurs votent pour le parti dont le programme se rapproche le + de leurs principes.  Exercice : représentation graphique

40 Choix d’un programme électoral (suite)
Hypothèse: les chefs de partis interviennent de manière séquentielle pour annoncer leur programme. Parti Idéaliste d’abord Parti Formaliste ensuite Quelle est la meilleure strategie du parti « Idealiste » ? (utiliser l’induction à rebours)

41 Applications en biologie
Livre « Evolution and the Theory of Games », Maynard Smith 1982 Ex : Lepomis macrochirus (poisson) 2 types de mâles: Casanier : délai de 7 ans pour parvenir à maturité sexuelle / attire les femelles / féconde les œufs et s’occupe des petits Opportuniste : 2 ans / guette la ponte et se précipite pour fertiliser avant le Casanier / le laisse s’occuper des petits

42 Applications en biologie (suite)
Théorie des jeux permet d’expliquer pourquoi les deux types de mâles parviennent à coexister dans des proportions fixes Lac avec N mâles 2 stratégies possibles (casanier, opportuniste) Objectif: transmettre ses gènes à un max. de descendants

43 Applications en biologie (suite)
Gain d’un joueur dépend des stratégies choisies par les autres Si bcp de casaniers, la meilleure réponse est d’être opportuniste S’il bcp d’opportunistes, être casanier est une meilleure stratégie (car difficulté de trouver quelqu’un à cocufier)

44 Applications en biologie (suite)
Équilibre de Nash : qd la proportion de joueurs de chaque type atteint des proportions telles que chaque joueur devient indifférent entre l’une ou l’autre des stratégies. Les poissons n’état des optimisateurs rationnels capables de choisir les gènes à porter, comment expliquer que les deux types de mâles coexistent ?

45 Applications en philosophie sociale
Théoriciens des jeux tentent de montrer de manière formelle que même les pires égoïstes finiront par considérer qu’il va de leur propre intérêt à long terme d’avoir des bonnes relations avec leur entourage  Équilibres de jeux répétés … déjà énoncé par philosophe David Hume au XVIIIème siècle !

46 Jeux non coopératifs : nomenclature et concepts de solution

47 Jouer … Théorie des Jeux: Outils :
- Description de l’interaction stratégique - Vous êtes dirigé par votre intérêt personnel (rationnel & égoïste) - … comme les autres joueurs Outils : Reconnaissez que vous êtes dans un jeu Identifiez le type de jeu Reconnaissez toutes les issues possibles Manipulez la structure du jeu

48 Structure d’un jeu L’environnement stratégique Les règles du jeu
Les joueurs Les stratégies Les gains Les règles du jeu Timing (ordre des mouvements) Nature du conflit et de l’interaction Quelle information ? Possibilité de passer des accords ou des contrats Les hypothèses Rationalité Connaissance commune (common knowledge) Parfaite: chaque ensemble d’information est un singleton; Complète: la nature ne joue pas en premier, ou bien son mouvement est observé par tous les joueurs

49 L’environnement stratégique
Joueur : n’importe qui ayant une influence sur vos gains (evt. Le hasard) Stratégie : Plan d’action complet Spécifie une décision pour tous les cas possibles Gains : valeurs associées à chaque issue possible du jeu Rq. GAINS ESPERES si les issues du jeu sont aléatoires

50 Les règles du jeu Timing du jeu Nature du conflit et de l’interaction
Mouvements des joueurs sont-ils simultanés ou séquentiels ? Ordre ? Nature du conflit et de l’interaction Intérêt des joueurs = conflit ou coopération ? Joueurs interagissent une seule fois ou de manière répétée ? Information y-a t’il Information complète ? Des avantages informationnels ? Possibilités ou non de favoriser la coopération ? (contrats, accords…)

51 Les hypothèses Rationalité : Connaissance commune :
Tous les joueurs cherchent à maximiser leurs gains Tous savent parfaitement calculer Connaissance commune : Chaque joueur connaît les règles du jeu Chaque joueur sait que chaque joueur connaît les règles du jeu… Chaque joueur sait que chaque joueur sait que chaque joueur connaît les règles du jeu… Etc…

52 Forme d’un jeu Forme normale (ou stratégique) d’un jeu :
Représentation sous forme d’une matrice des gains (simple énumération des stratégies et des gains qu’elles engendrent) Forme extensive : Représentation sous forme d’un arbre de décision (détaille chaque coup possible et l’état de l’information des joueurs au cours du jeu)

53 Conflit ou coordination ? Les exemples classiques

54 Ex. jeu à somme nulle Pile Face -1, 1 1, -1
« Matching Pennies » : Jeu de conflit pur Pile Face -1, 1 1, -1 Ce qu’un joueur gagne est perdu par l’autre ils n’ont aucun intérêt à la coopération

55 EX. Bataille des sexes Match de foot Concert 2, 1 0, 0 1, 2
Éléments de conflit et de coopération Match de foot Concert 2, 1 0, 0 1, 2 Chaque joueur a une solution préférée qui s’oppose à celle de l’autre … mais s’ils ne coopèrent pas l’issue est préjudiciable aux deux

56 Ex. Dilemme du prisonnier
Exemple historique à l’origine de tous les exemples de coopération Nier (coopératif) Avouer & dénoncer (non coopératif) 3, 3 -1, 4 4, -1 0, 0

57 Ex. le rendez-vous mal fixé…
Jeu de coordination pure Café du coin Chez Bill Chez Bob 1 , 1 0 , 0

58 Ex. Jeu de la poule mouillée (chicken game)
Jeu d’anti-coordination Tout droit Eviter -1, -1 10, 0 0, 10 5, 5

59 Concepts de Solution

60 Comment résoudre un jeu?
Trouver Equilibre(s) en stratégies pures pour l’instant (vs. stratégies mixtes) 1. Equilibre en stratégies dominantes Nécessite que chaque joueur ait une stratégie dominante 2. Elimination successive des stratégies dominées 3. Cas particulier des jeux à somme nulle 4. Inspection de toutes les issues possibles au cas par cas pour voir s’il existe une déviation profitable (examiner toutes les cellules du tableau dans un jeu à forme normale)

61 Solutions : l’équilibre
Qu’est-il susceptible de se produire quand des joueurs rationnels interagissent dans un jeu ? Le type d’équilibre qui émerge dépend du jeu: Simultané ou séquentiel Information parfaite ou non … mais le concept reste toujours le même : Chaque joueur joue sa meilleure réponse aux actions des autres joueurs Il n’y a pas de raison de dévier unilatéralement de l’équilibre L’équilibre émerge de lui-même

62 Ex. Publicité dans l’industrie US du tabac
Aux Etats-Unis tous les producteurs de cigarettes fasaient bcp de publicité à la TV L’Etat s’inquiète et émet un avertissement : Fumer peut nuire à la santé Réaction des vendeurs de tabac Crainte de poursuites judiciaires Les firmes parviennent à un accord Elles affichent le danger lié à la consommation de cigarettes sur les paquets et cessent la pub à la télé en échange de l’absence de poursuite férérales. 1964 1970

63 Représenter l’Interaction stratégique :
Joueurs: Reynolds et Philip Morris Stratégies: { Publicité , Pas de publicité } Gains: Profits Chaque firme gagne $50 millions des ventes à ses consommateurs La publicité coûte $20 millions à chaque firme La pub permet de prendre $30 millions à son concurrent Comment représenter ce jeu ?

64 Représentation du jeu en forme normale
JOUEURS Philip Morris Pas de pub Pub Reynolds 50 , 50 20 , 60 60 , 20 30 , 30 STRATEGIES GAINS

65 Quelle stratégie adopter ?
Meilleure réponse de Reynolds: Si Philip Morris fait de la pub : faire de la pub Si Philip Morris n’en fait pas : faire de la pub Quelle que soit la stratégie qu’il pense que Philip Morris va adopter, sa meilleure réponse est : Faire de la pub

66 Concept de stratégie dominante
= Une stratégie qui génère de meilleurs gains que tous les autres choix possibles, quelle que soit la stratégie de l’adversaire. “Faire de la pub” est strictement dominant pour la firme 1 si : P(Pub,Pas de Pub)>P(Pas de pub, Pas de pub) P(Pub,Pas de pub)>P(Pas de pub, Pas de pub) “Faire de la pub” est faiblement dominant pour la Firme 1 si : Certaines inégalités sont faibles (), Au moins une est forte (>)

67 Définition : Equilibre en stratégie dominante
Si dans un jeu Chaque joueur a une stratégie dominante …et la joue Alors cette combinaison de stratégies et les gains qui lui sont associés constituent un équilibre en stratégie dominante de ce jeu

68 Résolution en cas de dominance
COMMANDEMENT Si vous avez une stratégie dominante, jouez-la. Attendez-vous à ce que votre adversaire joue sa stratégie dominante s’il en a une.

69 Pub. Sur le marché du tabac (fin)
Après l’accord de 1970, les dépenses publicitaires liées au tabac ont baissé de $63 millions Profits ont augmenté de $91 millions  l’accord a permis de sortir d’une situation de DILEMME DU PRISONNIER Un équilibre de Nash n’est pas forcément efficace (optimum de Pareto)

70 Résolution lorsqu’il n’y a pas dominance au sens strict
Deux firmes en concurrence Paris Match et L’Express doivent choisir l’événement à afficher à la Une. Les deux événements de la semaine sont: Un mariage princier (stratégie M), et Un attentat contre l’ONU en Irak (stratégie O) Les deux magazines hésitent quant au choix de la Une

71 Une stratégie dominante
L’Express O M Paris Match 100 , 100 0 , 90 80 , 100 80 , 90 Qui a une stratégie dominante ? Supposons que cette stratégie sera jouée L’autre joueur va réagir en conséquence

72 L’Express O M Paris Match 100 , 100 0 , 90 80 , 100 80 , 90
0 , 90 80 , 100 80 , 90 Pour L’ Express : O dominante ; M dominée Stratégie dominée: Il existe une autre stratégie qui rapporte de meilleurs gains quelle que soit la réaction du concurrent

73 2. Résolution par Elimination des stratégies dominées
L’Express O M Paris Match 100 , 100 0 , 90 80 , 100 80 , 90 Donc la solution de ce jeux est {M,O}

74 Elimination successive des stratégies dominées
Une stratégie est dominée si elle procure au joueur des gains toujours inférieurs à ceux associés à au moins une autre de ses stratégies. Méthode : une manière de déterminer les équilibres d'un jeu consiste à éliminer en premier toutes les stratégies dominées puis à rechercher les équilibres dans le jeu ainsi réduit.

75 EXERCICE : REDUIRE LE JEU PAR ELIMINATION SUCCESSIVE DES STRATEGIES DOMINEES
Joueur 2 Joueur 1 X Y Z A 10 , 10 14 , 12 8 , 14 B 4 , 4 10 , 5 8 , 4 C 7 , 8 18 , 9 9 , 7

76 3. Jeux à somme nulle à 2 joueurs: le critère du minimax
Certains de ces jeux n'ont pas d'équilibre en stratégies dominantes Pour ces jeux, VN a développé un concept de solution connu sous le nom du minimax. Jeu à somme nulle: ce qui est gagné par l'un est perdu par l'autre. Chaque joueur a donc en même temps intérêt à minimiser le gain de l'adversaire et à maximiser le sien. Maximiser son gain dans la situation la plus défavorable (imposée par l’adversaire) permet de se garantir au moins un gain minimum. As early as 1928, von Neumann introduced the minimax solution for a two-person zero-sum game. According to the minimax solution, each player tries to maximize his gain in the outcome which is most disadvantageous to him (where the worst outcome is determined by his opponent's choice of strategy). By means of such a strategy, each player can guarantee himself a minimum gain. Of course, it is not certain that the players' choices of strategy will be consistent with each other. von Neumann was able to show, however, that there is always a minimax solution, i.e., a consistent solution, if so-called mixed strategies are introduced. A mixed strategy is a probability distribution of a player's available strategies, whereby a player is assumed to choose a certain "pure" strategy with some probability.

77 A\B X Y Z 1, -1 -3, 3 -2, 2 0, 0 -1, 1 -4, 4 2, -2

78 Jx à somme nulle: le minimax (suite)
Par exemple, dans l'exemple précédent, le joueur B maximise son gain en jouant y si A joue x, z si A joue y et x si A joue z. Donc, le joueur A doit minimiser le gain de B parmi les couples de stratégies (x, y) qui donne un payoff de 3 à B, (y, z) qui donne un payoff de 1 à B et (z, x) qui donne un payoff de 4 à B. Donc A joue y et l'équilibre du jeu est (y,z).

79 Jx à somme nulle: le minimax (fin)
Un tel équilibre de minimax en stratégie pure est reconnaissable parce qu'il procure un gain maximal pour A dans la colonne choisie par B et un payoff maximal pour B dans la ligne choisie par A. Un tel équilibre en stratégies pures n'existe pas toujours, par exemple : VNM ont démontré l'existence d'au moins un tel équilibre lorsqu'on étendait l'espace des stratégies aux stratégies mixtes (que nous verrons plus loin). Ce résultat est connu sous le nom de théorème du minimax. X Y 1, -1 0, 0 -1, 1

80 Pertinence des critères minimax et maximin ?
Jeux à somme non nulle : plus pertinents en économie (gains à l’échange…) Pertinence des critères minimax et maximin ? Minimax: stratégie des sadiques Maximin: stratégie des paranoïaques

81 Jusque-là on n’a regardé comment trouver la solution uniquement
Lorsqu’il y a des stratégies dominantes / dominées Pour le cas particulier des jeux à somme nulle à 2 joueurs Cas particuliers pour lesquels il existe une solution assez simple : lorsqu’il existe une stratégie dominante, il n’est pas nécessaire de faire des hypothèses sur la stratégie de son adversaire pour déterminer sa meilleure réponse.

82 Mais beaucoup de jeux ne peuvent pas se résoudre de cette manière.
Que faire dans les autres cas ? On se limite pour l’instant aux jeux statiques (en 1 coup) en information parfaite

83 Problème : introduire des hypothèses pour trouver des solutions dans des jeux à somme non-nulle quand il n’y a pas de stratégie dominante : Introduire des restrictions sur la façon dont les joueurs prennent leurs décisions Et sur leur connaissance de la manière dont les autres joueurs prennent leurs décisions …alors qu’un équilibre en stratégies dominantes requérait uniquement l’hypothèses que les joueurs cherchaient à maximiser leur utilité RQ. Ecart théorie/ pratique

84 L’équilibre de Nash n’est pas réellement un concept de solution
… car ne permet pas forcément de sélectionner une combinaison de stratégies comme étant « LA » solution Il vous indique simplement quelles caractéristiques la solution doit avoir, et permet d’éliminer certaines solutions non crédibles Les joueurs savent que s’ils sont dans cette situation, ils n’ont pas intérêt à en bouger

85 Mais ça reste insatisfaisant à plusieurs titres :
Il n’y a pas forcément d’équilibre de Nash (en stratégies pures) Comment choisir lorsqu’il en existe plusieurs ?  Pas de valeur prédictive

86 4. Inspection cellule par cellule
Le concept d'équilibre de Nash nous dit qu'aucun joueur n'aura d'incitation à dévier dans une configuration stratégique donnée : regarder pour chaque cellule s’il peut s’agir d’un équilibre. Il ne nous dit pas comment ou pourquoi on est parvenu à cette configuration. Exercice : chercher les équilibres de Nash dans les jeux « matching pennies », « dilemme du prisonnier », « bataille des sexes », etc.

87 Certains équilibres de Nash semblent intuitivement raisonnables…
Et ce critère permet de réduire au moins (parfois beaucoup) le nombre d’issues possibles du jeu Théorème de Nash: tout jeu fini = jeu avec un nombre fini de joueurs et de stratégies pures pour chaque joueur a au moins un équilibre de Nash (éventuellement en stratégies mixtes)

88 Conclusion sur l’équilibre de Nash comme concept de solution
Solution « rationnelle » d’un jeu portée très générale Mais a ses limites : Pas forcément unique Il n’y a pas toujours d’équilibre en stratégies pures Critères de raffinement, points fixes…

89 Information parfaite et stratégies mixtes
Jeu à information parfaite : à tout moment du jeu, chaque joueur qui doit prendre une décision est parfaitement au courant de ce qui se passe. Ex. échecs Nombreux cas où l’information est cachée au moins pendant un certain temps Ex. jeu de cartes : on ignore le jeu de l’adversaire Cas particulier : actions simultanées  jeux à information presque parfaite

90 Information parfaite et stratégies mixtes (suite)
Nouvel élément à prendre en compte dans jeux à information imparfaite : L’affectation de probabilités aux décisions Ceci revient à associer à l’ensemble original des stratégies pures, une distribution de probabilités appelée stratégie mixte.

91 Intuitif : ceci n’a aucun intérêt dans un jeu à information parfaite
Par contre cela prend un sens lorsque les joueurs ont une info. privée à dissimuler : Ex. Choix des couleurs aux échecs : Seule stratégie des deux joueurs : choisir au hasard (affecter une proba ½) la main où cacher le pion ; idem pour le choix de celui qui devine. … sinon ? Toute autre stratégie pourrait être exploitée par un adversaire bien informé

92 Equilibre en stratégies mixtes
Définition : stratégie où le joueur choisit avec une certaine probabilité entre plusieurs possibilités c. à d. Distribution de probabilité sur l'ensemble des stratégies pures du jeu. Dans certains jeux, seules les stratégies mixtes sont optimales

93 Ex. jeu à somme nulle Paul Simon A B 1 , -1 6 , - 6 4 , - 4 3 , - 3
1 , -1 6 , - 6 4 , - 4 3 , - 3  PAS D’EQUILIBRE EN STRATEGIES PURES

94 Equilibre en stratégies mixtes
On va chercher alors si un mélange judicieux des deux tactiques élémentaires (A et B) n'améliorerait pas les espérances de gain de chacun des joueurs chaque joueur, voulant éviter d'être deviné par son adversaire, va tirer au sort le choix de ses tactiques, dont l'adoption produit, dans le jeu ainsi transformé, un équilibre Théorème de von Neumann: un tel équilibre existe et indique comment le calculer

95 A l’équilibre, chacun des adversaires a trouvé la meilleure façon pour lui de maximiser son espérance de gain ou de minimiser ses risques de perte Simon choisit : tactique A avec une probabilité Y tactique B avec une probabilité 1 – Y Paul : tactique A avec une probabilité X tactique B avec une probabilité 1 – X Découvrir la stratégie optimale de Simon et de Paul revient à trouver les valeurs de X et de Y qui constituent un point d'équilibre pour le jeu, en ce qu'elles maximisent l'espérance de gain ou minimisent le risque de perte de chaque joueur.

96 L'espérance de gain de Paul:
- 1X - 6(1 - X) si Simon jouait A - 4X - 3(1 - X) si Simon jouait B Puisque Paul cherche à optimiser ses espérances de gain quoi que fasse Simon, on écrit que les deux valeurs de ses espérances sont égales : 1X - 6(1 - X) = - 4X - 3(1 - X)  X=1/2

97 L'espérance de gain de Simon:
1Y + 4(1 - Y) si Paul jouait A 6Y +3(1-Y) si Simon jouait B Même raisonnement : 1Y + 4(1 - Y) = 6Y +3(1-Y)  Y=1/6 D’où l’équilibre en stratégies mixtes: {(1/2, 1/2), (1/6, 5/6)}

98 Stratégies mixtes (CCL)
par l'introduction du hasard mathématique dans le calcul stratégique, on change la nature même du problème qui est soumis à l'intelligence des joueurs: la stratégie, au lieu d'être l'art d'inventer une parade à la conduite empiriquement observée de l'adversaire, devient l'art de mêler au hasard, dans des proportions mathématiquement calculables, les tactiques élémentaires dont on dispose.

99 Réflexions sur les solutions coopératives et non coopératives

100 L’équilibre en stratégies dominantes est un équilibre non-coopératif
La solution non-coopérative n’est pas forcément la plus efficace (optimale) La solution coopérative d’un jeu est la liste des stratégies et des gains associés que les joueurs choisiraient s’ils étaient capables de s’engager de manière crédible à coopérer.

101 Jeu à deux joueurs Ex. La tragédie des biens communs 2 pêcheurs
Poisson = ressource commune limitée Chacun peut choisir un niveau de prélèvement xi =1 : effort de pêche limité xi =2: effort de pêche élevé

102 Ex. la tragédie des communs
Le gain de chaque pêcheur dépend De son propre niveau de pêche xi De la quantité totale prélevée X=x1+x2 (plus l’effort de pêche est important, plus la ressource est rare)

103 La tragédie des communs
X2 =1 X2 =2 X1 =1 3 , 3 2 , 4 X1 =2 4 , 2 2 , 2

104 La tragédie des communs
Pour chaque joueur, la stratégie xi =1 est faiblement dominée par la stratégie xi =2 Le jeu est presque équivalent à un dilemme du prisonnier, mais pas tout à fait : Les stratégies permettant l’issue la + favorables sont dominées, mais faiblement (contrairement à un DP)

105 « Dilemmes sociaux » Le dilemme du prisonnier, le jeu de la pub, la tragédie des communs, la contribution volontaire à un bien public, etc… sont dits des situations de dilemme social : La poursuite pas chaque agent de ses intérêts égoïstes ne conduit pas à l’optimum collectif …(propriété de l’équilibre général en économie, mais avec l’hypothèse d’absence d’interactions stratégiques)

106 Comment permettre l’émergence de la coopération ?
Contrats, transferts…  on sort du cadre non-coopératif Répétition du jeu Ex. Dilemme du prisonnier réitéré La coopération peut-elle émerger spontanément entre des individus " égoÏstes " gouvernés uniquement par la rationalité économique ? ESSAYEZ !

107 Jeux dynamiques

108 2 types de jeux dynamiques
Lorsque l’interaction des joueurs est elle-même dynamique: observent le mouvement des autres joueurs avant de jouer  jeux séquentiels Répétition d’un jeu statique : joueurs observent l’issue du jeu précédent avant de jouer  jeux répétés

109 Concept de solution Forme extensive plus adaptée à la représentation des jeux dynamiques But : montrer que le concept d’équilibre de Nash n’est pas satisfaisant pour ce type de jeux… Car il ignore la structure séquentielle de la prise de décision. Certains équilibres d’un jeu en forme normale ne le sont plus dans le jeu en forme extensive.

110 Jeu et sous-jeux Sous-jeu: dans un jeu à plusieurs coups, partie du jeu qui forme à elle seule un jeu. Représentation par un arbre de jeu: un sous-jeu est une partie de celui-ci qui est elle-même un arbre, formé de nœuds dont un nœud initial et toutes les branches qui en sont issues

111 Ex.

112 Équilibre parfait en sous-jeux
La notion de sous-jeux intervient essentiellement dans la définition d’un équilibre parfait Equilibre parfait : combinaison de stratégies (conditionnelles) qui forment un équilibre de Nash pour le jeu dans son ensemble, mais aussi pour chacun de ses sous-jeux.

113 Equilibre Parfait en sous-jeux
(subgame perfect equilibrium) = Raffinement de l’équilibre de Nash permettant d’éliminer certaines solutions non crédibles

114 Exemple Marché et deux firmes A et B envisageant d’y entrer; profitable seulement pour une firme (situation de monopole naturel) Pourquoi ? Jeu séquentiel : A décide d’abord d’entrer ou pas, puis B Information parfaite

115 A B N’ entre pas Entre N’entre pas (0, 50) (-10, -10) (50, 0) (0, 0)

116 Ce jeu comporte trois sous-jeux
Les 2 où B doit choisir d’entrer ou pas Le jeu tout entier En appliquant la méthode de l’induction à rebours, on obtient l’équilibre parfait: {A entre; B n’entre pas} Toutefois ce n’est pas le seul jeu équilibre de ce jeu…

117 Firme A choisit entre 2 actions (entrer ou non)
Firme B aussi  4 stratégies dont 2 conditionnelles : Entrer quelle que soit la décision de A Ne pas entrer quelle que soit la décision de A Faire la même chose que A Faire le contraire de A Equilibres en stratégies pures: déterminer pour chaque firme la meilleure réponse à la stratégie de l’autre Chaque firme agit rationnellement étant donné ses croyances sur la stratégie de l’autre firme Stratégie conditionnelle =joueur conditionne son action à l’action précédente

118 Même jeu dans sa forme stratégique (normale)
Toujours entrer Ne jamais entrer Imiter le choix de A Faire le contraire de A Entre (-10,-10) (50,0) (50, 0) N’entre pas (0, 50) (0,0) La firme B menace d’entrer quel que soit de choix de A. Si A croit cette menace, elle n’entre pas B promet de ne jamais entrer  si A la croit, elle entre. B promet de toujours faire le contraire de A  si A la croit, elle entre Dans chacun de ces éq. Firme agissent rationnellement en fonction de leurs croyances; mais ne dit rien sur la rationalité de ces croyances PROBLEME DE CREDIBILITE DES MENACES/promesses ? Bluff ?

119 La combinaison de stratégies {n’entre pas, toujours entrer} est un équilibre de Nash du sous-jeu qui commence après que A a choisi de ne pas entrer Mais cet équilibre n’est pas parfait en sous-jeux , car ce n’est pas un équilibre dans le sous-jeu qui commence après que A a choisi d’entrer

120 Induction à rebours Permet d’éliminer les stratégies non crédibles (ex. menace de toujours entrer quelle que soit la stratégie de A : pas crédible) Principe de l’induction à rebours = celui de l’élimination itérative des stratégies dominées appliquée aux jeux en forme extensive. Permet d’obtenir l’équilibre parfait en sous-jeux.

121 Jeux en forme extensive avec information parfaite: Définition
C’est une description détaillée de la structure séquentielle d’un problème de décision de joueurs dans une situation stratégique. Il y a info. parfaite si chaque joueur, au moment de prendre sa décision, est parfaitement informé de tous les événements antérieurs.

122 Jeux en forme extensive avec information parfaite: Composantes du jeu
Un ensemble N des joueurs Un ensemble H des séquences (fini ou infini) vérifiant 3 propriétés : La séquence vide Ø est membre de H Si (a k)k=1,…,K  H et L < K alors (a k)k=1,…,L  H Si une séquence infinie (a k)k=1,… vérifie (a k)k=1,…,L  H pour tout L entier positif, alors (a k)k=1,…  H .

123 Jeux en forme extensive avec information parfaite:
Jeux en forme extensive avec information parfaite: les composantes (suite) Chaque élément de H est une histoire; chaque composante d’une histoire est une action d’un joueur. Une histoire (a k)k=1,…,K  H est terminale si elle est infinie ou si il n’existe pas de a k+1 telle que (a k+1)k=1,…,k+1  H . L’ensemble des histoires terminales est noté Z

124 Jeux en forme extensive avec information parfaite:
Jeux en forme extensive avec information parfaite: les composantes (suite) Une fonction P qui assigne à chaque histoire non terminale un membre de N : P(h) étant le joueur qui choisit une action après l’histoire h. (Pour chaque joueur iN, une relation de préférence sur Z notée i)

125 Si l’ensemble H est fini: jeu fini
Si la longueur de chaque histoire est finie: jeu à horizon fini Ex. très simple de l’allocation de deux objets identiques et indivisibles à deux personnes; Joueur 1 propose une répartition Joueur 2 accepte ou refuse

126 1 2 (2,0) (0,0) (1,1) (0,2) A Accepte Refuse R

127 Le jeu extensif qui modélise cette situation:
{N,H,P,(i)} avec N={1,2} H = {Ø, (2,0), (1,1), (0,2), ((2,0),A), ((2,0),R),…etc} : 10 histoires P(Ø)=1 et P(h)=2 pour toute histoire non-terminale différente de Ø ((2,0),A)1((1,1),A) 1 ((0,2),A)~1 ttes les autres ((0,2),A)2((1,1),A) 2((2,0),A)~2 ttes les autres

128 Dans un jeu extensif à info parfaite :
Une stratégie pour un joueur iN est une fonction qui assigne une action à chaque histoire h non-terminale pour laquelle P(h)=i Diffère d’un plan d’action en cela qu’elle doit spécifier une action dans tous les cas (même impossibles)

129 Ex. Le joueur 1 a 4 stratégies : AE, AF, BE, BF
2 a c d A B E b F D C Le joueur 1 a 4 stratégies : AE, AF, BE, BF Sa stratégie spécifie une action après l’histoire (AC) même si elle spécifie de jouer B

130 Jeux répétés

131 Dilemme du prisonnier Rationalité individuelle conduit à une situation collective irrationnelle. Dans le cadre d’une interaction répétée : les actions courantes affectent les interactions futures Est-ce que des stratégie fonction de l’historique de l’interaction peuvent permettre de soutenir la coopération ? … CA DEPEND !

132 Distinction entre… Jeux à horizon fini Jeux à horizon infini
Supposons que l’interaction soit limitée à un nombre T de périodes Utilisons l’induction à rebours

133 Jeu répété à horizon fini
A la Tème (dernière) période : pas d’incitation à jouer coopératif Pas de risque de représailles A la période précédente (T-1): pas d’incitation à jouer coopératif Dans tous les cas aucune coopération n’est attendue à la période suivante Donc pas de coût d’opportunité à tricher en période T-1 Etc. même logique jusqu’à la période 1

134 Jeu répété à horizon fini
… la coopération est impossible (n’est pas un équilibre) lorsque le nombre de répétitions du jeu est prédéterminé et connu Mais alors comment expliquer qu’en pratique la coopération existe alors même que les gens ont une espérance de vie limitée ?? Ex. Concessions dans un couple

135 Jeux répétés indéfiniment
Pas de dernière période, donc pas d’induction à rebours Les joueurs utilisent des stratégies fonction de l’historique de l’interaction Différents types de stratégies sont envisageables

136 Jeux répétés indéfiniment
Aléatoire Equilibre (tricher systématiquement) « Trigger strategy » ou stratégie de la gâchette : On commence par jouer coopératif On continue tant que l’autre en fait autant A la première déviation on le « punit » en jouant non-coopératif pour un nombre de périodes donné.

137 Deux exemples de « trigger strategies »:
Stratégie rancunière Idem Dés que l’un des joueurs dévie, on joue non-coopératif définitivement Tit-for-tat (donnant-donnant) On joue coopératif si l’adversaire a joué coopératif à la période précédente On joue non-coopératif s’il a joué non-coopératif

138 Stratégie rancunière Supposons 2 firmes en concurrence
Stratégie coopérative : maintenir un prix élevé Stratégie non-coopérative: baisser les prix A une période t quelconque, une firme fait face à une des deux histoires du jeu suivantes : Soit aucune n’a triché jusqu’à présent  elles chargent le prix élevé Soit l’une a triché à une étape quelconque  elles chargent le prix bas à partir de ce moment pour le reste du temps: équilibre de Nash {bas,bas}

139 Rappel sur l’actualisation des profits futurs
Principe de l’actualisation : la valeur d’1 € dans le futur est inférieure à sa valeur actuelle. Comment calculer la Valeur actuelle d’un flux de profits futurs ? Soit r le tx d’intérêt (~tx d’actualisation) Une somme A vous rapporte A(1+r) au bout d’un an … donc la valeur actuelle équivalente à avoir une somme A dans 1 an est : A/(1+r)

140 Actualisation (suite)
Définition: le facteur d’escompte : =1/(1+r) Valeur actuelle d’un flux de profits A : VA = A+ A/(1+r)+ A/(1+r)²+… = A (1+ + ²+ 3+…) VA = A /(1-  ) =A (1+1/r) démonstration…

141 Actualisation (suite)
Somme infinie : 1+ x+ x²+ x3+… =1/(1-x) En effet : z = 1+ x+ x²+ x3+… zx = x+ x²+ x3+x4+… Donc z-zx=1 et z=1/(1-x)

142 Exercice Supposez que les deux firmes jouent un DP répété avec une stratégie « rancunière ». Leurs profits respectifs sont : 25 chacune tant qu’elles coopèrent (prix élevé) 20 chacune quand elles ne coopèrent plus (prix bas) la première à baisser ses prix obtient un profit de 28 à la période où elle triche.

143 Flux de profits 28 25 20 t t+1 t+2 t+3 collusion temps profit
Non-coopération

144 A quelle condition sur les taux d’intérêts la coopération est-elle un équilibre ?
Il faut que la valeur actuelle des profits de la coopération soit supérieure à la valeur actuelle des profits en trichant…

145 Réponse… Coopération est soutenable ssi 25+25/r >28 + 20/r
r < 5/3 ou  > 3/8 c. À d. qu’il faut que les firmes valorisent suffisamment les gains futurs (n’aient pas une préférence pour le présent trop forte)

146 La coopération est-elle soutenable ?
Cas général : la soutenabilité de l’issue coopérative va être influencée par les gains associés aux différentes issues: Si les profits de dévier augmentent (relativement): le seuil de tx d’intérêt sera plus faible Si les profits lorsque les deux jouent non-coopératif sont + élevés (relativement): le seuil de taux d’intérêt sera + élevé

147 Quelle stratégie adopter dans un DP répété ?
Dépend contre qui vous jouez… Simulations ont été effectuées par paires de stratégies La stratégie « gagnante » (max. profit) : tit-for-tat Indulgente, facile, claire, crédible

148 Principales idées Pas forcément tit-for-tat (ne marche pas toujours)
Ne pas être envieux Ne pas être le premier à tricher Réagir au comportement de votre adversaire (coopération comme défection)

149 Principe des « stratégies gachette »
2 objectifs : Dissuasion : Stratégie « rancunière » très dissuasive Stratégie « tit-for-tat » peut-être pas assez Crédibilité : Stratégie « rancunière » porte trop préjudice à celui qui l’applique Stratégie « tit-for-tat » assez crédible

150 CCL. Induire la coopération…
COMMANDEMENT En annonçant une stratégie punitive: Punissez suffisamment pour dissuader votre adversaire Modérez la punition pour rester crédible

151 Jeux à information incomplète ou imparfaite

152 On parle d’Information…
Parfaite si Chaque ensemble d’information est un singleton Certaine si La Nature ne joue plus après les joueurs Symétrique si Aucun joueur ne dispose d’une information différente de celle des autres joueurs au moment de jouer, ou au nœud final Complète si La Nature ne joue pas en premier, ou alors son mouvement initial est observé par tous les joueurs

153 Jeux à information incomplète
Dans un jeu à information incomplète, la Nature (hasard) « joue » en premier … et son mouvement n’est pas observable par au moins un des joueurs. Implication : un jeu à info. incomplète est aussi à information imparfaite  certains ensembles d’information des joueurs contiennent plus qu’un noeud

154 … mais ces concepts ne sont pas équivalents :
Beaucoup de jeu à information incomplète sont des jeux à information asymétrique : certains joueurs bénéficient d’une information privée … mais ces concepts ne sont pas équivalents : Si un joueur fait un mouvement non observé par l’autre : info. complète asymétrique Ex. Modèles Principal-Agent

155 Définition d’un « type »
Dans un jeu d’information incomplète, le type d’un joueur est représenté par L’ensemble de stratégies L’information La fonction de gains que la Nature choisit pour lui au début du jeu. Noté en général 

156 Ex. Financement d’un bien (ou service) public en information Incomplète
Ou le problème du passager clandestin (free rider) : Chaque joueur bénéficie du bien public … mais préfèrerait qu’il soit financé par les autres. Représentation à 2 joueurs qui choisissent de contribuer ou pas. chaque joueur a un bénéfice de 1 si au moins l’un des deux contribue, et de zéro sinon la contribution coûte c i au joueur i

157 Contribue Ne contribue pas (1- c1 , 1- c2 ) (1- c1 , 1) (1 , 1- c2 ) (0 , 0)

158 Equilibre Bayésien Le coût ci représente le type du joueur i
Les joueurs considèrent qu’il est de connaissance commune que les ci sont tirés indépendamment d’une même fonction de distribution P(.) sur [cinf, csup] avec P(cinf)=0 et P(csup)=1 Une stratégie pure dans ce jeu : fonction si si (ci) : [cinf, csup] {0, 1} avec 0=ne contribue pas et 1=contribue ; Le gain du joueur i est Ui(si , sj , ci )= max{s1,s2} - ci si

159 Equilibre bayésien = couple de stratégies (s1*, s2*) telles que pour chaque joueur i et chaque valeur ci possible, si*(ci) maximise Ecj Ui(si , s*j (cj), ci ) Soit zj la probabilité que le joueur j contribue : Joueur i va contribuer si son propre coût ci < 1 x (1- zj ) Inversement si*(ci)=0 si ci >1 x (1- zj )

160 Comme zj=P(cj*), les niveaux-seuil d’équilibre doivent satisfaire
 joueur i contribue si son coût est suffisamment bas : ci  [cinf, ci*] Idem pour joueur j Comme zj=P(cj*), les niveaux-seuil d’équilibre doivent satisfaire ci*=1-P(cj*) donc c*=1-P(1-P(c*)) S’il existe un unique c* qui vérifie cette relation, il satisfait nécessairement c*=1-P(c*) Exemple : si P = distribution uniforme sur [0,2] P(c)=c/2, alors c* est unique C*=2/3

161 Jeux dynamiques à information incomplète
Les joueurs ont des croyances a priori sur la distribution des types Mais l’information évolue au cours du jeu : une action prise par un joueur permet à son rival d’actualiser ses croyances Actualisation bayésienne On ne parle pas de sous-jeu quand il y a information imparfaite (plusieurs nœuds dans le même ensemble d’information) Logique de résolution est la même que pour l’équilibre en sous-jeux parfait mais on parle d’équilibre Bayésien Parfait.

162 Concepts de Solution par type de Jeu
Information Parfaite Information Imparfaite Statique Equilibre de Nash Equilibre Bayesien de Nash Dynamique Equilibre en sous-jeux parfait Equilibre Bayésien parfait

163 Bibliographie Ken Binmore, « Jeux et théorie des jeux », DeBoeck Université, 1999. Roger Myerson, « Game theory. Analysis of conflict », Harvard University Press, 1991. Martin Shubik, « Théorie des jeux et sciences sociales », Economica, 1991. + plein de ressources (cours en ligne, quizz, jeux interactifs) sur


Télécharger ppt "Introduction à la théorie des jeux"

Présentations similaires


Annonces Google