Mathématiques et Théorie des Jeux
Qu’est ce que la Théorie des jeux ?
Une théorie mathématique du conflit et de la coopération . . . Elle analyse des situations où des agents rationnels doivent prendre des décisions stratégiques dont les conséquences dépendent de l’état du monde, mais aussi des décisions prises par les autres agents.
Des motivations historiques et philosophiques anciennes : La question du contrat social chez les précurseurs de la philosophie politique, Platon (La république, - 427, -347), Hobbes (Le Léviathan, 1651), Rousseau (Du Contrat Social, 1762). Qu’est ce que la théorie des jeux
Des motivations historiques et philosophiques anciennes : La question du contrat social chez les précurseurs de la philosophie politique, Platon (La république, - 427, -347), Hobbes (Le Léviathan, 1651), Rousseau (Du Contrat Social, 1762). Une théorie jeune : Von Neumann et Morgenstern (Theory of Games and Economic Behavior, 1944 ). Qu’est ce que la théorie des jeux
Qu’est ce qu’un jeu ?
Un ensemble d’actions pour chaque joueur : A1, A2 Des joueurs : i = 1, 2 Un ensemble d’actions pour chaque joueur : A1, A2 Des fonctions d’utilité : U1, U2 :A1 × A2→ R U1(x,y) = utilité (payoff) du joueur 1 associée aux actions x et y. Les joueurs jouent simultanément. Qu’est ce que la théorie des jeux
Le Dilemme du Prisonnier (Tucker, 1950) Trahir Coopérer -6 /-6 0 /-10 -10 / 0 -2 /-2 T C
Le DP est un paradigme pour de nombreuses situations : Le Problème du « free rider » (les boites à journaux en Suisse) La provision des biens publics (environnement, taxes, défense nationale,…) La solution de Hobbes : Changer les règles du jeu … « Covenants struck without the sword are but words », 1651, Le Léviathan
Le Dilemme du Prisonnier
Équilibres
Un couple d’actions (x , y) est un équilibre de Nash si U2 (x , y) ≥ U2(x , y) pour toute action y et U1 (x , y) ≥ U1(x , y) pour toute action x
Un couple d’actions (x , y) est un équilibre de Nash si U2 (x , y) ≥ U2(x , y) pour toute action y et U1 (x , y) ≥ U1(x , y) pour toute action x (T,T) est l’unique équilibre du Dilemme du Prisonnier
Le jeu des 3 ponts Sûr Pierres Cobras 0 / 100 100 / 0 80 / 20 60 / 40 S P C
Le jeu des 3 ponts n’admet pas d’équilibre… Et pourtant : Théorème (Nash, 1950) : Tout jeu admet un équilibre en stratégies mixtes « I certainly knew right away that it was a thesis. I didn’t know it was a Nobel. » (David Gale, 1995)
U(x,y) = Σ x(i) y(j) U(i,j) Une stratégie mixte est une « loterie » (une distribution de probabilité) sur l’ensemble des actions L’utilité s’étend par bilinéarité à l’espace des stratégies mixtes U(x,y) = Σ x(i) y(j) U(i,j) L’équilibre dans le jeu des 3 ponts est x ~ (0.26, 0.32, 0.42), y ~ (0.49, 0.36, 0.15) La valeur du jeu~ 51
L’existence n’est pas l’unicité
Le jeu du Cerf et du Lièvre “S’agissait-il de prendre un cerf, chacun sentait bien qu’il devait pour cela garder fidèlement son poste; mais si un lièvre venait à passer à la portée de l’un d’eux, il ne faut pas douter qu’il ne le poursuivit sans scrupule, et qu’ayant atteint sa proie il ne souciât fort peu de faire manquer la leur à ses compagnons” Rousseau, Discours sur l’origine de l’inégalité, 1755
Cerf Lièvre 5 / 5 0 / 4 4 / 0 2 / 2 C L
Cerf Lièvre 5 / 5 Pareto dominant 0 / 4 4 / 0 2 / 2 C L
Risque dominant (Harsanyi et Selten, prix Nobels 1994) Cerf Lièvre 5 / 5 Pareto dominant 0 / 4 4 / 0 2 / 2 Risque dominant (Harsanyi et Selten, prix Nobels 1994) C L
Risque dominant (Harsanyi et Selten, prix Nobels 1994) Cerf Lièvre 5 / 5 Pareto dominant 0 / 4 4 / 0 Un équilibre mixte : (2/3 C, 1/3 L) 2 / 2 Risque dominant (Harsanyi et Selten, prix Nobels 1994) C L
La multiplicité des équilibres, La question de la rationalité et du « common knowledge », Les évidences expérimentales, Posent un Problème Majeur à la théorie des jeux classique :
La multiplicité des équilibres, La question de la rationalité et du « common knowledge », Les évidences expérimentales, Posent un Problème Majeur à la théorie des jeux classique : Pourquoi les joueurs devraient t-ils se coordonner sur un équilibre particulier ?
Apprentissage et Dynamique
Une explication alternative issue de l’économie et de la biologie évolutionnaire est que « les équilibres peuvent résulter d’un processus dynamique d’adaptation ou d’apprentissage »
Une explication alternative issue de l’économie et de la biologie évolutionnaire est que « les équilibres peuvent résulter d’un processus dynamique d’adaptation ou d’apprentissage » Maynard Smith, Evolution and the Theory of Games, 1982, Fudenberg et Levine, Theory of Learning in Games, 1998,
Le processus de meilleure réponse y(n) = fréquence empirique des actions du joueur 2 à l’instant n, br(y(n)) = « la meilleure réponse à y(n) » = Argmax {j : U1( j, y(n))}, À l’instant n+1, le joueur 1 joue l’action br(y(n)) avec une probabilité proche de 1 et le joueur 2 en fait autant …
Vieille idée (Robinson, 1950) revisitée à la lumière de la théorie des systèmes dynamiques, des processus stochastiques, des inclusions et des équations différentielles Travaux en collaboration avec M. W Hirsch, Berkeley J. Hofbauer, Londre et Vienne S. Sorin, Paris J. Weibull, Stockholm
Jeux à somme nulle U1(x,y) + U2(x,y) = c Théorème : Pour un jeu à somme nulle (x(n),y(n)) converge presque sûrement vers l’équilibre de Nash.
Jeux à 2 joueurs et 2 stratégies Théorème : Pour un jeu 2 × 2 (x(n),y(n)) converge presque sûrement vers un équilibre de Nash. « Génériquement » un jeu 2 × 2 admet un ou trois équilibres : 2 purs et 1 mixte. Dans le second cas (x(n),y(n)) converge presque sûrement vers un équilibre pur et chaque équilibre pur a une probabilité positive d’être sélectionné.
Externalités de Réseau Cerf Lièvre 5 / 5 0 / 4 4 / 0 2 / 2 C L
Externalités de Réseau Betamax Vhs 5 / 5 0 / 1 1 / 0 2 / 2 B V
Externalités de Réseau Ideal Qwerty 5 / 5 0 / 1 1 / 0 2 / 2 I Q
Jeux M x N où M>2, N > 2 Analyse locale : Tout équilibre stable (instable) a une probabilité positive (nulle) d’être sélectionné. Analyse globale : l’asymptotique du jeu requiert l’analyse globale d’un système dynamique non linéaire. Convergence, Oscillation et Chaos sont possibles.
Jeux répétés et Coordination