Télécharger la présentation
La présentation est en train de télécharger. S'il vous plaît, attendez
1
Mathématiques et Théorie des Jeux
2
Qu’est ce que la Théorie des jeux ?
3
Une théorie mathématique
du conflit et de la coopération . . . Elle analyse des situations où des agents rationnels doivent prendre des décisions stratégiques dont les conséquences dépendent de l’état du monde, mais aussi des décisions prises par les autres agents.
4
Des motivations historiques et philosophiques anciennes :
La question du contrat social chez les précurseurs de la philosophie politique, Platon (La république, , -347), Hobbes (Le Léviathan, 1651), Rousseau (Du Contrat Social, 1762). Qu’est ce que la théorie des jeux
5
Des motivations historiques et philosophiques anciennes :
La question du contrat social chez les précurseurs de la philosophie politique, Platon (La république, , -347), Hobbes (Le Léviathan, 1651), Rousseau (Du Contrat Social, 1762). Une théorie jeune : Von Neumann et Morgenstern (Theory of Games and Economic Behavior, 1944 ). Qu’est ce que la théorie des jeux
6
Qu’est ce qu’un jeu ?
7
Un ensemble d’actions pour chaque joueur : A1, A2
Des joueurs : i = 1, 2 Un ensemble d’actions pour chaque joueur : A1, A2 Des fonctions d’utilité : U1, U2 :A1 × A2→ R U1(x,y) = utilité (payoff) du joueur 1 associée aux actions x et y. Les joueurs jouent simultanément. Qu’est ce que la théorie des jeux
8
Le Dilemme du Prisonnier (Tucker, 1950)
Trahir Coopérer -6 /-6 0 /-10 -10 / 0 -2 /-2 T C
9
Le DP est un paradigme pour de nombreuses situations :
Le Problème du « free rider » (les boites à journaux en Suisse) La provision des biens publics (environnement, taxes, défense nationale,…) La solution de Hobbes : Changer les règles du jeu … « Covenants struck without the sword are but words », 1651, Le Léviathan
10
Le Dilemme du Prisonnier
11
Équilibres
12
Un couple d’actions (x , y) est un équilibre de Nash si
U2 (x , y) ≥ U2(x , y) pour toute action y et U1 (x , y) ≥ U1(x , y) pour toute action x
13
Un couple d’actions (x , y) est un équilibre de Nash si
U2 (x , y) ≥ U2(x , y) pour toute action y et U1 (x , y) ≥ U1(x , y) pour toute action x (T,T) est l’unique équilibre du Dilemme du Prisonnier
14
Le jeu des 3 ponts Sûr Pierres Cobras
0 / 100 100 / 0 80 / 20 60 / 40 S P C
15
Le jeu des 3 ponts n’admet pas d’équilibre…
Et pourtant : Théorème (Nash, 1950) : Tout jeu admet un équilibre en stratégies mixtes « I certainly knew right away that it was a thesis. I didn’t know it was a Nobel. » (David Gale, 1995)
16
U(x,y) = Σ x(i) y(j) U(i,j)
Une stratégie mixte est une « loterie » (une distribution de probabilité) sur l’ensemble des actions L’utilité s’étend par bilinéarité à l’espace des stratégies mixtes U(x,y) = Σ x(i) y(j) U(i,j) L’équilibre dans le jeu des 3 ponts est x ~ (0.26, 0.32, 0.42), y ~ (0.49, 0.36, 0.15) La valeur du jeu~ 51
17
L’existence n’est pas l’unicité
18
Le jeu du Cerf et du Lièvre
“S’agissait-il de prendre un cerf, chacun sentait bien qu’il devait pour cela garder fidèlement son poste; mais si un lièvre venait à passer à la portée de l’un d’eux, il ne faut pas douter qu’il ne le poursuivit sans scrupule, et qu’ayant atteint sa proie il ne souciât fort peu de faire manquer la leur à ses compagnons” Rousseau, Discours sur l’origine de l’inégalité, 1755
19
Cerf Lièvre 5 / 5 0 / 4 4 / 0 2 / 2 C L
20
Cerf Lièvre 5 / 5 Pareto dominant 0 / 4 4 / 0 2 / 2 C L
21
Risque dominant (Harsanyi et Selten, prix Nobels 1994)
Cerf Lièvre 5 / 5 Pareto dominant 0 / 4 4 / 0 2 / 2 Risque dominant (Harsanyi et Selten, prix Nobels 1994) C L
22
Risque dominant (Harsanyi et Selten, prix Nobels 1994)
Cerf Lièvre 5 / 5 Pareto dominant 0 / 4 4 / 0 Un équilibre mixte : (2/3 C, 1/3 L) 2 / 2 Risque dominant (Harsanyi et Selten, prix Nobels 1994) C L
23
La multiplicité des équilibres,
La question de la rationalité et du « common knowledge », Les évidences expérimentales, Posent un Problème Majeur à la théorie des jeux classique :
24
La multiplicité des équilibres,
La question de la rationalité et du « common knowledge », Les évidences expérimentales, Posent un Problème Majeur à la théorie des jeux classique : Pourquoi les joueurs devraient t-ils se coordonner sur un équilibre particulier ?
25
Apprentissage et Dynamique
26
Une explication alternative issue de l’économie et de la biologie évolutionnaire est que
« les équilibres peuvent résulter d’un processus dynamique d’adaptation ou d’apprentissage »
27
Une explication alternative issue de l’économie et de la biologie évolutionnaire est que
« les équilibres peuvent résulter d’un processus dynamique d’adaptation ou d’apprentissage » Maynard Smith, Evolution and the Theory of Games, 1982, Fudenberg et Levine, Theory of Learning in Games, 1998,
28
Le processus de meilleure réponse
y(n) = fréquence empirique des actions du joueur 2 à l’instant n, br(y(n)) = « la meilleure réponse à y(n) » = Argmax {j : U1( j, y(n))}, À l’instant n+1, le joueur 1 joue l’action br(y(n)) avec une probabilité proche de 1 et le joueur 2 en fait autant …
29
Vieille idée (Robinson, 1950) revisitée à la lumière de la théorie des systèmes dynamiques, des processus stochastiques, des inclusions et des équations différentielles Travaux en collaboration avec M. W Hirsch, Berkeley J. Hofbauer, Londre et Vienne S. Sorin, Paris J. Weibull, Stockholm
30
Jeux à somme nulle U1(x,y) + U2(x,y) = c
Théorème : Pour un jeu à somme nulle (x(n),y(n)) converge presque sûrement vers l’équilibre de Nash.
31
Jeux à 2 joueurs et 2 stratégies
Théorème : Pour un jeu 2 × 2 (x(n),y(n)) converge presque sûrement vers un équilibre de Nash. « Génériquement » un jeu 2 × 2 admet un ou trois équilibres : 2 purs et 1 mixte. Dans le second cas (x(n),y(n)) converge presque sûrement vers un équilibre pur et chaque équilibre pur a une probabilité positive d’être sélectionné.
32
Externalités de Réseau
Cerf Lièvre 5 / 5 0 / 4 4 / 0 2 / 2 C L
33
Externalités de Réseau
Betamax Vhs 5 / 5 0 / 1 1 / 0 2 / 2 B V
34
Externalités de Réseau
Ideal Qwerty 5 / 5 0 / 1 1 / 0 2 / 2 I Q
35
Jeux M x N où M>2, N > 2 Analyse locale : Tout équilibre stable (instable) a une probabilité positive (nulle) d’être sélectionné. Analyse globale : l’asymptotique du jeu requiert l’analyse globale d’un système dynamique non linéaire. Convergence, Oscillation et Chaos sont possibles.
36
Jeux répétés et Coordination
Présentations similaires
© 2024 SlidePlayer.fr Inc.
All rights reserved.