La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Mathématiques et Théorie des Jeux Quest ce que la Théorie des jeux ?

Présentations similaires


Présentation au sujet: "Mathématiques et Théorie des Jeux Quest ce que la Théorie des jeux ?"— Transcription de la présentation:

1

2 Mathématiques et Théorie des Jeux

3 Quest ce que la Théorie des jeux ?

4 Une théorie mathématiqueUne théorie mathématique du conflit et de la coopération... Elle analyse des situations où des agents rationnels doivent prendre des décisions stratégiques dont les conséquences dépendent de létat du monde,Elle analyse des situations où des agents rationnels doivent prendre des décisions stratégiques dont les conséquences dépendent de létat du monde, mais aussi des décisions prises par les autres agents.

5 Des motivations historiques et philosophiques anciennes :Des motivations historiques et philosophiques anciennes : La question du contrat social chez les précurseurs de la philosophie politique, Platon ( La république, - 427, -347), Platon ( La république, - 427, -347), Hobbes (Le Léviathan, 1651), Rousseau (Du Contrat Social, 1762).

6 Des motivations historiques et philosophiques anciennes :Des motivations historiques et philosophiques anciennes : La question du contrat social chez les précurseurs de la philosophie politique, Platon ( La république, - 427, -347), Platon ( La république, - 427, -347), Hobbes (Le Léviathan, 1651), Rousseau (Du Contrat Social, 1762). Une théorie jeune :Une théorie jeune : Von Neumann et Morgenstern (Theory of Games and Economic Behavior, 1944 ).

7 Quest ce quun jeu ?

8 Des joueurs : i = 1, 2Des joueurs : i = 1, 2 Un ensemble dactions pour chaque joueur : A1, A2Un ensemble dactions pour chaque joueur : A1, A2 Des fonctions dutilité : U1, U2 :A1 × A2 RDes fonctions dutilité : U1, U2 :A1 × A2 R U1(x,y) = utilité (payoff) du joueur 1 associée aux actions x et y. Les joueurs jouent simultanément. Les joueurs jouent simultanément.

9 Le Dilemme du Prisonnier (Tucker, 1950) -6 /-6 0 /-10 0 / / 0 -2 /-2 -2 /-2 Trahir Coopérer T C

10 Le DP est un paradigme pour de nombreuses situations : Le Problème du « free rider » (les boites à journaux en Suisse)Le Problème du « free rider » (les boites à journaux en Suisse) La provision des biens publics (environnement, taxes, défense nationale,…)La provision des biens publics (environnement, taxes, défense nationale,…) La solution de Hobbes : Changer les règles du jeu … La solution de Hobbes : Changer les règles du jeu … « Covenants struck without the sword are but words », 1651, Le Léviathan

11 Le Dilemme du Prisonnier

12 Équilibres

13 Un couple dactions (x, y) est un équilibre de Nash si Un couple dactions (x, y) est un équilibre de Nash si U2 (x, y) U2(x, y) pour toute action y U2 (x, y) U2(x, y) pour toute action yet U1 (x, y) U1(x, y) pour toute action x U1 (x, y) U1(x, y) pour toute action x

14 Un couple dactions (x, y) est un équilibre de Nash si Un couple dactions (x, y) est un équilibre de Nash si U2 (x, y) U2(x, y) pour toute action y U2 (x, y) U2(x, y) pour toute action yet U1 (x, y) U1(x, y) pour toute action x U1 (x, y) U1(x, y) pour toute action x (T,T) est lunique équilibre du Dilemme du Prisonnier(T,T) est lunique équilibre du Dilemme du Prisonnier

15 Le jeu des 3 ponts Sûr Pierres Cobras Le jeu des 3 ponts Sûr Pierres Cobras S P C 0 / / / / / 0 80 / 20 0 / / / / / / 40 0 / 100

16 Le jeu des 3 ponts nadmet pas déquilibre…Le jeu des 3 ponts nadmet pas déquilibre… Et pourtant : Théorème (Nash, 1950) : Tout jeu admet un équilibre en stratégies mixtes « I certainly knew right away that it was a thesis. I didnt know it was a Nobel. » (David Gale, 1995)

17 Une stratégie mixte est une « loterie » (une distribution de probabilité) sur lensemble des actionsUne stratégie mixte est une « loterie » (une distribution de probabilité) sur lensemble des actions Lutilité sétend par bilinéarité à lespace des stratégies mixtesLutilité sétend par bilinéarité à lespace des stratégies mixtes U(x,y) = Σ x(i) y(j) U(i,j) Léquilibre dans le jeu des 3 ponts est x ~ (0.26, 0.32, 0.42), y ~ (0.49, 0.36, 0.15) Léquilibre dans le jeu des 3 ponts est x ~ (0.26, 0.32, 0.42), y ~ (0.49, 0.36, 0.15) La valeur du jeu~ 51

18 Lexistence nest pas lunicité

19 Le jeu du Cerf et du Lièvre Sagissait-il de prendre un cerf, chacun sentait bien quil devait pour cela garder fidèlement son poste; mais si un lièvre venait à passer à la portée de lun deux, il ne faut pas douter quil ne le poursuivit sans scrupule, et quayant atteint sa proie il ne souciât fort peu de faire manquer la leur à ses compagnons Rousseau, Discours sur lorigine de linégalité, 1755

20 5 / 5 5 / 5 0 / 4 0 / 4 4 / 0 4 / 0 2 / 2 2 / 2 Cerf Lièvre C L

21 5 / 5 5 / 5 Pareto dominant Pareto dominant 0 / 4 0 / 4 4 / 0 4 / 0 2 / 2 2 / 2 Cerf Lièvre C L

22 5 / 5 5 / 5 Pareto dominant Pareto dominant 0 / 4 0 / 4 4 / 0 4 / 0 2 / 2 2 / 2 Risque dominant (Harsanyi et Selten, prix Nobels 1994) Cerf Lièvre C L

23 5 / 5 5 / 5 Pareto dominant Pareto dominant 0 / 4 0 / 4 4 / 0 4 / 0 Un équilibre mixte : (2/3 C, 1/3 L) (2/3 C, 1/3 L) 2 / 2 2 / 2 Risque dominant (Harsanyi et Selten, prix Nobels 1994) Cerf Lièvre C L

24 La multiplicité des équilibres,La multiplicité des équilibres, La question de la rationalité et du « common knowledge »,La question de la rationalité et du « common knowledge », Les évidences expérimentales,Les évidences expérimentales, Posent un Problème Majeur à la théorie des jeux classique :

25 La multiplicité des équilibres,La multiplicité des équilibres, La question de la rationalité et du « common knowledge »,La question de la rationalité et du « common knowledge », Les évidences expérimentales,Les évidences expérimentales, Posent un Problème Majeur à la théorie des jeux classique : Pourquoi les joueurs devraient t-ils se coordonner sur un équilibre particulier ?

26 Apprentissage et Dynamique

27 Une explication alternative issue de léconomie et de la biologie évolutionnaire est que « les équilibres peuvent résulter dun processus dynamique dadaptation ou dapprentissage »

28 Une explication alternative issue de léconomie et de la biologie évolutionnaire est que « les équilibres peuvent résulter dun processus dynamique dadaptation ou dapprentissage » Maynard Smith, Evolution and the Theory of Games, 1982, Fudenberg et Levine, Theory of Learning in Games, 1998,

29 Le processus de meilleure réponse y(n) = fréquence empirique des actions du joueur 2 à linstant n,y(n) = fréquence empirique des actions du joueur 2 à linstant n, br(y(n)) = « la meilleure réponse à y(n) » = Argmax {j : U1( j, y(n))},br(y(n)) = « la meilleure réponse à y(n) » = Argmax {j : U1( j, y(n))}, À linstant n+1, le joueur 1 joue laction br(y(n)) avec une probabilité proche de 1 et le joueur 2 en fait autant …À linstant n+1, le joueur 1 joue laction br(y(n)) avec une probabilité proche de 1 et le joueur 2 en fait autant …

30 Vieille idée (Robinson, 1950) revisitée à la lumière de la théorie des systèmes dynamiques, des processus stochastiques, des inclusions et des équations différentielles Vieille idée (Robinson, 1950) revisitée à la lumière de la théorie des systèmes dynamiques, des processus stochastiques, des inclusions et des équations différentielles Travaux en collaboration avec Travaux en collaboration avec o M. W Hirsch, Berkeley o J. Hofbauer, Londre et Vienne oS. Sorin, Paris o J. Weibull, Stockholm

31 Jeux à somme nulle U1(x,y) + U2(x,y) = cU1(x,y) + U2(x,y) = c Théorème : Pour un jeu à somme nulle (x(n),y(n)) converge presque sûrement vers léquilibre de Nash.

32 Jeux à 2 joueurs et 2 stratégies Théorème : Pour un jeu 2 × 2 (x(n),y(n)) converge presque sûrement vers un équilibre de Nash. « Génériquement » un jeu 2 × 2 admet un ou trois équilibres : 2 purs et 1 mixte. Dans le second cas (x(n),y(n)) converge presque sûrement vers un équilibre pur et chaque équilibre pur a une probabilité positive dêtre sélectionné.

33 Externalités de Réseau 5 / 5 5 / 5 0 / 4 0 / 4 4 / 0 4 / 0 2 / 2 2 / 2 Cerf Lièvre C L

34 Externalités de Réseau 5 / 5 5 / 5 0 / 1 0 / 1 1 / 0 1 / 0 2 / 2 2 / 2 Betamax Vhs B V

35 Externalités de Réseau 5 / 5 5 / 5 0 / 1 0 / 1 1 / 0 1 / 0 2 / 2 2 / 2 Ideal Qwerty I Q

36 Jeux M x N où M>2, N > 2 Analyse locale : Tout équilibre stable (instable) a une probabilité positive (nulle) dêtre sélectionné.Analyse locale : Tout équilibre stable (instable) a une probabilité positive (nulle) dêtre sélectionné. Analyse globale : lasymptotique du jeu requiert lanalyse globale dun système dynamique non linéaire.Analyse globale : lasymptotique du jeu requiert lanalyse globale dun système dynamique non linéaire. Convergence, Oscillation et Chaos sont possibles.

37 Jeux répétés et Coordination


Télécharger ppt "Mathématiques et Théorie des Jeux Quest ce que la Théorie des jeux ?"

Présentations similaires


Annonces Google