La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Claire Mathieu (Brown) Théorie algorithmique des jeux.

Présentations similaires


Présentation au sujet: "Claire Mathieu (Brown) Théorie algorithmique des jeux."— Transcription de la présentation:

1 Claire Mathieu (Brown) Théorie algorithmique des jeux

2 Introduction Algorithmique et informatique: utiliser les données pour construire une solution de faible complexité de calcul. Economie et théorie des jeux: les données et ressources sont partagées ou distribuées entre des participants rationnels égoïstes. En se servant éventuellement dincitations financières, construire une solution compatible avec les intérêts de chaque participant.

3 Equilibre de Nash Véracité Liens commerciaux de moteurs de recherche Partage de coût égalitaire

4 Equilibre de Nash

5 Un participant a un choix de possibilités (enchères, chemins dans un réseau, etc.) Quand chaque participant choisit une possibilité, la solution ainsi définie a une valeur pour chacun Equilibre: Participant x. Etant donné les choix des autres participants, x na pas de raison de changer son choix.

6 Existence Il nexiste pas toujours déquilibre (pur) Exemple: deux joueurs, l (ligne) et c (colonne). Chacun a deux possibilités: 0 ou 1. Si l=c, l paye 1 euro à c, sinon c paye 1 euro à l. Il existe toujours un équilibre mixte: chaque participant choisit une distribution sur lensemble de ses possibilités. Etant donné la distribution du concurrent, x na pas de raison de changer sa distribution (elle maximise la valeur moyenne) Théorème de Nash, théorème de dualité de programmation linéaire, théorème du minmax de Yao.

7 Calcul Quelle est la complexité de calcul dun équilibre de Nash? Jeu à 2 joueurs où le perdant paye le gagnant (somme des valeurs = 0): résolution dun programme linéaire, polynomial Jeu à 2 joueurs général: PPAD-difficile. PPAD: classe des problèmes de recherche (type point fixe)

8 Truthfulness

9 Mécanismes Participants ont des valeurs qui leur sont privées Concevoir un mécanisme (algorithme) qui les encourage à révéler leurs vraies valeurs Exemple typique: enchères. Chaque participant a en tête une valeur quil attribue aux objets à vendre

10 Enchères de Vickrey Chaque participant fait une enchère Le gagnant est lauteur de lenchère la plus élevée Il paye le montant de la deuxième enchère la plus élevée Aucun participant na de raison de mentir, et donc lobjet revient finalement à la personne qui lui donne le plus de valeur: maximisation du bien-être de la société (social welfare)

11 Vickrey-Clarke-Groves Find the solution maximizing the social welfare - the sum of the values which participants give to the solution. If participant x is part of the solution, then charge x an amount equal to the increase in other players utility (in best solution) in the absence of x Truthful - no incentive to lie about value Example: buying s-t path in a network. Participants are edges, edge lengths l(e) are private. Find shortest s-t path p, and pay each edge e of p payment(e)=l(p)-(l(p)-l(e)), where p is the shortest path in G-e.

12 Digital goods auction Downloadable audio file: duplicated at no cost. Infinite supply. Participant j bids v(j), v(1) v(2) v(3)… Vickrey-Clarke-Groves: sells at price 0 How to stay truthful but get some revenue? Without truthfulness, single-price selling to at least 2 participants brings revenue F=max(2*v(2),3*v(3),4*v(4),…) Randomized algorithm, truthful, with revenue Cst* F

13 Randomized algorithm Partition the participants into two subsets at random Find best single-price p for first set, and sell item at price p to every participant of second set who bid at least p

14 Sponsored search auctions

15 Googles income Keyword searches yields organic results and sponsored results

16 Liens commerciaux Publicitaires payent Google à chaque clic Enchère similaire a Vickrey. Un mot-clé k espaces publicitaires numerotés 1,2,…,k Publicitaire j, de valeur v(j), fait une enchère b(j) Les k enchères les plus élevées gagnent, dans lordre b(1),b(2),…,b(k); un clic sur j coûte b(j+1) au publicitaire

17 Propriétés t(j) = qualité de lespace j = proba dun clic Il peut être avantageux de mentir Stabilité: il existe un equilibre de Nash pur b(k+1)=v(k+1) b(j)=t(j)/t(j+1) b(j+1)+(1-t(j)/t(j+1)) v(j)

18 Dynamique Comment arriver à cet équilibre? Par un algorithme glouton: publicitaire fait une enchère de facon à avoir lespace j qui maximise son profit t(j)(v-b(j+1)), si les autres conservent leurs enchères précédentes Parmi les choix denchères, il fait lenchère b qui donne même profit à lespace j et à lespace j-1: t(j)(v-b(j+1))=t(j-1)(v-b) Théorème: Si à chaque répétition un publicitaire aléatoire met à jour son enchère, alors il y a convergence en temps fini.

19 Cost-sharing

20 Partage de coûts Comment partager les bénéfices ou les coûts dune action commune pour que tous soient satisfaits? Problème du multicast avec coût des arêtes partagé entre les participants

21 Cost-sharing Multicast edge e used by the paths of n(e) terminals charges each terminal c(e)/n(e). Terminals are selfish, non- cooperative. Nash equilibrium (N.E.): no terminal wants to change its path if everything else stays the same. Question: how much more costly is the outcome of selfish choices? That is: bound (cost of N.E.)/ OPT?

22 Impact of selfishness (cost of worst N.E.)/OPT = n [Koutsoupias Papadimitriou99] Price of anarchy (cost of best N.E.)/OPT = O(log n/ loglog n) [Anshelevich Dasgupta Kleinberg Tardos Wexler Roughgarden 04, Agarwal Charikar 06] Price of stability Question: what about (cost of N.E.)/OPT for N.E. reachable by some process? Best response dynamics: when activated, a terminal always chooses its current cheapest path to root

23 Two phase model Activation model [Chekuri Chuzhoy Lewin-Eytan Naor Orda 06] Phase 1: Terminals are activated one by one Phase 2: Re-activated terminals may change their path (arbitrary sequence of re-activations) Ω(log n/ loglog n) (cost of resulting N.E.)/OPT O(n log 2 n) [CCLNO] r t1 t3 t2 t4 Phase 1 r t1 t3 t2 t4 Phase 2 re-fires

24 Results Two phase model Ω(log n) (cost of resulting N.E.)/OPT O(log 3 n) General sequence of interleaved activations and re- activations, except that terminal arrivals (first activations) are in random order (cost of resulting N.E.)/OPT = O(n polylog(n)) We now sketch proof of O(log 3 n) result

25 Proving O(log 3 n) Potential function cost potential O(log n)*cost Re-activations decrease potential So, cost after phase 2 potential after phase 2 potential after phase 1 O(log n)*cost after phase 1 Must prove: (cost after phase 1) O(log 2 n)*OPT

26 Analysis of phase 1 1.Define Gap revealing linear program (cost after phase 1) Value(LP) 2.Relax the LP and write dual linear program Value(LP) Value(Dual) by linear programming duality 3.Define feasible dual solution… Value(Dual) Value(solution) 4.… of value O(log 2 n) OPT Value(solution) = O(log 2 n) OPT

27 Gap revealing LP s(i): cost of is path on arrival of i b(i): cost of new edges bought by i Cost after phase 1 is at most b(i)s If terminal j arrives after terminal i, then j could go to i and reuse is path with discount: s(j) d(j,i)+s(i)-b(i)/2

28 Relax, take dual Take a tree T over the terminals, such that child of t arrives after terminal t for all t Relax the linear program by writing the constraint s(j) d(j,i)+s(i)-b(i)/2 for j child of i in T only So, dual LP has one variable z(j) for each edge of T between j and parent(j) (C(i): children of i in T)

29 How is T defined? Must have: child of t arrives after terminal t for all t Take Eulerian tour π of min spanning tree of terminals. We have: Cost(π) 2 OPT Try to have: parent(j) is in the vicinity of j along π, and so: d(j,parent(j))=O(log 2 n)* Cost(π) r t1 t2t4 t3 Left subtree Right subtree Path to root

30 Random Arrivals Result O(n polylog(n)) proof sketch Arbitrary interleaving of arrivals and reactivations, but: assume order of arrivals is random Analyze potential Φ Reactivations decrease potential Φ(k): potential right after kth terminal arrives; bound E[Φ(k+1) - Φ(k) given Φ(k)]

31 Analysis: arrival of j Path picked by j could be complicated. Instead, Take Eulerian tour π of min spanning tree of terminals. Pick i randomly from previously arrived terminals in the vicinity of j along π, Connect j to i and follow is path.

32 Open Problem General theme: Bound cost of solutions reachable by best response dynamics Obvious open question: analyze arbitrary mix of arrivals and reactivations

33 Conclusion Interactions fructueuses entre informatique et economie/theorie des jeux


Télécharger ppt "Claire Mathieu (Brown) Théorie algorithmique des jeux."

Présentations similaires


Annonces Google