La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Les jeux (méthodes min-max et - ) L3 MI. 2 Introduction (1) Algorithme du minimax (ou min-max) –Recherche du meilleur coup –Jeux à somme nulle Jeu confrontant.

Présentations similaires


Présentation au sujet: "Les jeux (méthodes min-max et - ) L3 MI. 2 Introduction (1) Algorithme du minimax (ou min-max) –Recherche du meilleur coup –Jeux à somme nulle Jeu confrontant."— Transcription de la présentation:

1 Les jeux (méthodes min-max et - ) L3 MI

2 2 Introduction (1) Algorithme du minimax (ou min-max) –Recherche du meilleur coup –Jeux à somme nulle Jeu confrontant deux joueurs, S'achève à la victoire d'un des joueurs ou après un match nul. Exemples : dames, échecs, puissance 4, …

3 3 Introduction (2) Principe de fonctionnement : comparaison entre les différents choix proposés à l'ordinateur –Aboutir à une situation paraissant avantageuse, –Il est essentiel de pouvoir apprécier une situation donnée cest-à-dire de pouvoir la noter de façon numérique.

4 4 Fonction dévaluation Estime la force dune position. Exemple de valeurs : f(n) > 0 : position favorable au programme et défavorable à ladversaire f(n) < 0 : position défavorable au programme et favorable à ladversaire f(n) = 0 : position équilibrée f(n) = + : le programme gagne f(n) = - : ladversaire gagne Généralement, fonction linéaire : ce que lun des joueurs gagne lautre le perd.

5 5 Une méthode naïve Nœud terminal le plus favorable = nœud I (valeur 9). Le programme joue C qui permet d'atteindre l'état I. L'adversaire doit choisir entre les états H, I et J. Il joue logiquement J qui l'amène dans un état favorable Le programme perd. Les états D et E auraient été préférables. A9A9 B -5 C9C9 D2D2 E3E3 F -7 G -5 H3H3 I9I9 J -6 K0K0 L2L2 M1M1 N3N3 O2O2 Actions possibles du programme Actions possibles de ladversaire États terminaux

6 6 Principe du min-max (1) Exemple précédent : en jouant le coup étant susceptible de l'amener dans la meilleure situation possible, le programme a perdu. Raison : on ignore les mouvements de l'adversaire. Solution : toujours se préparer au pire (cest- à-dire que l'adversaire jouera le meilleur coup possible pour lui).

7 7 Le principe de la méthode min-max (2) Choisir les actions qui maximisent la fonction d'évaluation en supposant que l'adversaire choisira les actions qui la minimiseront. 1.Etendre l'arbre de jeu jusqu'au nœuds terminaux (ou à une profondeur déterminée), 2.Calculer la valeur de la fonction de gain pour chaque nœud terminal, 3.Propager ces valeurs aux nœuds parents (non-terminaux) en affectant à un nœud : La valeur minimum de ses fils lorsqu'ils résultent d'action de l'adversaire, La valeur maximum de ses fils lorsqu'ils résultent d'action du programme. Dans le premier cas, le parent est dit MIN, MAX dans le second.

8 8 MIN-MAX A3A3 B -5 C3C3 D0D0 E -7 F4F4 G -5 H3H3 I8I8 J9J9 K5K5 L2L2 M -7 S3S3 T5T5 U -7 V -9 P9P9 Q -6 R0R0 N4N4 O -5 W -3 X -5 Z#Z# Etats terminaux Programme - max Adversaire - min

9 9 Le principe de lélagage - (1) Certaines actions ne seront pas choisies par un adversaire intelligent. Il faut élaguer ces parties de larbre, cest-à-dire ne pas la développer. 1.Etendre larbre de jeu jusquà une profondeur N par recherche en profondeur, 2.Ne plus développer les successeurs dun nœud dès quil est évident que ce nœud ne sera pas choisi (compte tenu des nœuds déjà examinés), 3.Chaque nœud MAX garde la trace dune α-valeur égale à la valeur de son meilleur successeur trouvé jusquici, Chaque nœud MIN garde la trace dune ß-valeur égale à la valeur de son plus mauvais successeur trouvé jusquici.

10 10 Règles délagage 1.Interrompre la recherche dun nœud MAX si sa α-valeur β-valeur de son parent 2.Interrompre la recherche dun nœud MIN si sa β-valeur α-valeur de son parent

11 11 - A =3 B =-5 C =3 D0D0 E =2 F =4 G -5 H3H3 I8I8 J =9 K =5 L2L2 M S3S3 T5T5 U -7 P9P9 Q -6 R0R0 N4N4 O =-3 W -3 X -5 V -9 Z#Z# Etats terminaux Programme - max Adversaire - min

12 12 Statistiques Voici un exemple de comparaison de coût sur un algo min-max avec et sans coupures α-β. Ces mesures ont été prises sur un programme jouant au jeu Othello et analysant 5 coups à l'avance (profondeur de l'arbre = 5)

13 13 En résumé Les algorithmes de jeux utilisent des arbres de recherche représentant alternativement les actions du programme et celles de ladversaire. La fonction dévaluation estime la qualité dune situation pour chaque joueur : –une valeur positive correspond à une situation favorable au programme –une valeur négative correspond à une situation défavorable au programme –une valeur nulle correspond à un équilibre Min-max est une procédure qui choisit les actions en supposant que ladversaire choisira toujours sa meilleure action. Lélagage α-β est une procédure qui peut éliminer une grande partie de larbre de recherche permettant ainsi daugmenter la profondeur de recherche. A l'origine les stratégies de jeux ont été étudiées pour aider la recherche en intelligence artificielle mais leur force réside principalement dans la puissance de calcul des machines.


Télécharger ppt "Les jeux (méthodes min-max et - ) L3 MI. 2 Introduction (1) Algorithme du minimax (ou min-max) –Recherche du meilleur coup –Jeux à somme nulle Jeu confrontant."

Présentations similaires


Annonces Google