Pattern Matcher ancel_a, creuso_a, chanio_f 1
Le jeux Une plaine qui contient de lherbe, des moutons et des loups. Un système daction en tour par tour. La plaine na pas de bord (toroidal) Une seule ia par espèce. 2
Le système Exécution des actions Analyse des performance des actions Neurone a crée des action 3
Les changements Une partie du moteur logique refait. Grosse optimisation Réécriture de la pousse de lherbe. Le réseau de neurone prend maintenant les 5 actions précédentes La mise en place de lalgo gen. 4
Réseaux de neurones manuel 2 couche cachées 238 neurones en entrée (les case vue, la faim, et les 5 dernière actions) 238 neurones pour les couches cachées 7 neurones de sortie (les actions) Learning rate : 0.7f 5
Gene de lenvironnement Gene des réseaux de neurones. Nombre et taille des couches cachées. Learning rate et fonctions dactivations. Step dapprentissage et de décision. Gene de lespèces. Les poids de lévaluation. 6
Lalgorithme génétiques 20 Environnement qui tournent en parallèles pendant 30min. On évalue chaque environnement, on choisie les parents proportionnellement a leurs performance. On choisie le maillon faible en inversant la perf. 1 chance sur 10 davoir une mutation. 7
Conclusion Il nous faut plus de processeur. Il nous faut plus de temps de calcul. 8
Environnement des l'IA Partiellement Observable Continue (la simulation évolue). Déterministe (par de jeux de hasard). Discrète. Compétitif 9