Pattern Matcher Ancel_a, Creuso_a, chanio_f
Le jeux Une plaine qui contient de lherbe, des moutons et des loups. Un système daction en tour par tour. La plaine na pas de bord (toroidal) Une seule ia par espèce.
Environnement des l'IA Partiellement Observable Continue (la simulation évolue). Déterministe (par de jeux de hasard). Discrète. Compétitif
Le système Exécution des actions Analyse des performance des actions Neurone a crée des action
Analyse de tendance Pas de set prédéterminé. Un choix basé sur une tendance Seuil décisionnel relatif aux autres neurones Random en dessous du seuil
Surspécialisation vs indécision Trouver la bonne balance entre récompense et remise en cause. Valorisation de lentrainement variable. Système capable de revenir a un état normal
Réseaux de neurones 2 couche cachées 41 neurones en entrée (les case vue et la faim) 41 neurones pour la première couche caché 20 neurones pour la deuxième. 7 neurones de sortie (les actions) Learning rate : 0.4f
Conclusion On a un truc qui tiens la route