Simulation des systèmes complexes Systèmes multi-agents et gestion des ressources renouvelables Montpellier, Campus de Baillarguet décembre 2002
Les origines Systèmes multi-agent utilisés dans le cadre des sciences de l’environnement et de l’écologie équipe: Gestion des ressources renouvelables et environnement. Session de formation : –Gestion des Ressources –Simulation des systèmes complexes, SMA : 12 sessions depuis 96.
Applications multi- agent Sim-Delta : pêcheries artisanales (Bousquet) SeaLab : Stratégies de reproduction des poissons (Le Page) Shadoc :Périmètres irrigués au Sénégal (Barreteau), Pasteur, JuMel : Pastoralisme au Sahel (Bah, Rouchier) Djemiong : Faune sauvage au Cameroun (Bakam) Kayanza : Bois de feu au Burundi (Guizol) Sinuse: allocation de l’eau en Tunisie (Feuillette) Mae Saleap: érosion/diversification en Thaïlande (Trébuil) Gestion des propriétés de chasse en Camargue (Mathevet) Bois-énergie au Sahel (Antona, Bah) Sylvo-pastoralisme en région méditerranéenne (Etienne) And bcp d’autres modèles théoriques
Plan du cours Introduction à la problématique de la complexité Systèmes dynamiques Automates cellulaires Théorie des jeux Systèmes multi agents A. Concepts et théories
Concepts Dynamique, équilibre et attracteurs Contrôle et viabilité Décision et stratégie Coopération et évolution Emergence
Concepts et domaines Mathématiques : systèmes dynamiques, contrôle Physique : réseaux d’automates Informatique : systèmes multi-agents Biologie : interaction évolution Sciences sociales : représentations et échanges
Comprendre la co-adaptation entre la dynamique des ressources et l’organisation socio-economique Comment utiliser ces modèles dans des projets de développement adaptatifs ? Plan du cours B. Simulation Multi-Agent et gestion des ressources naturelles: vers une démarche méthodologique
Simulation et gestion adaptative: une approche Jeu de rôle et SMA : une représentation commune –pour apporter des connaissances sur le comportement, –pour restituer le modèle aux acteurs et le valider, –pour tester des scénarios par simulation Expériences –allocation de l’espace entre éleveurs et agriculteurs au Sénégal [d’Aquino], –négociations entre un éleveur et un forestier en forêt méditerranéenne [Etienne], –périmètres irrigués au Sénégal [Barreteau]
Plan du cours Ecologie –Chasse et agriculture en Camargue (Raphaël Mathevet, Tour du Valat) –Sylvo-pastoralisme et conservation de la nature dans les Cévennes (Michel Etienne) Economie –Relations entre transhumants et sédentaires au Cameroun (Juliette Rouchier, CNRS CREQAM) – Filière bois-énergie au Sahel (Martine Antona, CIRAD TERA-REV) C. Applications
Une approche de la complexité
La problématique de la complexité Interactions et points de vues
Complexité et gestion des ressources
Modélisation et dynamiques collectives Environnement (ressources communes) ? ? ? ?
Environnement (ressources Communes) ? ?
Hypothèses de travail Les processus individuels et collectifs de gestion des ressources communes et de l’environnement reposent: –Sur des représentations partagées des interactions entre les acteurs et l’écosystème. Vers des modélisations pour: –Articuler des points de vue multiples ; –Articuler des niveaux multiples (du local ou global) ; –Permettre des analyses rétrospectives et prospectives ; –Être intelligible par les acteurs (par et pour les acteurs!).
Définition des systèmes complexes Définition: –Système complexe: ensemble d’éléments en interactions entre eux et avec l’extérieur : Distinction entre l’ensemble (le système) et le reste (l’environnement/l’extérieur): dépendance à la question Prédominance des interactions : plus que la somme des parties. Autres caractéristiques: –Descriptions à des niveaux multiples (a minima: élément/système) –Formation de structures –Émergence
Approches des systèmes complexes Analytique : élément par élément (économie néo-classique, parcelle, individu, etc.) Holistique ou systémique : comportement global du système (macro-économie, modèles à compartiments, modèles statistiques) Constructiviste : articulation entre les comportements individuels des éléments (local) et le comportement global du système (global).
Pourquoi l’approche constructiviste ? On connaît les comportements individuels et on veut inférer le comportement global: –Ingénierie sociale, aide à la négociation On connaît le comportement global et on cherche une explication à partir des comportements locaux: –Articulation local-global, aide à la décision Pertinence pour les écosystèmes et les sociosystèmes –Défi de la complexité : comportements loin de l’équilibre –Intelligibilité : description intuitive en termes d’objets et d’acteurs plutôt que de variables et d’équations
Théorie des jeux
Jeux discrets à deux joueurs Deux joueurs (A et B), des stratégies (X,Y,Z,T) des gains (a,b,c,d,e,f,g,h) a,ba,b A joue X A joue Y B joue ZB joue T e,fe,f g,hg,h c,dc,d
Jeu symétrique A et B disposent des mêmes stratégies les gains et pertes sont réciproques a,ba,b A joue X A joue Y B joue XB joue Y d,dd,d b,ab,a c,cc,c
Jeu à somme nulle b,-b A joue X A joue Y B joue XB joue Y 0,00,0 -b,b 0,00,0
Roc, ciseaux, papiers -1,1 A joue R A joue C B joue RB joue C 0,00,0 1,-1 0,00,0 B joue P 1,-1 A joue P -1,1 1,-1 0,00,0
Equilibres Une stratégie conservatoire est celle d’un joueur qui minimise sa pire perte Un équilibre non-coopératif (ou de Nash) est un couple de stratégies tel que si un seul des joueurs change de stratégie, ses pertes augmentent Un optimum de Pareto est un couple de stratégies tel que tout changement de stratégie d’un joueur se traduit par une perte pour l’un ou pour les deux
Strategie conservatoire: S’arrêter / Traverser Tout couple sauf Trav. / Trav. 0,-2 S’arrêter Traverser S’arrêterTraverser -3,-3 -2,0 -1,-1 Exemple : le croisement S’arrêter Equilibre de Nash : Optima de Pareto : -6-2
Dilemme du Prisonnier 3,03,0 Cooperation Trahison CooperationTrahison 1,11,1 0,30,3 2,22,2 Deux détenus sont emprisonnés séparément. Ils sont accusés de complicité pour dans une affaire criminelle. Afin de persuader un prisonnier d’avouer et de dénoncer son complice, le marché suivant (exprimé dans la matrice en terme d’année de remise de peine) est proposé D’un point de vue individuel: séparément à chacun d’entre eux. Ils doivent prendre leur décision sans pouvoir communiquer directement. il vaut mieux trahir D’un point de vue collectif: il vaut mieux coopérer
Ce genre de situations se rencontre fréquemment dans la vie: concurrence entre deux entreprises, conflits de personnes, comportement social de certains animaux, guerre des tranchées durant la guerre 14-18, etc... [Axelrod, 1992] Ce modèle très simple de la théorie des jeux semble appréhender en miniature les tensions entre cupidité individuelle et intérêts de la coopération collective. Pour cette raison, il est devenu un des modèles les plus utilisés en sociologie, biologie et économie. Dilemme du prisonnier et modélisation
Dilemme du prisonnier et tragédie des communs [Hardin 1968] Privatisation des bénéfices, socialisation des pertes dues à la dégradation de l’environnement Le coût social est vu comme une externalité: il n’est pas inclus dans le marché !!! La propriété commune n’implique pas l’accès libre !!!
Le dilemme du prisonnier itéré Le dilemme du prisonnier devient plus intéressant et plus réaliste lorsque la durée de l'interaction n'est pas connue. On peut alors envisager de se souvenir du comportement d'un joueur à son égard et développer une stratégie en rapport (caractère adaptatif) –Par exemple, si je sais que mon adversaire ne coopère jamais, mon intérêt sera de ne pas coopérer non plus –Par contre si je sais que mon adversaire coopérera toujours quoi qu'il arrive, j'aurai intérêt à être vicieux et ne jamais coopérer La stratégie « Donnant donnant » (Tit for Tat) consiste à coopérer au premier coup puis à systématiquement copier le comportement de son interlocuteur à la rencontre précédente, s'avère particulièrement robuste
Jeux évolutionnaires Stratégie: phénotype comportemental Soit p une proportion d’individus adoptant une stratégie alternative J au milieu d’individus (1-p) se comportant selon la stratégie dominante I. Le gain de I opposé à J est noté E(I,J). Il s’exprime en terme d’augmentation de la fitness, notée W E(I,I)E(I,I) E(J,I)E(J,I) E(J,J)E(J,J) E(I,J)E(I,J) Strategie I Strategie J Strategie IStrategie J
ESS ESS (Evolutionary Stable Strategy): une stratégie telle que, si tous les membres d’une population l’adoptent, alors aucune stratégie alternative mutante ne peut envahir (sous l’effet de la sélection naturelle) cette population W 0 étant la fitness initiale de tous les individus, les fitness de chacune des stratégies sont: W(I) = W 0 + (1-p)E(I,I) + pE(I,J) W(J) = W 0 + (1-p)E(J,I) + pE(J,J) I est une ESS si elle satisfait une des deux conditions suivantes: E(I,I) > E(J,I) E(I,I) = E(J,I) et E(I,J) > E(J,J)
Maynard Smith et Price (1973) Comportement reproductif des animaux Deux stratégies –Hawk: provoque et poursuit la lutte jusqu’à la blessure ou la retraite de l’opposant (H) –Dove : engage le duel mais bat en retraite si l’autre escalade (D) Le jeu Faucon - Colombe 0.5(V-C) 0V/2 V Strategy H Strategy D Strategy H Strategy D E(H,H) E(H,D) E(D,D)E(D,H) Si V >= C Alors H = ESS
Stratégie mixte Stratégie I: se comporter selon la stratégie H avec la probabilité P et selon la stratégie D avec la probabilité 1-P Si I est une ESS, alors E(H,I) = E(D,I), d’où: PE(H,H) + (1- P)E(H,D) = PE(D,H) + (1- P)E(D,D) 0.5(V-C)P + V(1-P) = 0.5V(1-P) P = V/C Stratégie mixte et polymorphisme génétique
Automates
Définition Un automate est la donnée de –S ensemble des états –I ensemble des entrées –O ensemble des sorties –Une fonction d’évolution ou fonction d’état –Une fonction de sortie
Représentation schématique
Le distributeur de boissons TInputStateOutput 0NothingWaitingMenu 1Ask coffeeWaitingMenu 2NothingNeed = 2Menu 3NothingNeed = 2Need 2F 41F coinNeed = 2Need 2F 5NothingNeed = 1Need 2F 6NothingNeed = 1Need 1F 71F coinNeed = 1Need 1F 8NothingNeed = 0Need 1F 9NothingWaitingCoffee 10NothingWaitingMenu
Réseaux d’automates Définition Un réseau d’automates est un groupe d’automates; les entrées des uns sont les états des autres Différentes architectures régulière, connectivité totale, aléatoire, structures en couches, structure ad hoc
Architectures
Fonction d’état 0000-> > > >1 … >0
Fonctions d’états: tables Etat du nœud prend des valeurs déterminées, 1 et -1 Interactions entre deux nœuds Wij donné constant Pour chaque nœud on compare
Automates cellulaires 1. Architecture régulière 2. Fonction d’état uniforme et discrète 3. Mode de fonctionnement synchrone et déterministe
Dimension 1
Dimension 1: parité
Classification de Wolframm Classe 1 : converge vers un état fixe Classe 2 : converge vers un cycle Classe 3 : désordonné Classe 4 : chaotique
Classification de Wolframm
Exemple en dimension 2 « Matière excitée »
Réseau de percolation Matrice régulière constituée de points blancs, noirs ou rouges. Initialement une proportion p de blancs et 1-p de noirs On met un rouge, à chaque pas les voisins d’un rouge deviennent rouges On cherche la valeur de p pour laquelle on pourra aller d’un bord à l’autre