Simulations par agents situés en biologie Sébastien PICAULT – équipe SMAC Sebastien.Picault@lifl.fr
Plan de l’exposé 1. Problématiques visées 2. Nature des modèles à construire 3. L’utilisation des agents situés 4. Perspectives en biologie
Introduction Quelques enjeux théoriques en biologie moléculaire/cellulaire : • « spécificité » des régulateurs • problème d’échelle • compréhension de l’organisation du génome • différenciation en types cellulaires spécifiques approche par modélisation / simulation
• La fécondité des modèles est évaluée par « l’expérience » Modélisation ? • Au départ, le « modèle » – représentation théorique – délibérément schématique – jugé selon sa fécondité par rapport à un objectif spécifié : comprendre un phénomène / le reproduire / le prédire … • La fécondité des modèles est évaluée par « l’expérience » – expérience scientifique : construction – simulation : tests sur un substitut de la situation réelle – expérience de pensée (irréalisable en fait ou en principe)
• Le substitut peut être : – physique (soufflerie…) – mathématique Simulation ? • Simuler, c’est reproduire un phénomène sur un substitut du réel afin de : – tester des hypothèses d’une théorie quant aux explications de ce phénomène – prévoir l’évolution du phénomène • Le substitut peut être : – physique (soufflerie…) – mathématique – informatique
Contraintes sur les modèles Risque lié à la complexité : se limiter à la description du système Construire, en plus des modèles prédictifs, des modèles explicatifs • compréhension des mécanismes sous-jacents • formulation de nouvelles hypothèses • estimation de leur plausibilité • « laboratoire virtuel »
Modèles prédictifs / explicatifs Exemple en IA : labyrinthe • solutions prédictives = orientée fins ex : réseaux de neurones • solutions explicatives = orientée moyens ex : base de règles + apprentissage
Les modèles mathématiques – 1 = modèles à équations différentielles Modèles « faciles » à obtenir à partir de la loi d’action de masse • prédictions quantitatives (après ajustement des paramètres) • analyse qualitative • parfois solution exacte
Les modèles mathématiques – 2 Inconvénients : • aucun contrôle sur la granularité du modèle : concentration d’espèces moléculaires • aucun contrôle sur la complexité du modèle (fonction du nombre d ’espèces et des réactions) modèle « trop complexe » par rapport aux phénomènes observés ? • modèle dépourvu de pouvoir explicatif
Les modèles mathématiques – 3 Exemple : proies / prédateurs Exemple (écologie) [Lotka & Volterra 1925] X proies Y prédateurs + croissance exponentielle – autolimitation – prédation – mortalité exponentielle + prédation Relation producteurs / consommateurs comme dans les réseaux de régulation !
Les modèles mathématiques – 4 Exemple : proies / prédateurs Problèmes : • prédit une espérance mathématique, d’après un comportement moyen • une seule échelle : le groupe d’individus, réduit à une variable • influence de l’espace non représentée (migrations entre territoires) • les ajustements de paramètres n’ont pas de valeur explicative
Le rôle essentiel de la spatialité • Nature des molécules : – enzymes (fonction induite par la forme) – ADN (positions relatives régions codantes/régulatrices ; encombrement) • Circulation de molécules et signalisation au sein de la cellule • Circulation et signalisation dans le milieu intercellulaire • Inscription physique dans un environnement
Suggestions... S’inspirer de techniques de modélisation et de simulation ayant fait leurs preuves en biologie « classique » (éthologie) • Simulations centrées individus (ou « multi-agents ») • Parallélisme et point de vue décentralisé • Modèles d’agents situés
Les agents situés : définition [Demazeau, Ferber 1998] • Une entité réelle ou virtuelle autonome qui – évolue dans un environnement – peut percevoir cet environnement – peut agir dans cet environnement – peut communiquer avec les autres agents – manifeste un comportement autonome • notion de « comportement » = mise en relation des perceptions et des actions, selon l’état de l’agent • notion d’interaction
Architecture générique Environnement perception action Espace Objets Agents Agent Connaissances Buts Contrôle
La simulation par agents situés : Caractéristiques • Destinée à l’étude des phénomènes complexes (écosystèmes, organisation sociale, économie, milieux granulaires...) • Modèle de comportement et interactions arbitrairement complexes – réactivité + auto-organisation – intentionnalité + représentations + buts • Un agent peut représenter n’importe quelle entité « agissante » (molécule, cellule, tissu...)
Utilisation pour la compréhension de mécanismes • Exploration d’hypothèses 1. modèle biologique : hypothèses sur le rôle des entités impliquées 2. transposition en un modèle de comportement d’agent 3. simulation et comparaison aux données plausibilité / infirmation hypothèses
Exploration d’hypothèses Exemple • Le tri collectif ex : tri du couvain fourmis L. niger Transposition en robotique collective [Deneubourg & al. 1991]
Représentation des niveaux d’abstraction • La SMA permet de choisir le niveau d’abstraction auquel on souhaite se placer, selon : – les objectifs – le niveau de détail souhaité – les données disponibles – les ontologies manipulées par les experts • Permet de vérifier la pertinence du niveau habituellement choisi • Ne correspond pas forcément à une entité réelle
Représentation des niveaux d’abstraction • Changement d’échelle 1. Problème = formation / évolution de structures spatio-temporelles 2. Choix (arbitraire) d’un modèle d’agent produisant le même comportement que son homologue naturel 3. Détection automatique de structures 4. Réification éventuelle sous forme d’agents
Agents « boules d’eau » tropisme simple + interactions limitées Exemple : hydrologie • RIVAGE [Servat 2000] • Simuler le ruissellement • Comprendre et prédire des phénomènes hydrologiques : formation de mares, débordements, ravines, etc. Agents « boules d’eau » tropisme simple + interactions limitées
Exemple : hydrologie • Prise en compte des abstractions du domaine • Création automatique d’agents « macroscopiques » (décision distribuée) • Dissolution automatique des agents « macroscopiques » (ex : débordement) • Réduction du temps de calcul • Extension du modèle : érosion, infiltration... • Intelligibilité accrue des résultats
Application à la biologie • Signalisation dans les réseaux de régulation Les enzymes peuvent être vues comme des « agents intelligents » effectuant des opérations sophistiquées de traitement de l’information [Fisher et al. 1999, 2000], [Paton 2001] = modèle d’agent « non réaliste » permettant de représenter une structure spatio-temporelle
Application à la biologie • Approfondissement de la notion de « spécificité » exemples : sites de régulation = moins de 10 bases sur plusieurs millions… hypothèses déterministes vs. stochastiques simulations impliquant divers modèles d’agents pour estimer la vraisemblance de chaque hypothèse
Application à la biologie • Mécanismes de signalisation dans le « développement » – vision finaliste / déterministe : système régulé par une circulation de messages – vision « écosystème » / attracteurs (Kupiec, Prigogine) : base stochastique + stabilisation divers modèles d’interactions entre agents
Perspective à plus long terme • Intégration des divers modèles et de chaque échelle concernée en « modules » idée défendue par Hartwell, Hopfield & al. (Nature, 1999) = utilisation de l’ingénierie : « biologie synthétique » « laboratoire virtuel » permettant de reconstruire partiellement des cellules et d’observer leur comportement