Diversité in vivo, Multi-coeurs in silico

Slides:



Advertisements
Présentations similaires
Treuil IRD Abdelwahed FSSM-Marrakech
Advertisements

10/31/02 Leïla Merghem - LIP6 Une approche Multi-Agents pour la Simulation de Réseaux de Télécommunications Leïla Merghem (LIP 6) Dominique Gaïti (LIP.
_________________________________________________________________________________________________________________________________________________________________________.
Comparaison et analyse combinatoire de structures biologiques arborescentes P. Ferraro S. Dulucq J. Allali A. Ouangraoua.
Efficient Simplification of Point-Sampled Surfaces
Calcul géométrique avec des données incertaines
Affichage interactif, bidimensionnel et incrémental de formules mathématiques Hanane Naciri et Laurence Rideau INRIA Sophia Antipolis CARI'2000.
Structures de données et complexité
DE ZÉRO à PAUP : Délimitation du groupe d'intérêt ("ingroup")
Diagram-Based Techniques
Alain Franc(1) & Nathalie Peyrard(2) (1) INRA, UMR BioGEco, Bordeaux
Phylogénie et distances génétique
Prédiction de sites dinteraction des protéines par analyse darbres phylogénétiques Stéfan Engelen Génomique Analytique, INSERM U511 Université Pierre et.
Méthodes de comparaison entre séquences multi-échelles végétales
Visualisation d’information interactive 5 : Graphes
Un nouveau regard sur les données moléculaires
Un nouveau regard sur les données moléculaires Barcoding Détermination de la frontière génétique Méthode :1 séquence, 40 espèces, 222 spécimens Résultats.
Modélisation des systèmes non linéaires par des SIFs
Master IXXI, cours interdisciplinaire de systèmes dynamiques Emmanuel Risler, INSA de Lyon 1 - Equations différentielles sur la droite.
variable aléatoire Discrète
Sytèmes dynamiques – modélisation Emmanuel Risler 2008 – 2009 INSA de Lyon - GEN.
Sylvain Mondon Météo-France
WP4 – L-IPSL – Sub-theme Impact of climate change on biogeochemical fluxes and ecosystems along the land-ocean continuum « A challenge will be to extend.
L’objectif est de présenter
Présentation SysML (Systems Modeling Language ) est basé sur UML et remplace la modélisation de classes et d'objets par la modélisation de blocs pour un.
Discussion sur la plate-forme CORMAS/BIOSMART II
Bernard Rousseau Laboratoire de Chimie Physique
Simulation multi-agent de phénomènes collectifs : quelques questions d’ordre épistémologique Frédéric AMBLARD Institut de Recherche en Informatique de.
Frédéric Amblard, Guillaume Deffuant – Cemagref LISC 22 Octobre 2002 – Table ronde Simulation AFH Nantes SimExplorer: un outil logiciel daide à lexploration.
Suites de matrices Quelques usages récurrents
Initiation à la conception de systèmes d'information
Concepts avancés en mathématiques et informatique appliquées
La segmentation
Rappel... Solution itérative de systèmes linéaires (suite et fin).
7.1 TRANSFORMATION LINÉAIRE Cours 19. Au dernier cours nous avons vus Le déterminant dune matrice carré Les propriétés du déterminant La matrice adjointe.
Département « Ecologie Evolutive »
Modélisation causale multiphysique
Master professionnel Statistique, informatique et techniques numériques (SITN)
ELEMENTS DE COURS 1. LERIDON H., TOULEMON L. (1997) – Démographie. Approche Statistiques et dynamique des populations. Paris, Economica. 2. FALISSARD.
Représentation des systèmes dynamiques dans l’espace d’état
Représentation des systèmes dynamiques dans l’espace d’état
Représentation des systèmes dynamiques dans l’espace d’état
6.1 LE LANGAGE MATRICIEL Cours 16. Aujourdhui, nous allons voir La définition dune matrice Plusieurs définitions de matrice particulière La somme de matrices.
GT Modèles Formels pour l'Interaction
Design dun système de vision embarqué. Application:
1.
L’adaptativité pour un solveur de l’équation de Vlasov
Cours du 25 octobre Mardi le 24 octobre
Rappel... Diagonalisation. Transformations linéaires.
Présentation de la méthode des Eléments Finis
10 février 2006GDR ISIS Journée Localisation et Navigation Projet EGNOS-BUS (Eurêka) André Monin, Wael Suleiman LAAS-CNRS.
High genomic deleterious mutation rates in hominids Eyre-Walker & P. D. Keightley Letters to Nature, Jan. 99.
Amélioration de la simulation stochastique
1 Alain Casali Christian Ernst Extraction de Règles de Corrélation Décisionnelles 29 Janvier 2009.
Vers les fonctions …. Objectifs Travailler sur les tableaux (type tableaux de proportionnalité, mais pas seulement !) Travailler sur la représentation.
Modèles Mathématiques et représentation discrètes pour la description des images couleur Luc Brun.
Introduction et Généralités sur l’Algorithmique
Calendrier (sur MathSV)
Alignement de séquences biologiques
Soutenance de Stage DEA / DESS
1/16 Chapitre 3: Représentation des systèmes par la notion de variables d’état Contenu du chapitre 3.1. Introduction 3.2. Les variables d’état d’un système.
Comparaison multi-échelle des précipitations du modèle Méso-NH et des données radar Colloque CNFSH – Ecole des Ponts ParisTech – 11/12 juin 2009 A., Gires.
La démarche de classification
Réseaux de Petri et suivi du joueur
Du Cahier des Charges à la Spécification Formelle ?
Les banques de séquences nucléiques
Classification évolutive Travaux pratiques et cas de la lignée verte Cours du 10/03/2016 Présentation: Hugo FONTES Conception : Hugo FONTES et Pierre CELLIER.
GdR MoMaS Novembre 2003 Conditions d’interface optimales algébriques pour la vibro-élasticité. François-Xavier Roux (ONERA) Laurent Sériès (ONERA) Yacine.
Chapitre 4 Equations différentielles ordinaires à n variables.
WAAPP GHANA NCoS REGIONAL CONFERENCE, 2016 Thème: Caractérisation agro-morphologique de 44 accessions de manioc (Manihot esculenta Crantz) cultivés en.
Transcription de la présentation:

Diversité in vivo, Multi-coeurs in silico Alain Franc INRA UMR BioGeCo Bordeaux

Questions Pourquoi y a-t-il plus de salamandres et moins d’escargots qu’en moyenne dans les Appalaches ? Comment caractériser, quantifier, modéliser la dynamique de la diversité ? Quels sont les patterns observés et pourquoi ?

Trois grands courants de l’écologie Ecologie évolutive 1850-1900 1960 - … Ecologie des communautés 1920, 1970, … Ecologie fonctionnelle 1940 … Ecologie mathématique 1920 …

Un enjeu actuel sur diversité et patterns Associer écologie patterns fruits des interactions ici et maintenant évolution patterns fruits de l’histoire coévolution

Quelques points (non) abordés Inventaires : du naturaliste au moléculaire Diversité génétique et interspécifique Assemblages locaux : communautés Patterns macroscopiques : macroécologie Echelles et niveaux d’organisation … e

Un détour … Le calcul comme exploration, non comme solution Notion « commune » de diversité : est à l’opposé de la notion de modèle, au sens de simplification, universalité, et compaction Par définition, la diversité est l’étude des différences et un modèle de ce qui rassemble Peut être abordée par la notion de complexité algorithmique de Kolmogorov-Chaitin : Un inventaire étant réalisé, sa diversité est la complexité algorithmique du jeu de données, entre la simplicité des modèles compacts pour générer les données, et l’aléatoire La diversité = ce qui échappe aux modèles … Donc … un défi de calcul … (la complexité ne peut se calculer : elle s’approche par une approche de Sherlock Holmes) Le calcul comme exploration, non comme solution

Diversité des espèces

Pour les plantes … herbiers

Etablir un dictionnaire …

Few individuals Many traits : genome wide cover Many individuals Few DNA regions of interest

Que faire ? ? Tableau 105 specimen × 103 base A travailler Alignements Tableau de distances Dimension reduction Pattern recognition … Clustering Phylogénies OTU Graphes

Des mathématiques discrètes Des tableaux de 105, bientôt 106 lignes (individus) avec 102, voire 103 colonnes (caractères) Des besoins de classification (CAH, en n3 si n individus …) visualisation (graphes) traitements calculs de distances matrice pleines 106 × 106 MDS (linéaire et non linéaire) communautés sur graphes modèles statistiques (k-mers)

Taxonomy on Edit distance Definition: The edit distance between two strings is defined as the minimum number of edits needed to transform one string into the other, with the allowable edit operations being insertion, deletion, or substitution of a single character.

Taxonomy on Edit distance Definition: The edit distance between two strings is defined as the minimum number of edits needed to transform one string into the other, with the allowable edit operations being insertion, deletion, or substitution of a single character. kitten → sitten (substitution of 'k' with 's') sitten → sittin (substitution of 'e' with 'i') sittin → sitting (insert 'g' at the end).

Distances évolutives : ultramétriques Un taxon est un disque

America del Sur Guyane

Jeu de données ~ 2000 individus ~ 500 espèces ( 4 ind. par espèce) 220 genres 35 familles 24 ordres Assignation taxonomique par des botanistes très entrainés Un marqueur trnH-psbA très variable rbcL plus conservé Il est impossible d’aligner l’ensemble du jeu de données

Question Contexte Chaque espèce est représentée par 4 séquences (environ) La théorie (botanique) indique une structure hiérarchique de la diversité espèces – genres – familles – ordres … Question La retrouve-t-on dans les distances entre séquences ? Méthode On place les séquences dans un espace euclidien avec suffisamment de dimensions telles que leur distance soit la distance génétique on analyse la forme du nuage …

Clusters ? … ~ 1000 individus blue -> Mimosoideae -------------------------------------- lightblue -> Lecythidaceae cyan -> Chrysobalanaceae green -> Annonaceae lightgreen -> Caesalpinioideae yellow -> Myrtaceae orange -> Elaeocarpaceae magenta -> Apocynaceae salmon -> Burseraceae red -> Malvaceae ~ 1000 individus

Chrysobalanaceae Couepia chrysocalyx (Poepp.) Benth. ex Hook. f. http://www.mobot.org/MOBOT/research/APweb/

Quelques algorithmes … Distance Application declic N.-W., S.-W. base/base metaMatch reads/base kmers k-mers read/base Très facilement distribuable sur une grille de calcul (ou un cluster) Calcul matriciel Algorithmes sur graphe (cc, cliques, community) Programmation dynamique Mathématiques discrètes Visualisation

Diatomées

Une question ═ On se donne une communauté algale Décrite en métagénomique par 106 read Un read a pour longueur ~ 420 bp On dispose d’une base de données de références Chaque référence de longueur ~ 1 500 bp On veut affecter chaque read à la faction de référence dont il provient Et en déduite la composition de la communauté ═

Une méthode On ne dispose pas pour cela d’une distance La question est en effet bipartite (pas de sens à l’inégalité triangulaire) Plutôt une question du style

La force brute … Une pseudo-distance : alignement local

Une communauté comme système

à fonctionnement massivement parallèle Un ensemble d’agents (noeuds d’un graphe) en interaction (liens) Notion de métapopulation un nœud est une communauté processus locaux de coopération, compétition, prédation couplages par migration

Computational Ecology Systèmes d’équations différentielles couplées de 102 à 103 éléments en interaction souvent spatialisés Modèles souvent de type champ moyen vers la diversité des individus … Inclusion de la stochasticité : Interacting Particle Systems Question : modèles simples sur évolution de variables globales (extension de la physique statistique)

Fil rouge pour une simulation des systèmes  Système Graphe Nœuds Entités Liens Interactions Exemples réseau trophique système de villes …  Spécificité au niveau des nœuds, des entités, voire des liens Diversité  Comportements plus réguliers au niveau macroscopique Modélisation Simulations intensives pour la communication entre le niveau microscopique et le niveau macroscopique entre diversité et modélisation

Les systèmes sont une construction de l’histoire … Sachant que … Dans un système dynamique … les règles d’évolution sont immuables (ici et maintenant) Or, un système réel est un système ouvert (ailleurs) avec héritages … (avant) Systèmes diversifiés règles évoluant dans le temps prise en compte de l’histoire Dans nos voies TGV et autoroutes, il y a un héritage des voies tracées sous l’Ancien Régime … Les systèmes sont une construction de l’histoire …

Remerciements Ph. Chaumeil, J.-M. Frigerio, H. Caron, R. Petit F. Hubert, A. Kremer J.-F. Molino , D. Sabatier S. Gonzales, M.-F. Prevost L. Kermarrec, F. Rimet, A. Bouchez S. Schbath, J.-F. Gibrat, S. Robin, J.-F. Daudin V. Breton, P. Gay A. Bretagnolle, L. Sanders, D. Pumain