Les méthodes probabilistes en phylogénie moléculaire:

Slides:



Advertisements
Présentations similaires
Taxonomie bactérienne
Advertisements

Modélisation markovienne et phylogénie moléculaire:
EvoLyon 2009 L’arbre de la vie Manolo Gouy
Cladogramme.
F. Bataille CEA, Service Hospitalier Frédéric Joliot, Orsay, France
L1 Lire avec aisance (à haute voix, silencieusement) un texte
Rôle des bureaux d'études privés en matière d'analyse statistique Hassen Zargouni Tunis, le 14 avril 2005.
Métabolisme révision décembre Révisions de métabolisme.
Un aperçu de la bioinformatique moléculaire
PARTIE 1 : Temps, Évolution et Génétique
DE ZÉRO à PAUP : Délimitation du groupe d'intérêt ("ingroup")
Où est né l’homme moderne?
Espèce et spéciation : problématique générale
La distinction pattern/process est-elle applicable à Darwin?
Phylogénie et distances génétique
Prédiction de sites dinteraction des protéines par analyse darbres phylogénétiques Stéfan Engelen Génomique Analytique, INSERM U511 Université Pierre et.
Colloque Traitement et Analyse de séquences : compte-rendu
1 DISIC Option Systèmes Intelligents / Données, Documents et Connaissances DISIC Option Systèmes Intelligents / Données, Documents et Connaissances.
Etablissement de Phylogénie
introduction Tenter de situer l’homme au sein du règne animal en
Le remplacement moléculaire
Un nouveau regard sur les données moléculaires
Un nouveau regard sur les données moléculaires Barcoding Détermination de la frontière génétique Méthode :1 séquence, 40 espèces, 222 spécimens Résultats.
Expertise et formation du lméca ESIA / Université de Savoie
Modélisation markovienne en phylogénie :
UNIVERSITÉ DE LA MÉDITERRANÉE CENTRE D’OCÉANOLOGIE DE MARSEILLE
Les preuves de l’évolution
Exemple 19: pont roulant A P A’
Bioinformatique =?? génomique protéomique
Génétique adaptative des pathogènes
Des RRA à la diagnosticabilité
Évaluations génomiques fiables d’une race et d’un pays à l’autre
DURIBREUX, Michèle & COCQUEBERT & HOURIEZ, Bernard,
R:255, G:1, B:1 H:0, S:100, V:100 R:182, G:139, B:24 H:44, S:87, V:71 1 – Le logo de lAFES: Faut-il utiliser le/les logos originaux de lAFES sur le nouveau.
La recherche de parenté chez les vertébrés
Sylvie Alayrangues Jacques-Olivier Lachaud
Responsables P. Maury & R. Babilé
Présenté par Mathieu Almeida, Amine Ghozlane
Caricature IDF Dis, M'sieur le Moniteur de Biologie marine c'est quoi t'est-ce donc la classification phylogénétique ? Non ! Claude Duboc Professeur de.
La phylogénie Définition :
Maîtrise des risques et sûreté de fonctionnement – Avignon – 6-10 Octobre 2008 Modélisation des dysfonctionnements dun système dans le cadre dactivités.
Travail de génétique STROMBONI Muriel SCLIPTEUX Virginie
Alphy XIV – GTGC Rencontres Alignements et Phylogénie &
IA IPR Académie de Rennes Le dernier est-il désavantagé.
? Présenté par Virginie ABDALLAH et Maryline BOSSUS M1 BEM - UE 33 DOM
STAGES L2S4.
Jean-François LOUF, Geoffroy Guéna & Yöel FORTERRE* Eric Badel**
Diagnostic utilisant les tests d’hypothèses structurés.
Approches non intrusives des éléments finis stochastiques
Cours 1 & 2 : RELATIONS D’HOMOLOGIE
Suivi temporel d’une réaction chimique
Rappels- introduction Le vivant =
Phylogénie : quelques docs
Systématique Ibo 2009.
High genomic deleterious mutation rates in hominids Eyre-Walker & P. D. Keightley Letters to Nature, Jan. 99.
Introduction à la taxinomie
Photorécepteurs et évolution
Analyses phylogénétiques
Présenté par Mathieu Almeida, Amine Ghozlane
Classification naturelle = phylogénie
L’évolution.
L’établissement des relations phylogénétiques
Un segment peut contenir plusieurs gènes les gènes sont nombreux et/ou en interaction leurs effets sont inégaux et instables les mutations se fixent séquentiellement.
L’analyse d’ADN et la génomique
La démarche de classification
La phylogenèse Définition :
Introduction à la Bio-Informatique
Les banques de séquences nucléiques
Classification évolutive Travaux pratiques et cas de la lignée verte Cours du 10/03/2016 Présentation: Hugo FONTES Conception : Hugo FONTES et Pierre CELLIER.
Calcul Intensif en Génomique Comparative Laurent Duret Laboratoire de Biométrie et Biologie Evolutive.
Transcription de la présentation:

Les méthodes probabilistes en phylogénie moléculaire: Collège de France, Juin 2009 Les méthodes probabilistes en phylogénie moléculaire: fondements, usages et controverses Nicolas Galtier UMR 5554 - Institut des Sciences de l'Evolution - Montpellier galtier@univ-montp2.fr

La révolution cladistique: injecter le Darwinisme dans la systématique - une classification fondée sur la phylogénie - des relations de cousinage, et non de descendance, entre les espèces actuelles - les états de caractères dérivés partagés comme marqueurs des relations de parenté

Etats de caractères partagés ancestraux vs. dérivés non 4 membres oui non non-informatif - sang chaud oui non trompeur + + amphibiens serpents oiseaux mammifères amnios non oui oui oui fiable On fait confiance aux caractères les plus nombreux: principe de parcimonie

La révolution moléculaire

AUGUACCA GAUUAGCG AAUGUAUC AUGAACCA GAUUAGCG AUUGUACC CAGUACCA GAUUAGCG AGGGUAUC AGGUACCA GAUUACCG AUUGUCUC GCGUACCA GAUAAGCG AAUGUAUC AUGGACCA AAUUAGCG UAUCUAUC AUGUACCA GAUUAGCG AAUGUAUC AUGUACCA GAUUAGCG AAUGUAUC AUGUACCA GCCUAGCG GAUGUAGC AUGUACCA GAUUAGCG AAUGUAUC AUGUACCA GAUGAGUG AAUGUAUC AAGUACCA GAUUAGCG AAUGUAUC AGGUACCA GACCAGCG AAUGUAUC AUGUACCA GAUUAGCG AAUGUAUC AUGUACCG GAUUAGCG AAUGUAUC AUGUACCA GGCUAGCG AAUGUAAC AUGUACCA GACUAGCG AAUAUAUC AUGUACCA GAUUAGCU AAUGUAUC AUGUACCU GAUUAGCC AAUGUAUC AUGUACCA GAUUAGCG AAUGUAUC AUGUACCA GAUUAGCG AAUGUAUC AUGUACCA GAUUAGCG AAUGUAUC UUGUACCA GAUUAGCG GAUGUAUC AUGUACCA GAUUAGCG AAUGUAUC AUGUACAA GAUUAGCG AAUGUAUC AGGCACCA GAUUAGCG CAUGUGUC AUGUACCA GAUUAGCG AAUGUAUU AUGUACCA GAUUAGCG UAUGUAUC AUGUACCA GAUUAGCG AAUGUAUC GUGUACCA GAUUGGCG ACUGUAUC ACGUACUA GAUGAGCG AAUGUAUC

La révolution moléculaire: un nouveau type de caractères Les caractères moléculaires (séquences d'ADN, ARN ou protéines) sont: très nombreux propices à l'analyse statistique non-interprétables peu adéquats pour l'analyse cladistique non-orientables tous de même nature à états discrets et connus soumis à des processus évolutifs communs

1 2 3 4 La méthode de parcimonie maximale X Y x y A a b c 1: X X X 2: X Y Y 3: Y X Y 4: Y Y X données=séquences:

1 1 2 3 4 2 3 4 La méthode de parcimonie maximale X Y x A x a b c 1: X X X 2: X Y Y 3: Y X Y 4: Y Y X données=séquences:

1 2 3 4 1 2 3 4 1 4 2 3 La méthode de parcimonie maximale A a b c Un excès de sites a soutient l'arbre A a b c 1: X X X 2: X Y Y 3: Y X Y 4: Y Y X données=séquences: 1 4 2 3 C Un excès de sites c soutient l'arbre C

1 1 2 3 4 2 3 4 4 1 2 3 Parcimonie et attraction des longues branches Un excès de sites a soutient l'arbre A a b c 1: X X X 2: X Y Y 3: Y X Y 4: Y Y X Comment distinguer? données=séquences: Si les branches 3 et 4 sont trop longues, l'arbre C génère un excès de sites a. X Y x 4 1 C 2 3

1 1 2 3 4 2 3 4 4 1 2 3 Parcimonie et attraction des longues branches a b c d e 1: X X X X Z 2: X Y Y X Y 3: Y X Y Y X 4: Y Y X Z X Comment distinguer? données=séquences: 4 1 C 2 3

Parcimonie et attraction des longues branches Les données de séquences sont sujettes à réversion. L'évolution n'est pas toujours parcimonieuse. Les processus de l'évolution moléculaire communs à l'ensemble des sites peuvent être identifiés et pris en compte. Nécessité d'une approche statistique Felsenstein 1978

Modélisation Markovienne en phylogénie moléculaire b a Paramètres (q): topologie d’arbre T longueurs de branches li générateur M Données (D): n séquences alignées = p sites homologues A C A G T T C . . . A G A G C T A . . . A G A G T T A . . . T C A G T T C . . . T C G G T T T . . . Vraisemblance: L(q) = Pr (D | q) Felsenstein 1981

Modélisation Markovienne en phylogénie moléculaire dk M l4 A C A G T T C . . . l1 X1 l5 A C G T b a A G A G C T A . . . X0 l6 A G A G T T A . . . l2 l7 X2 T C A G T T C . . . l3 X3 l8 T C G G T T T . . . Pr(D | T ,li, M) = P Pr(dk | T ,li, M) (indépendance des sites) Pr(d1 | T ,li, M) = SSSS Pr(X0=x0).Pr(X1=x1| X0=x0). Pr(d11=A| X2=x2). Pr(d12=A| X1=x1). Pr(X2=2|X0=x0). x0 x1 x2 x3 Pr(d13=A| X2=x2). Pr(X3=x3| X2=x2). Pr(d14=T| X3=x3). Pr(d15=T| X3=x3) pij(l)=(eMl)ij

Modélisation Markovienne en phylogénie moléculaire - un domaine de recherche en plein développement, en interaction étroite avec statisticiens et informaticiens. - des modèles et des techniques de plus en plus sophistiqués, répondant au volume sans cesses croissant des jeux de données - un standard dans le monde de la systématique moléculaire et de la génomique évolutive - reconstruire le "process" en même temps que le "pattern"

Phylogénie moléculaire des mammifères placentaires Elephas Dugong Procavia Orycteropus Afrotheria Macroscelidae Amblysomus Echinops Bradypus Choloepus Cyclopes Myrmecophaga Tamandua Dasypus kappleri Xenarthra Dasypus novemcinctus Chaetophractus Euphractus Zaedyus Priodontes Cabassous Tolypeutes Tupaia Cynocephalus Homo Lepus Euarchontoglires Aplodontia Sciuridae Hystricidae Mus Rattus Erinaceus Scalopus Felis Manis Lama Sus Bos Hippopotamus Laurasiatheria Physeter Equus Rhinocerotidae Tonatia Myotis Tadarida Cynopterus Pteropus Hipposideros Delsuc et al 2002 Megaderma

Phylogénie des métazoaires MOLECULES MORPHOLOGIE

La phylogénie universelle selon l'ARN ribosomique BACTERIA ARCHAEA EUCARYA

Evolution du GC% de l'ARN ribosomique Giardia 70.4% Entamoeba 43.7% Desulfurococcus 64.2% Thermoproteus 63.5% M.jannashi 62.3% M.vannieli 57.7% Halococcus 58.9% Halobacterium 58.7% Thermus 61.3% Thermotoga 60.9% Euglena 51.7% FUNGI 48.6% PLANTA 50.4% METAZOA 52.4% EUCARYA CRENARCHAE EURYARCHAE BACTERIA LOW GC GRAM+ 54.2% PROTEOBACTERIA 54.1% HIGH GC GRAM+ 57.0% CHLOROPLASTS 52.5% 56.1% GC% ancestral estimé :

Un modèle pour prendre en compte les variations de composition en bases w q q modèle standard q q q q q q 1 4 2 5 3 w q1 q2 q3 modèle non-homogène et non-stationnaire q4 q5 q7 q8 q6 1 4 2 5 3

L'ancêtre commun universel n'était pas hyperthermophile LSU 80 Topt 40 SSU 80 Topt 40 50 60 70 GC% ARNr Galtier et al. 1999, Boussau et al 2009

Horloges moléculaires et datations Douzery et al 2004

Contraintes et adaptations moléculaires a b c d e f g S T M F S L P S T M F I F P S T M F T F P S T M F Y F M S T M F H F H S T M F H F T S T M F Y F P S T M F L F P S T M F F F F S T M F Y F A S T M F P F P S T M F P H L S T M F L H T S T M F W V F S T M F F T P S T M F T V F S T M F L F L A A M V L F I A T M I L F I A T N A L F I A I V S L F I S V M F L F I T T V I L F I F T T L L F I S T M F W S I S T M M W S T S T M F M N Q S T M F P H Y S T M F P H P P R I M A T E S Pupko & Galtier 2002

Modéliser l'hétérotachie uniforme "covarion" M M.r1 M.r2 M.r3 n "rates across sites" M.r1 M.r2 M.r3 Galtier & Jean-Marie 2004

Controverses - molécules vs. morphologie: vers un rapprochement - parcimonie vs. approche statistique: un débat en perte de vitesse . circularité? Pas plus que dans toute inférence statistique . les processus de l'évolution moléculaire sont corrélés entre sites . renoncer à la parcimonie n'implique pas de renoncer au cladisme

Défis et perspectives - systématique moléculaire: lever les dernières incertitudes - datations moléculaires: résoudre les conflitss - phylogénomique des procaryotes: importance des transferts horizontaux - génomique évolutive: lien structure/fonction/évolution des molécules