La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Les méthodes probabilistes en phylogénie moléculaire: fondements, usages et controverses Collège de France, Juin 2009 Nicolas Galtier UMR 5554 - Institut.

Présentations similaires


Présentation au sujet: "Les méthodes probabilistes en phylogénie moléculaire: fondements, usages et controverses Collège de France, Juin 2009 Nicolas Galtier UMR 5554 - Institut."— Transcription de la présentation:

1 Les méthodes probabilistes en phylogénie moléculaire: fondements, usages et controverses Collège de France, Juin 2009 Nicolas Galtier UMR Institut des Sciences de l'Evolution - Montpellier

2

3 La révolution cladistique: injecter le Darwinisme dans la systématique - une classification fondée sur la phylogénie - des relations de cousinage, et non de descendance, entre les espèces actuelles - les états de caractères dérivés partagés comme marqueurs des relations de parenté

4 Etats de caractères partagés ancestraux vs. dérivés amphibiensserpentsoiseauxmammifères amnios non oui non fiable + sang chaudoui non trompeur non membresouinonoui non-informatif - On fait confiance aux caractères les plus nombreux: principe de parcimonie

5 La révolution moléculaire

6

7 AUGUACCA GAUUAGCG AAUGUAUC AUGGACCA AAUUAGCG UAUCUAUC GCGUACCA GAUAAGCG AAUGUAUC AUGAACCA GAUUAGCG AUUGUACC AUGUACCA GAUUAGCG AAUGUAUC AUGUACCA GAUUAGCG AAUGUAUC CAGUACCA GAUUAGCG AGGGUAUC AGGUACCA GAUUACCG AUUGUCUC AUGUACCA GAUUAGCG AAUGUAUC AUGUACCA GGCUAGCG AAUGUAAC AUGUACCA GAUUAGCG AAUGUAUC ACGUACUA GAUGAGCG AAUGUAUC GUGUACCA GAUUGGCG ACUGUAUC AUGUACAA GAUUAGCG AAUGUAUC AUGUACCU GAUUAGCC AAUGUAUC AUGUACCA GAUUAGCG AAUGUAUC AGGUACCA GACCAGCG AAUGUAUC AUGUACCA GAUUAGCU AAUGUAUC AUGUACCA GAUUAGCG AAUGUAUC AUGUACCA GAUUAGCG AAUGUAUC AGGCACCA GAUUAGCG CAUGUGUC AUGUACCA GAUUAGCG AAUGUAUC AAGUACCA GAUUAGCG AAUGUAUC AUGUACCA GAUGAGUG AAUGUAUC AUGUACCG GAUUAGCG AAUGUAUC AUGUACCA GAUUAGCG AAUGUAUC AUGUACCA GAUUAGCG UAUGUAUC AUGUACCA GAUUAGCG AAUGUAUU UUGUACCA GAUUAGCG GAUGUAUC AUGUACCA GACUAGCG AAUAUAUC AUGUACCA GCCUAGCG GAUGUAGC

8 La révolution moléculaire: un nouveau type de caractères Les caractères moléculaires (séquences d'ADN, ARN ou protéines) sont: très nombreux non-interprétables non-orientables tous de même nature à états discrets et connus soumis à des processus évolutifs communs peu adéquats pour l'analyse cladistique propices à l'analyse statistique

9 La méthode de parcimonie maximale a b c 1: X X X 2: X Y Y 3: Y X Y 4: Y Y X x y X X Y Y A données=séquences:

10 La méthode de parcimonie maximale a b c 1: X X X 2: X Y Y 3: Y X Y 4: Y Y X données=séquences: x x X Y Y X A

11 La méthode de parcimonie maximale a b c 1: X X X 2: X Y Y 3: Y X Y 4: Y Y X données=séquences: A C Un excès de sites c soutient l'arbre C Un excès de sites a soutient l'arbre A

12 Parcimonie et attraction des longues branches a b c 1: X X X 2: X Y Y 3: Y X Y 4: Y Y X données=séquences: A C Un excès de sites a soutient l'arbre A Si les branches 3 et 4 sont trop longues, l'arbre C génère un excès de sites a. Comment distinguer? X XY Y x x

13 Parcimonie et attraction des longues branches a b c d e 1: X X X X Z 2: X Y Y X Y 3: Y X Y Y X 4: Y Y X Z X données=séquences: A C Comment distinguer?

14 Parcimonie et attraction des longues branches Les données de séquences sont sujettes à réversion. L'évolution n'est pas toujours parcimonieuse. Les processus de l'évolution moléculaire communs à l'ensemble des sites peuvent être identifiés et pris en compte. Nécessité d'une approche statistique Felsenstein 1978

15 Modélisation Markovienne en phylogénie moléculaire Données (D): n séquences alignées = p sites homologues A C A G T T C... A G A G C T A... A G A G T T A... T C A G T T C... T C G G T T T... A C G T ACGT Paramètres ( ): topologie darbre T longueurs de branches l i générateur M Vraisemblance: L( ) = Pr (D | ) Felsenstein 1981

16 A C A G T T C... A G A G C T A... A G A G T T A... T C A G T T C... T C G G T T T... X0X0 X1X1 X2X2 X3X3 l1l1 l2l2 l3l3 l4l4 l5l5 l6l6 l7l7 l8l8 A C G T ACGT M T D d1d1 d2d2 dkdk Pr(D | T,l i, M Pr d k | T,l i, M (indépendance des sites) Pr d 1 | T,l i, M = Pr(X 0 =x 0 ).Pr(X 1 =x 1 | X 0 =x 0 ). Pr(d 11 =A| X 2 =x 2 ). Pr(d 12 =A| X 1 =x 1 ). Pr(X 2 = 2 |X 0 =x 0 ). Pr(d 13 =A| X 2 =x 2 ). Pr(X 3 =x 3 | X 2 =x 2 ).Pr(d 14 =T| X 3 =x 3 ). Pr(d 15 =T| X 3 =x 3 ) x0x0 x1x1 x2x2 x3x3 p ij (l)=(e Ml ) ij Modélisation Markovienne en phylogénie moléculaire

17 - un domaine de recherche en plein développement, en interaction étroite avec statisticiens et informaticiens. - des modèles et des techniques de plus en plus sophistiqués, répondant au volume sans cesses croissant des jeux de données - un standard dans le monde de la systématique moléculaire et de la génomique évolutive - reconstruire le "process" en même temps que le "pattern"

18 Erinaceus Scalopus Felis Manis Lama Sus Bos Hippopotamus Physeter Equus Rhinocerotidae Tonatia Myotis Tadarida Cynopterus Pteropus Hipposideros Megaderma Laurasiatheria Tupaia Cynocephalus Homo Lepus Aplodontia Sciuridae Hystricidae Mus Rattus Euarchontoglires Xenarthra Cabassous Bradypus Choloepus Cyclopes Myrmecophaga Tamandua Dasypus kappleri Dasypus novemcinctus Priodontes Tolypeutes Chaetophractus Euphractus Zaedyus Afrotheria Elephas Dugong Procavia Orycteropus Macroscelidae Amblysomus Echinops Delsuc et al 2002 Phylogénie moléculaire des mammifères placentaires

19 MORPHOLOGIE MOLECULES Phylogénie des métazoaires

20 La phylogénie universelle selon l'ARN ribosomique EUCARYA ARCHAEA BACTERIA

21 56.1% GC% ancestral estimé : Evolution du GC% de l'ARN ribosomique

22 modèle standard modèle non-homogène et non-stationnaire Un modèle pour prendre en compte les variations de composition en bases

23 SSU LSU Topt GC% ARNr L'ancêtre commun universel n'était pas hyperthermophile Galtier et al. 1999, Boussau et al 2009

24 Horloges moléculaires et datations Douzery et al 2004

25 Contraintes et adaptations moléculaires a b c d e f g S T M F S L P S T M F I F P S T M F T F P S T M F Y F M S T M F H F H S T M F H F T S T M F Y F P S T M F L F P S T M F F F F S T M F H F T S T M F Y F A S T M F P F P S T M F P H L S T M F P F P S T M F L H T S T M F W V F S T M F F T P S T M F T V F S T M F L F L A A M V L F I A T M I L F I A T N A L F I A I V S L F I S V M F L F I T T V I L F I F T T L L F I S T M F W S I S T M M W S T S T M F M N Q S T M F P H Y S T M F P H P PRIMATESPRIMATES Pupko & Galtier 2002

26 M M.r 1 M.r 2 M.r 3 M.r 1 M.r 2 M.r 3 Modéliser l'hétérotachie uniforme "rates across sites" "covarion" Galtier & Jean-Marie 2004

27 Controverses - molécules vs. morphologie: vers un rapprochement - parcimonie vs. approche statistique: un débat en perte de vitesse. circularité? Pas plus que dans toute inférence statistique. les processus de l'évolution moléculaire sont corrélés entre sites. renoncer à la parcimonie n'implique pas de renoncer au cladisme

28 Défis et perspectives - systématique moléculaire: lever les dernières incertitudes - datations moléculaires: résoudre les conflitss - génomique évolutive: lien structure/fonction/évolution des molécules - phylogénomique des procaryotes: importance des transferts horizontaux


Télécharger ppt "Les méthodes probabilistes en phylogénie moléculaire: fondements, usages et controverses Collège de France, Juin 2009 Nicolas Galtier UMR 5554 - Institut."

Présentations similaires


Annonces Google