La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Classification naturelle = phylogénie

Présentations similaires


Présentation au sujet: "Classification naturelle = phylogénie"— Transcription de la présentation:

1 Classification naturelle = phylogénie
DEMANDER AVIS ÉTUDIANTS HORAIRE BCM1521 (WetLab)

2 Principe des connexions
Comment comparer ? 1- Aile de chauve-souris 2- Bras humain 3- Bras d’alligator 4- Aile de puffin cendré Principe des connexions Geoffroy Saint-Hilaire (1818) Philosophie anatomique

3 Arbre = réseau connexe non cyclique
Quelques définitions Arbre = réseau connexe non cyclique noeud branche Réseau connexe non cyclique Réseau non connexe non cyclique Réseau connexe cyclique

4 Plusieurs graphismes pour les phylogénies
B C A B C D D B A A D B C C D A A B B C C D D

5 ARBRE NON RACINÉ et ARBRE RACINÉ
1 4 Oiseaux Placentaires Monotrèmes Marsupiaux 5 2 3 Oiseaux Monotrèmes Monotrèmes Monotrèmes Oiseaux Oiseaux Marsupiaux Marsupiaux Marsupiaux 1 2 5 Placentaires Placentaires Placentaires Marsupiaux Placentaires Placentaires Marsupiaux Monotrèmes Monotrèmes 3 4 Oiseaux Oiseaux

6 Racine et groupe extérieur
1 Oiseaux Placentaires Monotrèmes Marsupiaux Oiseaux Monotrèmes Marsupiaux 1 Placentaires Un groupe extérieur (outgroup) est presque toujours utilisé pour raciner les phylogénies moléculaires

7 Quelques exercices Crocodiles Oiseaux Dinosaures Lézards
D’après l’arbre ci-dessus, quelle expression décrit correctement les relations de parenté ? Un crocodile est plus proche parent d’un lézard que d’un oiseau Un crocodile est plus proche parent d’un oiseau que d’un lézard Un crocodile est aussi proche parent d’un oiseau que d’un lézard Un crocodile est proche parent d’un lézard, mais n’est pas proche parent d’un oiseau

8 Quelques exercices Phoque Cheval Girafe Hippopotame Baleine
D’après l’arbre ci-dessus, quelle expression décrit correctement les relations de parenté ? Un phoque est plus proche parent d’un cheval que d’une baleine Un phoque est plus proche parent d’une baleine que d’un cheval Un phoque est aussi proche parent d’un cheval que d’une baleine Un phoque est proche parent d’une baleine, mais n’est pas proche parent d’un cheval

9 Quelques exercices Volvox Pin Maïs Fougère Levure Homme Giardia E. coli Lequel(s) des arbres ci-dessous est faux, sachant que l’arbre ci-dessus est vrai ? Volvox Pin Homme Maïs Fougère Volvox Giardia Homme E. coli Levure Volvox Homme E. coli Pin Levure Giardia E. coli Pin Maïs Levure 1 2 3 4

10 Quelques exercices Lequel des quatre arbres ci-dessus décrit des relations de parenté différentes ?

11 Quelques exercices Lepidodendron Mousse Chêne If Psilotum Fougère Arbre Perte des feuilles Arbre Graine Vraies feuilles Dans l’arbre ci-dessus, on suppose que l’ancêtre était une herbe (et non un arbre) sans feuilles ni graines. D’après cet arbre et en supposant que tous les changements de ces caractères sont indiqués, laquelle des espèces actuelles est un arbre dépourvu de vraies feuilles ? 1) Lepidodendron 2) Mousse 3) Chêne 4) Psilotum 5) Fougère

12 Savoir lire et interpréter un arbre
Pour en savoir plus, et avoir plus d’exercices :

13 Arbre universel du vivant (Haeckel, 1866)

14 L’échelle des êtres d’Aristote (384-322 av. JC)

15 Relation d’ancêtres à descendants
«Poissons» Amphibiens «Reptiles» «Singes» Homme L’Homme et le Chimpanzé sont des “Singes”

16 Relation d’ancêtres à descendants
? ? ? ? «Poissons» Amphibiens Homme «Singes» «Reptiles»

17 Cas idéal AAAAAAAAAAA CAAAAAAAAAA AAAAAAAAAAC CUAAAAAAAAA CAGGAAAAAAA
Espèce 1 Espèce 2 Espèce 3 Espèce 4 CAAAAAAAAAA 1 AAAAAAAAAAC 1 CUAAAAAAAAA 1 CAGGAAAAAAA 2 AAAAAAAAUGC 2 AAAAGGCUAAC 4 Espèce 1 CUAAAAAAAAA Espèce 2 CAGGAAAAAAA Espèce 3 AAAAAAAAUGC Espèce 4 AAAAGGCUAAC Espèce AGG Espèce 3 AA------UGC Espèce 4 AA--GGCU--C Espèce 4 AAAAGGCUAAC Espèce 1 CU--AAAA--A Espèce 2 C-GGAAAA--A Espèce AAAAUGC

18 Avec n espèces, il y a (2n – 5)(2n – 7)…(5)(3)(1) arbres non racinés
Combien existe-t-il d’arbres ? A D D 3 espèces : 1 arbre B C D E 4 espèces : 3 * 1 arbres A B C D A B C D E 5 espèces : 5 * 3 * 1 arbres 7 (2*6-5) branches 6 espèces : 7 * 5 * 3 * 1 arbres Avec n espèces, il y a (2n – 5)(2n – 7)…(5)(3)(1) arbres non racinés

19 Le nombre d’arbres possibles
Augmentation exponentielle du nombre d’arbres possibles : problème NP-complet (Non-Polynomial)

20 Cas idéal Arbre #1 Arbre #2 Arbre #3 AAAAAAAAAAA CAAAAAAAAAA
Espèce 1 Espèce 2 Espèce 3 Espèce 4 CAAAAAAAAAA 1 AAAAAAAAAAC 1 CUAAAAAAAAA 1 CAGGAAAAAAA 2 AAAAAAAAUGC 2 AAAAGGCUAAC 4 Espèce 1 CUAAAAAAAAA Espèce 2 CAGGAAAAAAA Espèce 3 AAAAAAAAUGC Espèce 4 AAAAGGCUAAC Espèce AGG Espèce 3 AA------UGC Espèce 4 AA--GGCU--C Arbre #1 Arbre #2 Arbre #3 1 2 3 4

21 L’information phylogénétique
Site 2 Site 1 A 3 A 4 2 C 1 C A C 3 A C 2 4 A 1 changement 2 changements 1 A 2 U A 4 A 3 A Arbre #1 1 changement 1 A U 2 3 A A 4 A Arbre #2 1 changement 1 A U 2 A 3 4 A A Arbre #3 1 changement Site informatif : un site avec au moins deux nucléotides différents (états de caractère) présents au moins deux fois

22 Parcimonie maximale Choisir l’arbre nécessitant le plus petit nombre de substitutions (changements) Principe du “rasoir d’Occam” : la meilleure explication des données est la plus simple, celle qui nécessite le plus petit nombre d’hypothèses ad hoc Le nombre total de changements évolutifs sur une phylogénie (longueur de l’arbre) is simplement la somme du nombre de changements à chaque site Espèce 1 CUAAAAAAAAA Espèce AGG Espèce 3 AA------UGC Espèce 4 AA--GGCU--C Arbre #1 : L= =11

23 Cas idéal Sites informatifs Arbre #1 Arbre #2 Arbre #3 L=11 L=13 L=13
AAAAAAAAAAA 1 1 CAAAAAAAAAA AAAAAAAAAAC 1 2 2 4 CUAAAAAAAAA CAGGAAAAAAA AAAAAAAAUGC AAAAGGCUAAC Espèce 1 Espèce 2 Espèce 3 Espèce 4 Espèce 1 CUAAAAAAAAA Espèce AGG Espèce 3 AA------UGC Espèce 4 AA--GGCU--C Sites informatifs Arbre #1 Arbre #2 Arbre #3 1 3 1 2 1 2 2 4 3 4 4 3 L=11 L=13 L=13

24 Maximum de parcimonie Deux étapes de minimisation :
Pour un arbre donné, minimisation du nombre de changements nécessaires pour expliquer l’alignement Choix parmi tous les arbres possibles de celui ayant le plus petit nombre de changements

25 Une substitution multiple
AAAAAAAAAAA CAAAAAAAAAA CUAAAAAAAAA CAGGAAAAAAA 1 2 Espèce 1 Espèce 2 AAAAAAAAAAC AAAAAAAAAGU AAAAGGCUAAC 4 Espèce 3 Espèce 4 Espèce 1 CUAAAAAAAAA Espèce AGG Espèce 3 AA GU Espèce 4 AA--GGCU--C

26 Trop d’information tue l’information
Site 2 1 A U 3 Arbre #1 A A 2 A C 4 2 changements 1 A A 2 Arbre #2 A A 3 U C 4 2 changements 1 A A 2 Arbre #3 A A 4 C U 3 2 changements

27 Une substitution multiple
AAAAAAAAAAA CAAAAAAAAAA CUAAAAAAAAA CAGGAAAAAAA 1 2 Espèce 1 Espèce 2 AAAAAAAAAAC AAAAAAAAAGU AAAAGGCUAAC 4 Espèce 3 Espèce 4 Espèce 1 CUAAAAAAAAA Espèce AGG Espèce 3 AA GU Espèce 4 AA--GGCU--C Arbre #1 Arbre #2 Arbre #3 1 3 1 2 1 2 2 4 3 4 4 3 L=11 L=12 L=12

28 Une substitution multiple : une convergence
AAAAAAAAAAA CAAAAAAAAAA CUAAAAAAAAA CAGGAAAAAAA 1 2 Espèce 1 Espèce 2 AAAAAAAAAAC AAAGAAAAAGC AAAAGGCUAAC 4 Espèce 3 Espèce 4 Espèce 1 CUAAAAAAAAA Espèce AGG Espèce 3 AA-G-----GC Espèce 4 AA--GGCU--C Arbre #1 Arbre #2 Arbre #3 1 3 1 2 1 2 2 4 3 4 4 3 L=11 L=13 L=12

29 Deux substitutions multiples : convergence et réversion
AAAAAAAAAAA CAAAAAAAAAA CUAAAAAAAAA CAGGAAAAAAA 1 2 Espèce 1 Espèce 2 AAAAAAAAAAC AAAGAAAAAAA AAAAGGCUAAC 4 Espèce 3 Espèce 4 Espèce 1 CUAAAAAAAAA Espèce AGG Espèce 3 AA-G Espèce 4 AA--GGCU--C Arbre 1 Arbre 2 Arbre 3 1 3 1 2 1 2 2 4 3 4 4 3 L=10 L=11 L=10

30 Trois substitutions multiples
AAAAAAAAAAA CAAAAAAAAAA CUAAAAAAAAA GAAGAAAAAAA 1 2 Espèce 1 Espèce 2 AAAAAAAAAAC AAAGAAAAAAA AAAAGGCUAAC 4 Espèce 3 Espèce 4 Espèce 1 CUAAAAAAAAA Espèce 2 GA-G Espèce 3 AA-G Espèce 4 AA--GGCU--C Arbre 1 Arbre 2 Arbre 3 1 3 1 2 1 2 2 4 3 4 4 3 L=10 L=10 L=9

31 Vrai nombre de substitutions : 11
Homoplasie homoplasie : toute caractéristique présente chez deux espèces (ou plus) qui n'est pas présente chez leur ancêtre commun immédiat. Arbre 1 Arbre 2 Arbre 3 1 2 3 4 L=10 L=9 Les substitutions multiples impliquent une sous-estimation de la longueur de l’arbre Vrai nombre de substitutions : 11

32 Une substitution pour chaque union
Algorithme récursif de Fitch C G A 1) Passage de bas en haut : x et y les fils du noeud n et X, Y, N les ensembles de nucléotides correpondant à ces noeuds C G A {C,G} Une substitution pour chaque union C G A {A,C} {A} {C,G} {A,C,G} C G A {A,C} {A} {C,G} C G A {A,C} {C,G}

33 Algorithme récursif de Fitch
2) Passage de haut en bas : C G A {A,C} {A} {C,G} {A,C,G} Choix arbitraire d’un nucléotide à la racine On assigne au fils x du noeud n : a X si a N n’importe quel nucléotide de X sinon C G A C G A C G A

34 Heuristiques de recherche de topologies
Agglomération progressive des espèces Insertion sur toutes les branches Calcul du nombre de changements Choix de l’arbre le plus parcimonieux Nombre d’opérations : 3+5+7=15 (pour 105 arbres possibles) Pour 10 espèces : 63 versus 2 millions

35 Ordre d’agglomération des espèces
B C D E F D F E C B A Ajouter les espèces de manière aléatoire Répéter l’opération un grand nombre de fois Choisir l’arbre le plus parcimonieux

36 Subtree Pruning and Regrafting (SPR)
Algorithme de réarrangements Réarrangement local ou Nearest Neighbor Interchange (NNI) Y X W Z W X Y Z 2(n-3) possibilités Subtree Pruning and Regrafting (SPR) 2 1 3 4 5 6 2 1 3 4 5 6 4(n-3)(n-2) possibilités

37 Algorithme de réarrangements
Tree Bisection and Reconnection (TBR) 2 1 3 4 5 6 Une branche est coupée 2 1 3 4 5 6 2 1 3 4 5 6 Toutes les reconnexions possibles sont testées Etc. (2n1-3)(2n2-2) possibilités/coupure

38 Utilisation de contraintes a priori
G2 G4 G3 G1 G5 G11 G9 G10 G8 G6 11 espèces : 45 espèces : G7

39 Maximum de parcimonie Deux étapes de minimisation :
Pour un arbre donné, minimisation du nombre de changements nécessaires pour expliquer l’alignement Choix parmi tous les arbres possibles de celui ayant le plus petit nombre de changements

40 Coût = 10 Coût = 10 Coût = 11 Coût = 6 TOPOLOGIE 1 TOPOLOGIE 2
E1 TTACTT E2 TTA*TT E3 TT*CTT E4 TTACTT AC C->* A->* E1 TTACTT E2 TTA*TT E3 TT*CTT E4 TTACTT AC C->* A->* Coût = 10 Coût = 10 E1 TTACTT E2 TT*ATT E3 TT*CTT E4 TTACTT AC C->A A->* E1 TTACTT E2 TT*ATT E3 TT*CTT E4 TTACTT AC A->* C->A Coût = 11 Coût = 6 Coût : GAP = 5 SUBSTITUTION = 1

41 Quelle est la probabilité d’observer une colonne de l’alignement ?
Principes des approches probabilistes 1 C 4 A 2 A 3 C A C A C A C 2 changements 1 changement Quelle est la probabilité d’observer une colonne de l’alignement ? 1 C 2 A 3 C 4 A


Télécharger ppt "Classification naturelle = phylogénie"

Présentations similaires


Annonces Google