La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Parcimonie Généralités Principe Orientation de l’arbre Caractères

Présentations similaires


Présentation au sujet: "Parcimonie Généralités Principe Orientation de l’arbre Caractères"— Transcription de la présentation:

1 Parcimonie Généralités Principe Orientation de l’arbre Caractères Procédure Algorithme exact Algorithme branch and bound Algorithme heuristique Analyse des résultats Retour aux caractères Arbre consensus Saturation robustesse Congruence

2 Phénétique, évolutionnisme, cladisme
Convergences Homoplasies Réversions Similitudes Symplésiomorphies Homologies partagées Synapomorphies Phénétique Évolutionnisme Cladisme

3 Apomorphies partagées
Homologie A B C u 1 v w x y z A et C B et C A et B Homologies partagées Apomorphies partagées 2 1 3 1 A C B u v w x y z A C B u v w x y z Phylogénie évolutive Phylogénie cladiste

4 Parcimonie 1 A B C X 1 y A B C A B C x x y y x 2 pas 3 pas

5 Parcimonie 2 A D B C A B C D 10 pas 7 pas A B C D U 1 V W X Y Z u u v
1 V W X Y Z A D B C A B C D u u v v z y w w x x y u z x v y w 10 pas 7 pas

6 Arbre raciné ou non B A C D E ou A B C D E Arbre non raciné
4 A B C D E 1 A B C D 1 7 6 5 3 2 4 A B C D E 5 E A B C D E 2 A B C D E 6 ou A B C D E A B C D E 3 A B C D E 7 Arbre non raciné 7 arbres racinés

7 Raciner un arbre Critères ontogéniques problème posé par la néoténie
Critères paléontologiques - absence de certains groupes - la parenté ne doit pas être trop éloignée Critères chorologiques critère secondaire insuffisant seul Critère extra groupe

8 Extra-groupe 1 X A B C X A B C 2 pas :il y a ambiguïté X ext-g A B C P
Q Q’ Extra-groupe 1 X A B C X A B C P’ P’ Q Q’ 2 pas :il y a ambiguïté P P Q Q’

9 Extra-groupe 2 X Y A B C X Y A B C 1 pas 2 pas X Y A B C Q Q’ Q Q Q’ Q

10 Extra-groupe 3 X Y A B C X Y A B C 2 pas dans chaque cas,
on ne peut trancher R’ R

11 Extra-groupe 4 X Y Z A B C X Y Z A B C 3 pas 2 pas X Y Z A B C R R’ R

12 Extra-groupe 5 Y Z A B C X X C A B Y Z 1 pas
Le choix des groupes externes est un à-priori. Si l’on conteste cette qualité on peut trouver un arbre plus court 1 pas R R’

13 Caractère (1) c t 1 2 3 A B C D A D B C T3 A B C D T2 A B C D T1 type
B C D A D B C T3 Caractère (1) A B C D T2 A B C D T1 type T3 T2 T1 C1 0 pas 0 pas 0 pas constant C2 1 pas 1 pas 1 pas non info C3 1 pas 2 pas 2 pas info

14 Caractère (2) À états multiples Binaire 0 , 1 , 2 , 3 0 , 1 Réversible
0123 Ou 1 2 3 Irréversible 0123 Réversible 01 Irréversible 01 Additifs 0 3 coûte 3pas 01 coûte 1pas 02 coûte 2 pas Non additifs 0 3 coûte 1pas 01et 02 aussi

15 Caractère (3) 5 vers de A C G T 5 1 1 A G C T Graphe des états d’un caractère et matrice correspondante. Les transversions sont comptées 5 fois plus que les transitions.

16 Modèles de Wagner, Camin-Sokal, Dollo
t 1 2 3 4 5 6 7 8 9 A B C D E X Modèles de Wagner, Camin-Sokal, Dollo A B C D E X 3 1 2 9 4 5 6 7 8 14 pas (Camin-Sokal) E A B C D X E A B D C X 3 2 9 1 2 9 1 2 3 1 4 5 6 7 8 6 7 8 9 2 apomorphie convergencee réversion 13 pas (Wagner) 15 pas (Dollo)

17 Une espèce éteinte: le quagga

18 Positions informatives
Gène Cytochrome Oxydase NADH Déshydrogénase position 4 10 67 103 28 58 71 Quagga A C T Z.pl. Z.mt. Cheval G Vache

19 C'est l'arbre le plus court. On continue cependant sur les 3 arbres.
Méthode exhaustive (1) Avec 3 espèces un seul arbre est possible. Zèbre pl CTT Quagga Zèbre mt TCC 1 2 3 Zèbre pl CTT Quagga Zèbre mt TCC 1 2 3 Le branchement pour la troisième espèce peut se faire sur n'importe laquelle des branches 1, 2 ou 3. Cheval TCC 6 pas Zèbre pl CTT Quagga Zèbre mt TCC 1 2 3 Cheval TCC 3 pas Zèbre pl CTT Quagga Zèbre mt TCC 1 2 3 Cheval TCC 6 pas C'est l'arbre le plus court. On continue cependant sur les 3 arbres.

20 Méthode exhaustive (2) Zèbre pl CTTATCC Quagga Zèbre mt TCCATTC Cheval TCCGCCT 123 6 457 TCCATCC Zèbre pl CTT Quagga Zèbre mt TCC 1 2 3 Cheval 3 pas 4 5 Vache TCAGCTT 14 pas CTTATCC 123 Zèbre pl Zèbre mt TCCATTC Cheval TCCGCCT Quagga 345 Vache TCAGCTT 7 TCCATTT 6 On peut ajouter une nouvelle espèce de 5 façons différentes. TCCATCC 456 11 pas TCCATCC 123 6 457 Zèbre pl CTTATCC Zèbre mt TCCATTC Cheval TCCGCCT Quagga 14 pas Vache TCAGCTT CTTATCC CTTATCC Zèbre pl Zèbre mt TCCATTC Cheval TCCGCCT Quagga Vache TCAGCTT CTTATCC 123 Zèbre pl Zèbre mt TCCATTC Cheval TCCGCCT Quagga TCCATTC Vache TCAGCTT 457 3 9 pas 3456 6 7 1236 6 TCCGCTT TCCATCT 45 11 pas TCCATCT

21 Méthode exhaustive(3) Après avoir évalué tous les arbres on choisit le ou les plus courts

22 1 Évaluation de la longueur d’un arbre au hasard.
Branch and Bound 1 Évaluation de la longueur d’un arbre au hasard. 2 L’exploration d’un chemin s’arrête dès que cette longueur est dépassée

23 Nombre d’Arbres Possibles
1 2 3 4 5 1 2 3 1 2 3 4 x-2 nœuds x-3 segments internes x segments externes Nombre d’arbres non racinés n Tn=  (2k-5) k=3 Nombre d’arbres racinés Tn=  (2k-3) N Tn non raciné Tn raciné 10 20 2,21643 *1020 soit plus de 8*1021

24 Algorithme de Wagner1 1 2 3 4 5 A B D
(Farris 1970 : methods for computing Wagner trees.Syst. Zool., 18:374-85) Règle d’agglomération: les taxons les plus éloignés sont connectés C T 1 2 3 4 5 A B D Distances 2 à 2 AB=3 BC=2 CD=4 AC=3 BD=2 AD=3 D 01100 C 00011 Y 00000 1 On connecte C et D (distance la pus grande) A 10000 2 Puis on ajoute A (ou B) au nœud Y AY=1/2(AC+AD-CD)=1/2(3+3-4)=1 BY=1/2(BC+BD-CD)=1/2(2+2-4)=0 3 C’est donc A que l’on ajoute en premier.

25 Algorithme de Wagner2 BY’ = 0,5 BY’’ = 1 BY’’’ = 0,5 D C 00011 Y A D C
Il reste à placer B sur un des 3 segments YA, YC ou YD. S’il est sur CY Y’’’B=1/2(BC+1/2(BA+BD)-1/2(AC+DC))=0,5 S’il est sur AY Y’’B=1/2(BA+1/2(BC+BD)-1/2(CA+DA))=1 S’il est sur DY Y’B=1/2(BD+YB-YD) or YB=1/2(AB+CB-AC) et YD=1/2(CD+AD-AC) Donc Y’B=1/2(BD+1/2(BA+BC)-1/2(CD+AD))= 1/2(2+1/2(3+2)-1/2(4+3)=0,5 BY’ = 0,5 BY’’ = 1 BY’’’ = 0,5 Donc B est mis en Y’’ Y’’’ B D 01100 C Y 00000 A 10000 D 01100 C 00011 Y 00000 A 10000 B 01010 Y’’ B Y’ B Y’’ 00000

26 Algorithme de Wagner 3 D C A B A B 6 pas C D 6 pas A C 7 pas B D
Le résultat donne un des arbres qui n’est pas le plus court parmi les 3 arbres possibles. On peut à partir de là par branch swapping (ici NNI suffit) obtenir l’un des plus courts. D 01100 A 10000 C 00011 B 01010 00000 D 01100 A 10000 C 00011 B 01010 00000 01000 00010 6 pas 6 pas D 01100 A 10000 C 00011 B 01010 00000 7 pas

27 Branch swapping:réarrangement local(NNI)
x y z w y x z w Exemple 2 a e f b c d x w z y a e f b c d a e f b d c Exemple 1 Nearest-Neighbor Interchange

28 Branch swapping:réarrangement global(SPR)
d e f c a e f b d c coupure a b a b e f d c e f c d a b Subtree Pruning Regrafting

29 Branch swapping:réarrangement global(TBR)
f b d c coupure e f d a b c e f d a b c e d f 2 sous arbres à reconnecter de toutes les façons possibles Tree Bisection-Reconnection

30 Exploration du paysage des arbres avec une heuristique

31 Matrice Non informatifs Informatifs Homoplasiques C T 1 2 3 4 5 6 7 8
9 10 11 12 13 14 15 16 17 18 19 20 A B D E ancêtre Non informatifs Informatifs Homoplasiques

32 DELayed TRANsformations
E D 8 9 7 4 5 6 1 2 3 C 19 20 B A 17 18 homoplasie Il y a convergence sur les branches de A et C pour les caractères 14 15 et 16 Dans cet exemple, l’option MINF donnerait le même résultat.

33 ACCelerated TRANsformation
8 9 7 4 5 6 1 2 3 19 20 B A 17 18 La réversion est préférée à la convergence pour rendre compte de l’homoplasie, elle concerne 3 caractères: 14, 15 et 16 réversion

34 Exclusion et pondération 1
A G G C T G C A A T C G T G A G A C T T C C A T C G T G A C A C T G C C A * * T C G A C G C T G C G A T C G T G A C G C T T C G A T C G T G La pondération différente entre transitions et transversions entraîne des valeurs différentes affectées aux différents changements d’états du caractère 8. Il n’existe plus une valeur unique affectée à ce caractère.

35 Exclusion et pondération 2
A G G C T G C A A G C C A G A G A C T T C C A G T C T G A C C C T G C C A G G G T G A C G C T G C G A G C G A G A C T C T T C G A G A G T G A G A C T G C A A G T C T G Régions inversées répétées

36 Matrice de coût BEGIN ASSUMPTIONS; USERTYPE tv STEPMATRIX=4 A C G U

37 sites informationnels
Variabilité des nucléotides en fonction de leur position dans le codon dans le gène rbcL position 1 position 2 position 3 toutes les positions nombre total de sites 416 413 409 1238 sites variables 81 44 347 472 sites informationnels 52 20 293 365

38 Saturation: principe D C B A 4 8 16 6 20 28 16 41 32 27 40 42
Ve Si 4 8 16 6 20 28 16 41 32 27 40 42 Saturation 10 20 30 40 50 transitions transversions

39 Comparaison de la vitesse d’évolution en transitions et en transversions pour la position 3 des codons du gène rbcL transitions transversions

40 Comparaison de la vitesse d’évolution en transitions et en transversions pour les positions 1 et 2 des codons du gène rbcL transitions transversions

41 Saturation CT GA CG GC AC TG Taxon A AGGT Taxon B ACCT
Ancêtre commun ACGT Taxon A AGGT Taxon B ACCT Ancêtre commun ACGT CT GA CG GC TG AC Pas de saturation: le nombre de changements observés est égal au nombre réel. Saturation: le nombre de changements observés est inférieur au nombre réel.

42 CI, RI et RC m s g m=Lg minimum de l’arbre s=Lg réelle de l’arbre
g=Lg maximum de l’arbre m g s

43 Variation de l’indice de consistance en fonction du nombre de taxa
Formule empirique NT: nb de taxa CI= 0,90-0,022NT+0,000213(NT)2 Sanderson, Donoghue (1989)Patterns of variation in levels in levels of homoplasy. Evolution 43 pp Nb. Tax. CI 15 0,6179 16 0,6025 17 0,5876 18 0,5730 19 0,5589 20 0,5452 21 0,5319 22 0,5191 23 0,5067 24 0,4947 25 0,4831 26 0,4720 27 0,4613 Nb. Tax. CI 28 0,4510 29 0,4411 30 0,4317 31 0,4227 32 0,4140 33 ,0,4060 34 0,3980 35 0,3910 36 0,3840 37 0,3776 38 0,3716 39 0,3660 40 0,3608

44 Consensus strict et semi strict
F E D C B A C B A Arbre 1 F E D C A B C A B Arbre 2 F E D F E D C A B C B A D F E F E D Consensus strict Consensus semi strict

45 Consensus majoritaire

46 Consensus d’Adams A B C D E F G H I Arbre 1 Arbre 3 A B D E C F G H I
A D C B E F G H I Consensus d’Adams A C B D E F G H I Consensus majoritaire A C B D E F G H I

47 Indice de Bremer D=1 Consensus des arbres de Consensus des arbres de
F G Consensus des arbres de Lg21 pas A B C D E F G Consensus des arbres de Lg=20 pas

48 Congruence : principe Le premier jeu de données donne des arbres parcimonieux de Lg=x Le second jeu de données donne des arbres parcimonieux de Lg=y La concaténation des 2 jeux de données donne des arbres parcimonieux de Lg=z Un test statistique permet de dire si la différence entre x+y et z est significative ou non

49 On détermine la distribution des valeurs de D.
Congruence : test ILD D=(lgx+lgy)-lgz D est-il significatif? Jeu 1 >1 AAAA >2 AGGA >3 AGAG >4 AAGG Jeux 1+2 >1 AAAAggag >2 AGGAagga >3 AGAGgagg >4 AAGGaaaa Jeu 2 >1 ggag >2 agga >3 gagg >4 aaaa 100 tirages au hasard Simulation n >1 AggAAggg >2 GagGGaaa >3 GgaGAggg >4 AaaAGaaa 100 jeux simulés Simulation n du jeu 1 >1 AggA >2 GagG >3 GgaG >4 AaaA Simulation n du jeu 2 >1 Aggg >2 Gaaa >3 Aggg >4 Gaaa Estimations de z On détermine la distribution des valeurs de D. si pb Dobs5%  Incongruence Estimations de x Estimations de y

50 Comparaison des deux méthodes de calcul d’arbre
Méthodes de parcimonie Méthodes de distance Calcul d’une distance globale Examen des caractères les uns après les autres Un seul arbre retourné par le programme La méthode peut retourner plusieurs arbres également parcimonieux Pas de test de robustesse de l’arbre unique (excepté le bootstrap) Il y a un test de robustesse des noeuds (mesure de l’homoplasie dans l’arbre par le calcul du rapport de la longueur minimale de l’arbre à sa longueur réelle. Pas de retour aux caractères pour pouvoir les reconsidérer Retour aux caractères pour éventuellement réévaluer ceux qui donnent des aberrations Rapide, même avec un grand nombre de taxa Vitesse moyenne. Sur de grosses machines on peut en plusieurs jours traiter des données jusqu'à 500 taxa


Télécharger ppt "Parcimonie Généralités Principe Orientation de l’arbre Caractères"

Présentations similaires


Annonces Google