La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Parcimonie Généralités Principe Orientation de larbre Caractères Procédure Algorithme exact Algorithme branch and bound Algorithme heuristique Analyse.

Présentations similaires


Présentation au sujet: "Parcimonie Généralités Principe Orientation de larbre Caractères Procédure Algorithme exact Algorithme branch and bound Algorithme heuristique Analyse."— Transcription de la présentation:

1 Parcimonie Généralités Principe Orientation de larbre Caractères Procédure Algorithme exact Algorithme branch and bound Algorithme heuristique Analyse des résultats Retour aux caractères Arbre consensus Saturation robustesse Congruence

2 Phénétique, évolutionnisme, cladisme Similitudes Homoplasies Homologies partagées Convergences Réversions Symplésiomorphies Synapomorphies PhénétiqueÉvolutionnismeCladisme

3 Homologie ABC u010 v001 w100 x100 y110 z Apomorphies partagées Homologies partagées A et C B et C A et B AC B u v w x y z ACB u v w x y z Phylogénie cladistePhylogénie évolutive

4 Parcimonie 1 ABC X011 y001 AB C x y 2 pas AB C x y x 3 pas

5 Parcimonie 2 ABCD U0011 V0011 W0011 X1100 Y1001 Z0010 A B C D u v w x y z y A D B C v v u u w w z x x y 10 pas 7

6 Arbre raciné ou non E A B C D E Arbre non raciné 7 arbres racinés ou A B C D E 1 A B C D E 7 A B C D E 4 A B C D E 2 A B C D E 6 A B C D E 5 A B C D E 3 A B C D

7 Raciner un arbre Critères ontogéniques problème posé par la néoténie Critère extra groupe Critères chorologiques critère secondaire insuffisant seul Critères paléontologiques - absence de certains groupes - la parenté ne doit pas être trop éloignée

8 Extra-groupe 1 X ext-g ABC PPPPP QQQQQ X A B C P Q P Q P Q P Q 2 pas :il y a ambiguïté

9 Extra-groupe 2 XYABC QQQQQQ X Y A B C Q Q 1 pas X Y A B C Q Q Q 2 pas

10 Extra-groupe 3 XYABC RRRRRR X Y A B C R R R R R R 2 pas dans chaque cas, on ne peut trancher

11 Extra-groupe 4 XYZABC RRRRRRR X Y Z A B C R R R R 3 pas X Y Z A B C R R R 2 pas

12 Extra-groupe 5 Y Z A B C X R R 1 pas X C A B Y Z R R 1 pas Le choix des groupes externes est un à-priori. Si lon conteste cette qualité on peut trouver un arbre plus court XYZABC RRRRRRR

13 Caractère (1) c t 123 A011 B001 C000 D000 A B C D T2 A D B C T3 A B CD T1 info2 pas 1 pasC3 non info 1 pas C2 cons tant 0 pas C1 typeT3T2T1

14 Caractère (2) Binaire 0, 1 À états multiples 0, 1, 2, 3 Réversible 0 1 Irréversible 0 1 Irréversible Additifs 0 3 coûte 3pas 0 1 coûte 1pas 0 2 coûte 2 pas Non additifs 0 3 coûte 1pas 0 1et 0 2 aussi Réversible Ou

15 Caractère (3) AGCT vers de ACGT A0515 C5051 G1505 T5150 Graphe des états dun caractère et matrice correspondante. Les transversions sont comptées 5 fois plus que les transitions.

16 Modèles de Wagner, Camin-Sokal, Dollo c t A B C D E X EABCDX ABCDEX EABDCX pas (Wagner) 14 pas (Camin-Sokal) 15 pas (Dollo) apomorphie convergencee réversion

17 Une espèce éteinte: le quagga

18 Positions informatives GèneCytochrome Oxydase NADH Déshydrogénase position QuaggaACTTCCT Z.pl.ACTTCCT Z.mt.ATCTTCC ChevalGTCCCTC VacheGTCCTTA

19 Méthode exhaustive (1) Avec 3 espèces un seul arbre est possible. Le branchement pour la troisième espèce peut se faire sur n'importe laquelle des branches 1, 2 ou 3. Zèbre pl CTT Quagga CTT Zèbre mt TCC Cheval TCC Zèbre pl CTT Quagga CTT Zèbre mt TCC pas Cheval TCC Zèbre pl CTT Quagga CTT Zèbre mt TCC Zèbre pl CTT Quagga CTT Zèbre mt TCC Cheval TCC 3 pas C'est l'arbre le plus court. On continue cependant sur les 3 arbres.

20 Méthode exhaustive (2) Zèbre pl CTT Quagga CTT Zèbre mt TCC Cheval TCC 3 pas 4 5 On peut ajouter une nouvelle espèce de 5 façons différentes. 14 pas Vache TCAGCTT Zèbre pl CTTATCC Quagga CTTATCC Zèbre mt TCCATTC Cheval TCCGCCT CTTATCC TCCATCC 14 pas CTTATCC pas TCCATCC 345 TCCATTT 11 pas 45 TCCATCT pas 457 TCCATTC TCCGCTT 6 Vache TCAGCTT Vache TCAGCTT Vache TCAGCTT Vache TCAGCTT CTTATCC Zèbre pl CTTATCC Zèbre mt TCCATTC Cheval TCCGCCT Quagga CTTATCC 123 Zèbre pl CTTATCC Zèbre mt TCCATTC Cheval TCCGCCT Quagga CTTATCC TCCATCC Zèbre pl CTTATCC Zèbre mt TCCATTC Cheval TCCGCCT Quagga CTTATCC 123 Zèbre pl CTTATCC Zèbre mt TCCATTC Cheval TCCGCCT Quagga CTTATCC

21 Méthode exhaustive(3) Après avoir évalué tous les arbres on choisit le ou les plus courts

22 Branch and Bound 1 Évaluation de la longueur dun arbre au hasard. 2 Lexploration dun chemin sarrête dès que cette longueur est dépassée

23 Nombre dArbres Possibles ,21643 * soit plus de 8*10 21 NTn non raciné Tn raciné x-2 nœuds x-3 segments internes x segments externes Nombre darbres non racinés n Tn= (2k-5) k=3 Nombre darbres racinés n Tn= (2k-3) k=

24 Algorithme de Wagner1 CTCT A10000 B01010 C00011 D01100 Distances 2 à 2 1 On connecte C et D (distance la pus grande) D C Y A (Farris 1970 : methods for computing Wagner trees.Syst. Zool., 18:374-85) 2 Puis on ajoute A (ou B) au nœud Y AY=1/2(AC+AD-CD)=1/2(3+3-4)=1 BY=1/2(BC+BD-CD)=1/2(2+2-4)=0 3 Cest donc A que lon ajoute en premier. Règle dagglomération: les taxons les plus éloignés sont connectés AB=3 AC=3 AD=3 BC=2 BD=2 CD=4

25 Algorithme de Wagner2 Donc B est mis en Y Y B D C Y A D C Y A Y B Y B Y B Il reste à placer B sur un des 3 segments YA, YC ou YD. Sil est sur DY YB=1/2(BD+YB-YD) or YB=1/2(AB+CB-AC) et YD=1/2(CD+AD-AC) Donc YB=1/2(BD+1/2(BA+BC)-1/2(CD+AD))= 1/2(2+1/2(3+2)-1/2(4+3)=0,5 Sil est sur AY YB=1/2(BA+1/2(BC+BD)-1/2(CA+DA))=1 Sil est sur CY YB=1/2(BC+1/2(BA+BD)-1/2(AC+DC))=0,5 BY = 0,5BY = 1BY = 0,5

26 Algorithme de Wagner 3 Le résultat donne un des arbres qui nest pas le plus court parmi les 3 arbres possibles. On peut à partir de là par branch swapping (ici NNI suffit) obtenir lun des plus courts D A C B pas 7 pas 6 pas D A C B D A C B

27 Branch swapping:réarrangement local(NNI) x y z w x w z y y x z w a e f b d c a e f b c d a e f b c d Exemple 1 Exemple 2 Nearest-Neighbor Interchange

28 Branch swapping:réarrangement global(SPR) d e f c a b a b e f c d a b e f d c a e f b d c coupure Subtree Pruning Regrafting

29 Branch swapping:réarrangement global(TBR) a e f b d c coupure a b c e f d 2 sous arbres à reconnecter de toutes les façons possibles a b c e f d a b c e d f Tree Bisection-Reconnection

30 Exploration du paysage des arbres avec une heuristique

31 Matrice C T A B C D E ancêtr e Non informatifs Informatifs Homoplasiques

32 DELayed TRANsformations E D C B A Il y a convergence sur les branches de A et C pour les caractères et 16 Dans cet exemple, loption MINF donnerait le même résultat. homoplasie

33 ACCelerated TRANsformation réversion C E D B A La réversion est préférée à la convergence pour rendre compte de lhomoplasie, elle concerne 3 caractères: 14, 15 et

34 Exclusion et pondération A G G C T G C A A T C G T G A G A C T T C C A T C G T G A C A C T G C C A * * T C G A C G C T G C G A T C G T G A C G C T T C G A T C G T G A G G C T G C A A T C G T G La pondération différente entre transitions et transversions entraîne des valeurs différentes affectées aux différents changements détats du caractère 8. Il nexiste plus une valeur unique affectée à ce caractère.

35 Exclusion et pondération A G G C T G C A A G C C A G A G A C T T C C A G T C T G A C C C T G C C A G G G T G A C G C T G C G A G C G A G A C T C T T C G A G A G T G A G A C T G C A A G T C T G Régions inversées répétées

36 Matrice de coût BEGIN ASSUMPTIONS; USERTYPE tv STEPMATRIX=4 A C G U [A] [C] [G] [U] ;

37 Variabilité des nucléotides en fonction de leur position dans le codon dans le gène rbcL position 1position 2position 3 toutes les positions nombre total de sites sites variables sites information nels

38 Saturation transitions transversions Saturation: principe D C B A DCBA Ve Si

39 Comparaison de la vitesse dévolution en transitions et en transversions pour la position 3 des codons du gène rbcL transversions transitions

40 Comparaison de la vitesse dévolution en transitions et en transversions pour les positions 1 et 2 des codons du gène rbcL transversions transitions

41 Saturation Taxon A AGGT Taxon B ACCT Ancêtre commun ACGT C G G C Taxon A AGGT Taxon B ACCT Ancêtre commun ACGT C T G A A C T G Pas de saturation: le nombre de changements observés est égal au nombre réel. Saturation: le nombre de changements observés est inférieur au nombre réel.

42 CI, RI et RC m g s m=Lg minimum de larbre s=Lg réelle de larbre g=Lg maximum de larbre

43 Variation de lindice de consistance en fonction du nombre de taxa Formule empirique NT: nb de taxa CI= 0,90-0,022NT+0,000213(NT) 2 Sanderson, Donoghue (1989)Patterns of variation in levels in levels of homoplasy. Evolution 43 pp Nb. Tax.CI 150, , , , , , , , , , , , ,4613 Nb. Tax.CI 280, , , , , ,0, , , , , , , ,3608

44 Consensus strict et semi strict F E D C B A Arbre 1 Arbre 2 C B A D F E F E D C A B F E D C A B Consensus strict Consensus semi strict C A B F E D F E D C B A

45 Consensus majoritaire

46 Consensus dAdams A B C D E F G H I Arbre 1 Arbre 3 A B D E C F G H I Arbre 2 A D C B E F G H I Consensus dAdams A C B D E F G H I Consensus majoritaire A C B D E F G H I

47 Indice de Bremer ABCDEFGABCDEFG Consensus des arbres de Lg=20 pas ABCDEFGABCDEFG Consensus des arbres de Lg 21 pas D=1

48 Congruence : principe Le premier jeu de données donne des arbres parcimonieux de Lg=x Le second jeu de données donne des arbres parcimonieux de Lg=y La concaténation des 2 jeux de données donne des arbres parcimonieux de Lg=z Un test statistique permet de dire si la différence entre x+y et z est significative ou non

49 Congruence : test ILD Jeu 1 >1 AAAA >2 AGGA >3 AGAG >4 AAGG Jeu 2 >1 ggag >2 agga >3 gagg >4 aaaa Jeux 1+2 >1 AAAAggag >2 AGGAagga >3 AGAGgagg >4 AAGGaaaa D=(lgx+lgy)-lgz 100 tirages au hasard 100 jeux simulés Simulation n >1 AggAAggg >2 GagGGaaa >3 GgaGAggg >4 Aaa AG aaa Simulation n du jeu 1 >1 AggA >2 GagG >3 GgaG >4 AaaA Simulation n du jeu 2 >1 Aggg >2 Gaaa >3 Aggg >4 Gaaa Estimations de z Estimations de xEstimations de y On détermine la distribution des valeurs de D. si pb Dobs 5% Incongruence D est-il significatif?

50 Comparaison des deux méthodes de calcul darbre Vitesse moyenne. Sur de grosses machines on peut en plusieurs jours traiter des données jusqu'à 500 taxa Rapide, même avec un grand nombre de taxa Retour aux caractères pour éventuellement réévaluer ceux qui donnent des aberrations Pas de retour aux caractères pour pouvoir les reconsidérer Il y a un test de robustesse des noeuds (mesure de lhomoplasie dans larbre par le calcul du rapport de la longueur minimale de larbre à sa longueur réelle. Pas de test de robustesse de larbre unique (excepté le bootstrap) La méthode peut retourner plusieurs arbres également parcimonieux Un seul arbre retourné par le programme Examen des caractères les uns après les autres Calcul dune distance globale Méthodes de parcimonieMéthodes de distance


Télécharger ppt "Parcimonie Généralités Principe Orientation de larbre Caractères Procédure Algorithme exact Algorithme branch and bound Algorithme heuristique Analyse."

Présentations similaires


Annonces Google