Phylogénie: principes et concepts 1) Définitions/Terminologie 2) Principes de la systématique phylogénétique 3) Les objets de la phylogénie : caractères et taxons 4) Méthodes - Cladistique - Les procédures de parcimonie - Méthodes phénétiques - Méthodes probabilistes 5) Des méthodes de calcul complexe qui imposent le recours à des logiciels. 6) Exemple chez les nématodes Jacques Cabaret INRA IASP Nouzilly 37380
Définitions/ Terminologie Phylogénie : - terme ancien proposé par Haeckel (1866) = histoire du développement des espèces : la série du cheval, celle des Hominidés -sens actuel : le cours historique de la descendance des êtres organisés: les descendants nous informent sur leurs ancêtres Spéciation : spéciation réticulée : nouvelle espèce issue de 2 espèces voisines par hybridation (avec polyploidie) Fréquent chez les végétaux (1/3 des espèces) A n n B 2n C n Exemple : le colza= croisement du chou-fleur avec le navet
Spéciation par cladogénèse Hennig = disparition de l ’espèce ancestrale B A C A A Monophylie= l ’ancêtre et tous ses descendants B L ’évolution des caractères Évolution du caractère rond vers carré puis triangle au cours du temps = série évolutive polarisée Le cercle est plésiomorphe (primitif) et le triangle apomorphe (évolué) : l ’absence d ’aile est un caractère apomorphe (évolué) chez les puces. Le partage par 2 taxon d ’un caractère apomorphe constitue une synapomorphie
Principes de la systématique phylogénétique Fondée sur la théorie de l ’évolution = modification des caractères de la descendance 1) tous les organismes à reproduction sexuée ont une seule histoire généalogique (=une phylogénie) 2) les caractères sont transmis héréditairement d ’une espèce ancestrale à ses espèces-filles 3) la modifications de certains caractères ancestraux leur donne des attributs propres. La synapomorphie seule permet de poser l ’hypothèse de proche parenté.
Les caractères morphologique physiologiques écologiques Moléculaires Homologie : correspondance de caractère qui provient d ’un ancêtre commun. Des caractères analogues remplissent les mêmes fonctions. Deux caractères similaires sont supposés homologues sauf preuve contraire. Homoplasie : le caractère commun à deux espèces n ’existait pas chez l ’ancêtre commun. Les types d’homoplasie : - convergence : le caractère apparaît independemment dans plusieurs lignées qui n ’ont pas d ’ancêtre commun proche parallélisme si 2 lignées - réversion : un état transformé retourne à l ’état initial
Les taxons Un groupe d ’organismes reconnus comme unité formelle : espèce, genre, famille UTO : unité taxinomique opérationnelle (Sokal et Sneath, 1964) = phénéticiens UE : unité évolutive (Meacham, 1984) unité étudiée par les phylogénéticiens L’unité terminale des taxons est la population.
Méthode cladistique Elaborée par l ’entomologiste Willi Hennig (1950, 1966) Une analyse de caractères identifie les états plésiomorphes et apomorphes des caractères. Les taxons parents ont des états apomorphes partagés (synapomorphie) Le principe de congruence (ou parcimonie d ’hypothèses) est le second pilier de la théorie. Le logiciel Hennig 86 est dédié à ce type d’analyse (0 plesiomorphe et 1 apomorphe). Voici la matrice de départ : caractère Groupe externe 0 0 0 0 0 Espèce A 1 0 0 0 1 Espèce B 1 1 0 1 0 Espèce C 1 0 1 1 0
Procédure de Hennig 1) le caractère 1 évolué unit les taxons ABC out A B C 1 2) le caractère 2 évolué n ’existe que pour B : pas d ’information sur l ’ensemble des taxons 3) le caractère 3 évolué est une autoapomorphie pour le taxon C 4) le caractère 4 :synapomorphie qui unit B et C 5) le caractère 5 : synapomorphie pour letaxonA out A B C 2 3 5 4 Arbre résolu 1
Procédure de Wagner Relier les taxons un par un jusqu ’à ce que tous les taxons soient Incorporés. Le taxon A a une apomorphie, le B en a 3, et le C en a 4 On relie donc Out et A On relie B avec A Pour le dernier C, c ’est plus complexe, car on peut le relier à (AB), seulement à B, seulement à C, ou de manière irrésolue entre A et B La solution 2 est la plus parcimonieuse Out A B C 4 Pour plus de détail : Diana Lipscomb, G. Washington University : Cladistic analysis using Hennig86.
Les procédures de Parcimonie Wagner : convergence et régression ont acceptées: fournit les arbres les plus courts = le plus parcimonieux Camin-Sokal : n ’autorise que les convergences Dollo : n ’autorise que les réversions Attention : à partir de n taxons terminaux on peut construire (2n-3)!/ 2 n-2(n-2)! Arbres 10 taxons donnent 34.459.425 arbres possibles
Homologie l ’analyse cladistique se fonde sur la reconnaissance des homologies à leur niveau de synapomorphie. Critère d’homologie: ce qui est hérité par une ascendance commune Comment reconnaître une homologie? - ressemblance - non-coexistence : deux caractères généalogiquement homologues ne peuvent coexister dans un même organisme - congruence : les caractères homologues permettent de reconstruitruire les mêmes arbres phylogénétiques Pour les données moléculaires : homologue ne veut pas dire que des séquences sont seulement similaires
Les méthodes phénétiques Elles se proposent de construire des arbres ondés sur des ressemblances entre chaque paire d ’UE. Elles sont issues de la taxinomie numérique de Michener et Sokal (1957) et : les relations entre taxons ne sont pas phylogénétiques un grand nombre de caractères doit être étudié les caractères ont le même poids la ressemblance est basée sur sur des coefficients de similitudes (ou de distance) entre chaque paire de taxon Les relations entre taxons sont reconstruites par des analyses de regroupement (cluster analysis) On obtient un phénogramme représentatif de l ’évolutionet non pas un cladogramme Nature des distances entre taxons (critères d ’acceptation)
Les méthodes probabilistes principe : les transformations de caractères suivent des lois de probabilité l ’évaluation de la qualité des arbres construits repose sur des tests de vraisemblance - la parcimonie peut s ’intégrer dans un modèle probabiliste; il faut admettre que le changement est rare - l ’arbre le plus vraisemblable n ’est pas obligatoirement le plus parcimonieux Les méthodes de vraisemblance posent des problèmes techniques (posaient) d’où leur peu de faveur. Pour en savoir plus : Darlu P., Tassy P. Reconstruction phylogénétique. Collection biologie théorique 7, 1993 Masson, Paris 245 p. Matile L.,Tassy P., Goujet D. 1987. Introduction à la systématique zoologique (Concepts, Principes, Méthodes). Biosystema 1. Société Française de Systématique, Paris. 125 p.
Les nématodes Trichostrongles (Selon Lichtenfels, 1980, Durette-Desset 1983, Anderson 1978) : une sorte de consensus des spécialistes... les Trichostrongylidae se décomposent en 6 sous- familles: Lybiostrongylinae Cooperiinae Graphidiinae Ostertagiinae Trichostrongylinae Haemonchinae
Un arbre fondé sur la biogéographie des hôtes (Durette-Desset et al., 1994) Lybiostrongylinae Cooperiinae Trichostrongles Graphidiinae, Ostertagiinae Trichostrongylinae Haemonchinae Un arbre fondé sur la morphologie (Parsimonie, Paup 3.1) (Durette-Desset et al, 1999) Trichostrongylus Graphidium Ostertagiinae Haemonchus Libyostrongylus Cooperia
Un arbre fondé sur la biologie moléculaire ? Enzymologie : partiel, faisable ? RAPD et Trichostrongles : n ’importe quoi! ITS2 : partiel, quelques espèces, à faire ND4 : partiel, à faire ribosomal DNA small sub-units (Blaxter et al, 1998) Les phylogénies moléculaires ne sont-elles pas biaisées, comme le sont les phylogénies fondées sur la morphologie ? Les molécules sont aussi « sélectionnées » : les oiseaux qui volent à haute altitude ont des adaptations moléculaires de l’hémoglobine, qui a des affinités élevées avec l ’oxygène Aussi dans l ’ADN mitochondrial : pas neutre(cytochrome b etc ..) (Lee, 1999)
Comment établir une phylogénie moléculaire? (Edwards, 1995; Nei et al., 1995; Hillis and Huelsenbeck, 1995. Science, 267, 253-256) Comparaison de » neighbour -joining », UPGMA (Unweighted pair group method using arithmetic average), méthodes de parcimonie (la meilleure dans l ’exemple). Les points de vues sont très contradictoires.
LA PHYLOGÉNIE: DES ARBRES OU DES RÉSEAUX ? -Taxon de rang élevé = arbres -Taxon spécifiques voisins et infraspecifique: en réseau car des échanges latéraux (particulièrement importants chez les Bactéries). Particulièrement intéressant en génétique des populations Des logiciels disponibles gratuitement: Splitstree, TCS, T-Rex, avec Des fichiers de séquences ou de distances
Exemples chez les nématodes Trichostrongles : De nombreux arbres possibles selon les hypothèses et les constructions. Un arbre classique.. Outgroup Mecistocirrus digitatus 999 Haemonchus longistipes 998 661 979 762 983 995 740 Graphidium strigosum Spiculopteria boehmi 993 Ostertagia nianqingtanggulaensis 832 Marshallagia marshalli Ostertagia leptospicularis Ostertagia gruehneri Ostertagia arctica 754 652 813 916 Teladorsagia boreoarcticus 761 770 935 599 944 966 Haemonchus contortus Haemonchus placei Teladorsagia circumcincta genotype Mdh2A&B Teladorsagia circumcincta genotype Mdh2C Haemonchinae Ostertagiinae
Décomposition Split- UncorrectedP- ConvexHull
Parsimony split-UncorrectedP- ConvexHull
HybridizationNetwork-UncorrectedP-ConvexHull
Neighbour Net
Neighbour net Bootstrap 493
NJ ordinaire
NJ avec 1000 bootstrap
BioNJ 1000 bootstrap
Upgma 1000 bootstrap
Parsimony network 88 bootstrap
Hybridisation networck
Conclusions Le difficile choix des modèles de reconstruction phylogénétique Une jungle de logiciels Ne pas en faire un prétexte pour choisir « l’arbre le plus joli »