Télécharger la présentation
La présentation est en train de télécharger. S'il vous plaît, attendez
Publié parEliane Sergerie Modifié depuis plus de 8 années
1
P HYLOGÉNIE MOLÉCULAIRE Dr Lilia Romdhane lilia.romdhane@yahoo.fr Faculté des Sciences de Bizerte
2
O BJECTIFS Concepts et notions de bases de phylogénie moléculaire Les méthodes de reconstruction des arbres phylogénétiques Initiation à l’utilisation de logiciels bioinformatiques en phylogénie
3
P HYLOGÉNIE - PHYLOGENÈSE Définition: L’histoire de la formation et de l’évolution d’une espèce, d’un phylum (série évolutive des formes animales dérivant d’un ancêtre commun) Du grec: Phûlon = tribus Genesis = origine
4
L A CLASSIFICATION SUR RECHERCHE DE PARENTÉ : H AECKEL (1834 – 1919)
5
P HYLOGÉNIE – GÉNÉALOGIE Est-ce que l’arbre généalogique de la famille Black est un arbre phylogénétique ?
6
P HYLOGÉNIE – GÉNÉALOGIE
7
L A CLASSIFICATION DU VIVANT La classification des espèces se fait par différents systèmes: pratique (plantes médicinales, comestibles, …) alphabétique (peu utile ) niveaux hiérarchiques (Linné, fixisme) Phylogénétique (Darwin, Hennig, recherche de parenté suivant l’histoire évolutive des organismes sur Terre) Pas d’accès au « registre d’état civil » pour identifier les ancêtres individuellement. La phylogénie utilise des données actuelles sur les organismes vivants pour retracer l’histoire évolutive des organismes.
8
L A PARENTÉ
10
G ROUPE MONOPHYLÉTIQUE = CLADE
11
U N PEU DE VOCABULAIRE … Racine Branche interne Nœud Branche terminale Groupe monophylétique Feuille
12
U N PEU DE VOCABULAIRE … Taxon: élément de taxonomie C’est un groupe d’organismes traité comme une seule unité
13
U N PEU DE VOCABULAIRE … Un arbre phylogénétique est caractérisé par: sa topologie la longueur de ses branches (éventuellement) Nœud: estimation de l’ancêtre commun des éléments appartenant à ce nœud Racine (root): ancêtre commun de tous les éléments de l’arbre Un arbre peut avoir ou non une racine
14
C OMMENT LIRE UN ARBRE ? La lecture de l’arbre se fait depuis sa racine vers les branches terminales
15
C OMMENT LIRE UN ARBRE ?
16
T YPES D ’ ARBRES
17
N OTIONS DE BASE : R ACINE
18
N OTION DE BASE : O RDRE DES BRANCHES
19
S UR QUELLE BASE ÉTABLIR LES RELATIONS DE PARENTÉ ? Intuitivement: les organismes apparentés se ressemblent Ressemblances fondamentales: homologues On codifie la ressemblance sous la forme de caractères
20
C ARACTÈRE
21
L A PHYLOGÉNIE MOLÉCULAIRE Définition: La phylogénie moléculaire est la discipline ayant pour objectif la reconstruction de l’histoire évolutive des espèces par comparaison des séquences de leurs gènes ou leurs protéines Données: Un ensemble d’organismes (taxa) et pour chacun un ensemble de données moléculaires (séquences par exemple)
22
L A PHYLOGÉNIE MOLÉCULAIRE (D ONNÉES )
23
E VOLUTION DES CARACTÈRES MOLÉCULAIRES
24
24 E VOLUTION DES CARACTÈRES MOLÉCULAIRES : O RTHOLOGIE Définition: gènes présents dans des organismes différents ayant évolués à partir d’un même gène ancestral suite à des événements de spéciation Etude des relations de parentés entre les taxons
25
25 E VOLUTION DES CARACTÈRES MOLÉCULAIRES : P ARALOGIE Définition: gènes issus d’événements de duplication au sein d’un génome.
26
26 E VOLUTION DES CARACTÈRES MOLÉCULAIRES : O RTHOLOGIE ET PARALOGUES
27
27 E VOLUTION DES CARACTÈRES MOLÉCULAIRES : X ÉNOLOGIE Définition: gènes ayant été acquis par transfert horizontal Transfert du gène A d’un ancêtre de 2 vers un ancêtre de A
28
L A PHYLOGÉNIE MOLÉCULAIRE, POURQUOI FAIRE ? Retracer l’histoire de famille de gènes Reconstruire les relations évolutives entre espèces Exemple: l’arbre du vivant Classer une nouvelle espèce: Exemple: souche virale
29
29 L A PHYLOGÉNIE MOLÉCULAIRE ( COMMENT FAIRE ?) 1. Récupération des séquences homologues (nucléique ou protéique) dans les banques de données (Swiss-Prot, GenBank, HomoloGene….) 2. Alignement correcte des séquences (ClustalW) 3. Vérification manuelle de l’alignement et élimination des régions où l’homologie des positions n’est pas sure 4. Appliquer une méthode de génération de l’arbre: Construction de la phylogénie 5. Evaluer statistiquement la robustesse des arbres 6. Interprétation identification des orthologues, homologues, xénologues, pour faire des hypothèses sur l’évolution des gènes
30
M ÉTHODES DE CONSTRUCTION D ’ ARBRES Méthodes basées sur les distances Calcul des distances entre paires de séquences matrice de distances Regroupement des séquences Exemples: UPGMA, Neighbor-Joining Facile, rapide Méthodes basées sur les séquences: Chacune des positions des séquences est considérée comme un caractère. Exemples: Parcimonie (maximum parsimony), maximum de vraissemblance (maximum likelihood) temps de calcul très long
31
C ALCUL DES DISTANCES Distance observée: nombre moyen de substitutions par site
32
C ALCUL DES DISTANCES ● L’ensemble des différences observées entre 2 séquences: ● - Substitution d’un nucléotide par un autre dans des séquences d’ADN ou d’ARN ● - Remplacement d’un acide aminé par un autre dans une séquence protéique ● La distance sera d’autant plus faible si les séquences sont proches (se ressemblent) ● La distance sera d’autant plus grande que les séquences sont éloignées (différentes)
33
C ORRECTION DES DISTANCES
34
Modèle de Jukes-Cantor (JC) Les 4 bases ont la même fréquence Transversions et transitions sont équiprobables Modèle de Kimura à 2 paramètres (K2P) Les 4 bases ont la même fréquence Transversions et transitions ont un taux différent Modèle de Tamura-Nei Prise en compte de la fréquence des 4 bases α1 taux de transition entre purines, α2 taux de transition entre pyrimidine, ß taux de transversion
35
35 UPGMA: U NWEIGHT P AIR G ROUP M ETHOD WITH A RITHMETIC M EAN UPGMA: est le plus simple des algorithmes de clustering Méthode pour reconstruction des arbres avec des séquences pas trop divergents Algorithme de clusterisation séquentiel: les relations sont identifiées dans l’ordre de similarité et la reconstruction de l’arbre se fait pas à pas grâce à cet ordre Hypothèse: le taux de mutation est le même dans toutes les lignées: horloge moléculaire: L’horloge moléculaire: est une hypothèse selon laquelle les mutations génétiques s'accumulent dans un génome à une vitesse constante. Elle permet ainsi théoriquement, en reliant le taux de mutation des gènes au rythme de diversification de leur espèce, d'établir une échelle d'ordonnancement, voire chronologique, d'évolution et de lien des espèces entre elles.
36
UPGMA: U NWEIGHT P AIR G ROUP M ETHOD WITH A RITHMETIC M EAN Arbre raciné avec les longueurs des branches allant de la racine à n’importe quelle feuille sont égales Méthode: Regroupement des 2 séquences les plus proches Le nœud est positionné à la distance d de chacune des séquences Calcul de la distance entre le nouveau groupe et les autres séquences: etc….
37
ABCDE B2 C44 D666 E6664 F88888 37 UPGMA Considérons la matrice de distance: Regroupement des séquences les plus proches (ici AB = 2) Recalcul de la matrice avec nouvelle entité remplaçant les 2 séquences regroupées. Les nouvelles distance se calculent par la moyenne (ici moy(Ax, Bx)) Calcul d’une nouvelle matrice de distance et construction d’un sous arbre:
38
ABCDE C4 D66 E664 F8888 ABCDE B2 C44 D666 E6664 F88888 38 UPGMA Nouvelle matrice de distance: dist(A,B),C = (distAC + distBC)/2 = (4+4)/2 =4 dist(A,B),D = (distAD + distBD)/2 =(6+6)/2= 6 dist(A,B),E = (distAE + distBE)/2 =(6+6)/2= 6 dist(A,B),F = (distAF + distBF)/2 =(8+8)/2= 8 E D 2 2
39
ABCDE C4 66 F888 ABCDE 6 F88 39 A B C 1 1 1 2 A B C 1 1 1 2 E D 2 2 1 1
40
ABCDE F8 40 A B C 1 1 1 2 E D 2 2 1 1 1 4 F
41
E VALUER LA FIABILITÉ D ’ UN ARBRE But: Estimer par une méthode statistique la fiabilité de la topologie de l’arbre Exemple: Méthode du boostrap On construit n pseudo-alignements par échantillonnage aléatoire des colonnes de l’alignement initial: chaque colonne de l’alignement initial peut être utilisée 0, 1, ou plusieurs fois les pseudo-alignements ont la même longueur que l’alignement initial le nombre de pseudo-alignements doit être suffisamment élevé pour que le test soit significatif (n>= nombre de colonnes) Pour chaque pseudo-alignement, on construit un arbre Pour chaque branche de l’arbre initial, on indique le nombre de fois où cette banche a été retrouvé dans les n arbres.
42
E VALUER LA FIABILITÉ D ’ UN ARBRE
43
L ES LIMITES DE LA PHYLOGÉNIE Une phylogénie est une hypothèse sur: les relations de parenté entre espèces les divergences et les duplications et éventuellement sur: la direction des changements entre espèces (arbre enraciné) les états ancestraux le taux d’évolution
44
L ES LIMITES DE LA PHYLOGÉNIE MOLÉCULAIRE Aucun algorithme n’est parfait Il n’est jamais certain que l’arbre obtenu soit l’arbre réel ! Les mêmes données peuvent aboutir à des arbres différents suivant l’algorithme utilisé L’histoire évolutive des gènes n’est pas toujours transposable aux espèces Tous les gènes n’évoluent pas à la même vitesse (pressions de sélection différentes) Transferts horizontaux Paralogie
45
Q UELQUES LOGICIELS
Présentations similaires
© 2024 SlidePlayer.fr Inc.
All rights reserved.