P HYLOGÉNIE MOLÉCULAIRE Dr Lilia Romdhane Faculté des Sciences de Bizerte.

Slides:



Advertisements
Présentations similaires
Cladogramme.
Advertisements

DE ZÉRO à PAUP : Délimitation du groupe d'intérêt ("ingroup")
Phylogénie et distances génétique
Un nouveau regard sur les données moléculaires
Caricature IDF Dis, M'sieur le Moniteur de Biologie marine c'est quoi t'est-ce donc la classification phylogénétique ? Non ! Claude Duboc Professeur de.
La phylogénie Définition :
Rappels- introduction Le vivant =
Formation Bio-informatique IRD
Analyses phylogénétiques
Familles de gènes Nadia El-Mabrouk.
L’établissement des relations phylogénétiques
La phylogenèse Définition :
Classification évolutive Travaux pratiques et cas de la lignée verte Cours du 10/03/2016 Présentation: Hugo FONTES Conception : Hugo FONTES et Pierre CELLIER.
Les innovations génétiques. La diversité actuelle des êtres vivants est le résultat de l'accumulation d'un grand nombre de mutations et de phénomènes similaires.
Comparing genomic architectures to reconstruct ancestral genomes Géraldine JEAN Laboratoire Bordelais de Recherche en Informatique.
TP3 – Évolution et conservation de motifs Hypothèse: Les gènes et les protéines évoluent continuellement pour permettre l’évolution et l’adaptation des.
UN REGARD SUR L'EVOLUTION DE L'HOMME
La notion d’espèce.
La classification phylogénétique « Rien n'a de sens en biologie, si ce n'est à la lumière de l'évolution » ● Carl Von Linné ( ): créateur de notre.
Systématique phylogénétique Bruno Righetti, 2015.
Introduction La génétique initiée par Gregor Mendel (génétique mendelienne), a pour objectif: Comprendre le déterminisme et la transmission des caractères.
GENETIQUE ET EVOLUTION. A4. L’ÉVOLUTION DE L’HOMME A. Génétique et évolution.
Classement alphabétique
Suites ordonnées ou mettre de l’ordre
Theme 1 – La biodiversité et la survie la biodiversité en 8 minutes
Rappels de sixième La classification en ensembles emboîtés est une méthode pour classer et organiser la grande diversité d’êtres vivants. On les classe.
MOCAH / LIP6 / UPMC Entités / Composants / Systèmes Un formalisme de conception pour les jeux vidéo MOCAH.
GENETIQUE ET EVOLUTION
L’arbre de la vie Page 20 Les relations évolutionnistes d’un groupe d’organismes sont des relations phylogénétiques Darwin: «phylogénie = branches d’un.
Exposé : Les arbres phylogénétiques
Interprétation des indicateurs?
L’évolution Comment est-il possible que nous ayons des primates pour ancêtres? Chapitres 22 et 23 Collège Lionel-Groulx.
Parrainage BIOINFORMATIQUE
Evolution LYON Le 16 décembre 2009.
Approches génomiques - TD 2 L3 – BCP ALIGNEMENTS ET PHYLOGENIE
D’où proviennent les nouveaux groupes et les nouvelles espèces ?
Les bases de données et le modèle relationnel
Collection « Vertébrés COLLEGE »
Images et morphogenèse végétale
Coefficient de corrélation linéaire
Technologies de l’intelligence d’affaires Séance 11
JJ/MM/AAAA 08/06/2017 Appréhender le fonctionnement d’une voiture autonome Programmation cycle 4 Cycle 4.
Technologies de l’intelligence d’affaires Séance 12
Résultats et discussion
Chapitre 2 : La nature du vivant ADN et information génétique.
République Algérienne Démocratique et Populaire Ministère de l'Enseignement Supérieur et de la Recherche Scientifique Université Saad.
Génétique: Différences et ressemblances
Modélisation avec UML 2.0 Partie II Diagramme de classes.
Recherche par automates finis
Comprendre la construction d’un arbre phylogénétique
INDICATEURS ET TABLEAUX DE BORD EN MAINTENANCE. Définitions Indicateur : chiffre significatif d’une situation économique pour une période donnée. Tableau.
Les méthodes non paramétriques
Arbres de décision.
Le code de Huffman: est une méthode de compression statistique de données qui permet de réduire la longueur du codage d'un alphabet. Le code de Huffman.
Révision organisation de la vie
Une approche à l’ordre systématique
Moteurs de recherches Data mining Nizar Jegham.
Expression du Génome Le transcriptome.
Matrices.
Tableau de bord d’un système de recommandation
4.2 L’importance de l’ADN.
INTELLIGENCE ARTIFICIELLE
INTELLIGENCE ARTIFICIELLE
CLASSIFICATION DES ANIMAUX
Niveau : Seconde Partie du programme : La Terre, la vie et l’organisation du vivant - L’organisation fonctionnelle du vivant - L’organisme pluricellulaire,
STATISTIQUE INFERENTIELLE LES TESTS STATISTIQUES.
Homogamie et Consanguinité Croisements non panmictiques MODES DE CROISEMETS.
Transcription de la présentation:

P HYLOGÉNIE MOLÉCULAIRE Dr Lilia Romdhane Faculté des Sciences de Bizerte

O BJECTIFS Concepts et notions de bases de phylogénie moléculaire Les méthodes de reconstruction des arbres phylogénétiques Initiation à l’utilisation de logiciels bioinformatiques en phylogénie

P HYLOGÉNIE - PHYLOGENÈSE Définition: L’histoire de la formation et de l’évolution d’une espèce, d’un phylum (série évolutive des formes animales dérivant d’un ancêtre commun) Du grec: Phûlon = tribus Genesis = origine

L A CLASSIFICATION SUR RECHERCHE DE PARENTÉ : H AECKEL (1834 – 1919)

P HYLOGÉNIE – GÉNÉALOGIE Est-ce que l’arbre généalogique de la famille Black est un arbre phylogénétique ?

P HYLOGÉNIE – GÉNÉALOGIE

L A CLASSIFICATION DU VIVANT La classification des espèces se fait par différents systèmes: pratique (plantes médicinales, comestibles, …) alphabétique (peu utile ) niveaux hiérarchiques (Linné, fixisme) Phylogénétique (Darwin, Hennig, recherche de parenté suivant l’histoire évolutive des organismes sur Terre) Pas d’accès au « registre d’état civil » pour identifier les ancêtres individuellement. La phylogénie utilise des données actuelles sur les organismes vivants pour retracer l’histoire évolutive des organismes.

L A PARENTÉ

G ROUPE MONOPHYLÉTIQUE = CLADE

U N PEU DE VOCABULAIRE … Racine Branche interne Nœud Branche terminale Groupe monophylétique Feuille

U N PEU DE VOCABULAIRE … Taxon: élément de taxonomie C’est un groupe d’organismes traité comme une seule unité

U N PEU DE VOCABULAIRE … Un arbre phylogénétique est caractérisé par: sa topologie la longueur de ses branches (éventuellement) Nœud: estimation de l’ancêtre commun des éléments appartenant à ce nœud Racine (root): ancêtre commun de tous les éléments de l’arbre Un arbre peut avoir ou non une racine

C OMMENT LIRE UN ARBRE ? La lecture de l’arbre se fait depuis sa racine vers les branches terminales

C OMMENT LIRE UN ARBRE ?

T YPES D ’ ARBRES

N OTIONS DE BASE : R ACINE

N OTION DE BASE : O RDRE DES BRANCHES

S UR QUELLE BASE ÉTABLIR LES RELATIONS DE PARENTÉ ? Intuitivement: les organismes apparentés se ressemblent Ressemblances fondamentales: homologues On codifie la ressemblance sous la forme de caractères

C ARACTÈRE

L A PHYLOGÉNIE MOLÉCULAIRE Définition: La phylogénie moléculaire est la discipline ayant pour objectif la reconstruction de l’histoire évolutive des espèces par comparaison des séquences de leurs gènes ou leurs protéines Données: Un ensemble d’organismes (taxa) et pour chacun un ensemble de données moléculaires (séquences par exemple)

L A PHYLOGÉNIE MOLÉCULAIRE (D ONNÉES )

E VOLUTION DES CARACTÈRES MOLÉCULAIRES

24 E VOLUTION DES CARACTÈRES MOLÉCULAIRES : O RTHOLOGIE Définition: gènes présents dans des organismes différents ayant évolués à partir d’un même gène ancestral suite à des événements de spéciation Etude des relations de parentés entre les taxons

25 E VOLUTION DES CARACTÈRES MOLÉCULAIRES : P ARALOGIE Définition: gènes issus d’événements de duplication au sein d’un génome.

26 E VOLUTION DES CARACTÈRES MOLÉCULAIRES : O RTHOLOGIE ET PARALOGUES

27 E VOLUTION DES CARACTÈRES MOLÉCULAIRES : X ÉNOLOGIE Définition: gènes ayant été acquis par transfert horizontal Transfert du gène A d’un ancêtre de 2 vers un ancêtre de A

L A PHYLOGÉNIE MOLÉCULAIRE, POURQUOI FAIRE ? Retracer l’histoire de famille de gènes Reconstruire les relations évolutives entre espèces Exemple: l’arbre du vivant Classer une nouvelle espèce: Exemple: souche virale

29 L A PHYLOGÉNIE MOLÉCULAIRE ( COMMENT FAIRE ?) 1. Récupération des séquences homologues (nucléique ou protéique) dans les banques de données (Swiss-Prot, GenBank, HomoloGene….) 2. Alignement correcte des séquences (ClustalW) 3. Vérification manuelle de l’alignement et élimination des régions où l’homologie des positions n’est pas sure 4. Appliquer une méthode de génération de l’arbre: Construction de la phylogénie 5. Evaluer statistiquement la robustesse des arbres 6. Interprétation identification des orthologues, homologues, xénologues, pour faire des hypothèses sur l’évolution des gènes

M ÉTHODES DE CONSTRUCTION D ’ ARBRES Méthodes basées sur les distances Calcul des distances entre paires de séquences  matrice de distances Regroupement des séquences Exemples: UPGMA, Neighbor-Joining Facile, rapide Méthodes basées sur les séquences: Chacune des positions des séquences est considérée comme un caractère. Exemples: Parcimonie (maximum parsimony), maximum de vraissemblance (maximum likelihood)  temps de calcul très long

C ALCUL DES DISTANCES Distance observée: nombre moyen de substitutions par site

C ALCUL DES DISTANCES ● L’ensemble des différences observées entre 2 séquences: ● - Substitution d’un nucléotide par un autre dans des séquences d’ADN ou d’ARN ● - Remplacement d’un acide aminé par un autre dans une séquence protéique ● La distance sera d’autant plus faible si les séquences sont proches (se ressemblent) ● La distance sera d’autant plus grande que les séquences sont éloignées (différentes)

C ORRECTION DES DISTANCES

Modèle de Jukes-Cantor (JC) Les 4 bases ont la même fréquence Transversions et transitions sont équiprobables Modèle de Kimura à 2 paramètres (K2P) Les 4 bases ont la même fréquence Transversions et transitions ont un taux différent Modèle de Tamura-Nei Prise en compte de la fréquence des 4 bases α1 taux de transition entre purines, α2 taux de transition entre pyrimidine, ß taux de transversion

35 UPGMA: U NWEIGHT P AIR G ROUP M ETHOD WITH A RITHMETIC M EAN UPGMA: est le plus simple des algorithmes de clustering Méthode pour reconstruction des arbres avec des séquences pas trop divergents Algorithme de clusterisation séquentiel: les relations sont identifiées dans l’ordre de similarité et la reconstruction de l’arbre se fait pas à pas grâce à cet ordre Hypothèse: le taux de mutation est le même dans toutes les lignées: horloge moléculaire: L’horloge moléculaire: est une hypothèse selon laquelle les mutations génétiques s'accumulent dans un génome à une vitesse constante. Elle permet ainsi théoriquement, en reliant le taux de mutation des gènes au rythme de diversification de leur espèce, d'établir une échelle d'ordonnancement, voire chronologique, d'évolution et de lien des espèces entre elles.

UPGMA: U NWEIGHT P AIR G ROUP M ETHOD WITH A RITHMETIC M EAN Arbre raciné avec les longueurs des branches allant de la racine à n’importe quelle feuille sont égales Méthode: Regroupement des 2 séquences les plus proches Le nœud est positionné à la distance d de chacune des séquences Calcul de la distance entre le nouveau groupe et les autres séquences: etc….

ABCDE B2 C44 D666 E6664 F UPGMA Considérons la matrice de distance: Regroupement des séquences les plus proches (ici AB = 2) Recalcul de la matrice avec nouvelle entité remplaçant les 2 séquences regroupées. Les nouvelles distance se calculent par la moyenne (ici moy(Ax, Bx)) Calcul d’une nouvelle matrice de distance et construction d’un sous arbre:

ABCDE C4 D66 E664 F8888 ABCDE B2 C44 D666 E6664 F UPGMA Nouvelle matrice de distance: dist(A,B),C = (distAC + distBC)/2 = (4+4)/2 =4 dist(A,B),D = (distAD + distBD)/2 =(6+6)/2= 6 dist(A,B),E = (distAE + distBE)/2 =(6+6)/2= 6 dist(A,B),F = (distAF + distBF)/2 =(8+8)/2= 8 E D 2 2

ABCDE C4 66 F888 ABCDE 6 F88 39 A B C A B C E D

ABCDE F8 40 A B C E D F

E VALUER LA FIABILITÉ D ’ UN ARBRE But: Estimer par une méthode statistique la fiabilité de la topologie de l’arbre Exemple: Méthode du boostrap On construit n pseudo-alignements par échantillonnage aléatoire des colonnes de l’alignement initial: chaque colonne de l’alignement initial peut être utilisée 0, 1, ou plusieurs fois les pseudo-alignements ont la même longueur que l’alignement initial le nombre de pseudo-alignements doit être suffisamment élevé pour que le test soit significatif (n>= nombre de colonnes) Pour chaque pseudo-alignement, on construit un arbre Pour chaque branche de l’arbre initial, on indique le nombre de fois où cette banche a été retrouvé dans les n arbres.

E VALUER LA FIABILITÉ D ’ UN ARBRE

L ES LIMITES DE LA PHYLOGÉNIE Une phylogénie est une hypothèse sur: les relations de parenté entre espèces les divergences et les duplications et éventuellement sur: la direction des changements entre espèces (arbre enraciné) les états ancestraux le taux d’évolution

L ES LIMITES DE LA PHYLOGÉNIE MOLÉCULAIRE Aucun algorithme n’est parfait Il n’est jamais certain que l’arbre obtenu soit l’arbre réel ! Les mêmes données peuvent aboutir à des arbres différents suivant l’algorithme utilisé L’histoire évolutive des gènes n’est pas toujours transposable aux espèces Tous les gènes n’évoluent pas à la même vitesse (pressions de sélection différentes) Transferts horizontaux Paralogie

Q UELQUES LOGICIELS