Les nouvelles preuves de l’évolution: y accéder en classe PO 422 Phylogénétique Novembre 2009
Etude des relations de parenté entre espèces. Phylogénie Etude des relations de parenté entre espèces. Une analyse phylogénétique permet d’estimer (modéliser) les relations évolutives qui existent entre les espèces grâce à un arbre: qui a un ancêtre commun - qui est le cousin de qui ? Phylogénétique Novembre 2009
http://www.unige.ch/450/expositions/genome/presentation/slogans.html Phylogénétique Novembre 2009
Il est possible de construire un arbre phylogénétique à partir de différents types de données: Les données morphologiques (écailles ou plumes, présence de certains os du crâne, forme des feuilles…). Il existe quelques centaines de caractères définis dans ce but par les spécialistes. Les caractères physiologiques (température corporelle…) Phylogénétique Novembre 2009
Phylogénétique Novembre 2009
Les caractères physiologiques (température corporelle…) Mais aussi…. Il est possible de construire un arbre phylogénétique à partir de différents types de données: les données morphologiques (écailles ou plumes, présence de certains os du crâne,, forme des feuilles…). Il existe quelques centaines de caractères définis dans ce but par les spécialistes. Les caractères physiologiques (température corporelle…) Mais aussi…. L’ordre des gènes (par exemple sur l’ADN des mitochondries) les données moléculaires (séquences d’ADN ou de protéines). Des mutations modifient les séquences de l’ADN et par conséquent des protéines au cours de l’évolution. toutes les données existantes….(défi scientifique !) Phylogénétique Novembre 2009
Cytochrome C Phylogénétique Novembre 2009 http://tecfa.unige.ch/perso/lombardf/calvin/images/restricted/index.php?op=5&path=evolution&file=cytochrome-divers-org.jpg Phylogénétique Novembre 2009
Comment construire des arbres phylogénétiques sur la base des séquences des protéines… Novembre 2009
? Actin-related protein 2 Les différentes espèces sont: ARP2_A MESAP---IVLDNGTGFVKVGYAKDNFPRFQFPSIVGRPILRAEEKTGNVQIKDVMVGDE ARP2_B MDSQGRKVIVVDNGTGFVKCGYAGTNFPAHIFPSMVGRPIVRSTQRVGNIEIKDLMVGEE ARP2_C MDSQGRKVVVCDNGTGFVKCGYAGSNFPEHIFPALVGRPIIRSTTKVGNIEIKDLMVGDE ARP2_D MDSQGRKVVVCDNGTGFVKCGYAGSNFPEHIFPALVGRPIIRSTTKVGNIEIKDLMVGDE ARP2_E MDSKGRNVIVCDNGTGFVKCGYAGSNFPTHIFPSMVGRPMIRAVNKIGDIEVKDLMVGDE *:* :* ******** *** *** . **::****::*: . *::::**:***:* Les différentes espèces sont: Caenorhabditis briggsae Drosophila melanogaster Homo sapiens Mus musculus Schizosaccharomyces pombe Quelle séquence ‘appartient’ à quelle espèce ? ? Phylogénétique Novembre 2009
ARP2_A MESAP---IVLDNGTGFVKVGYAKDNFPRFQFPSIVGRPILRAEEKTGNVQIKDVMVGDE ARP2_B MDSQGRKVIVVDNGTGFVKCGYAGTNFPAHIFPSMVGRPIVRSTQRVGNIEIKDLMVGEE *:* **:******** *** *** . ***:*****:*: :..**::***:***:* ARP2_C MDSQGRKVVVCDNGTGFVKCGYAGSNFPEHIFPALVGRPIIRSTTKVGNIEIKDLMVGDE ********:* *************:*** ****::*****:*** .************:* ARP2_D MDSQGRKVVVCDNGTGFVKCGYAGSNFPEHIFPALVGRPIIRSTTKVGNIEIKDLMVGDE ************************************************************ ARP2_E MDSKGRNVIVCDNGTGFVKCGYAGSNFPTHIFPSMVGRPMIRAVNKIGDIEVKDLMVGDE ***:**:*:******************* ****::****:**:..*:*:**:******** *:* :* ******** *** .*** . **::*****:*: *.**::***:***** Phylogénétique Novembre 2009
PhiloPhylo ‘kit tout en 1’, mais avec un choix limité de protéines au départ… http://education.expasy.org/philophylo www.uniprot.org: banques de données de protéines (encyclopédie) contenant des informations biologiques et les séquences en acides aminés. www.phylogeny.fr Phylogénétique Novembre 2009
Le principe 1. Sélection: set de séquences de protéines ‘homologues’ 2. Comparaison: alignement multiple 3. Construction de l’arbre: ‘calculer les différences’ Phylogénétique Novembre 2009
Le principe Sélection: set de séquences de protéines ‘homologues’ Comparaison: alignement multiple Construction de l’arbre: ‘calculer les différences’ Phylogénétique Novembre 2009
PhiloPhylo Phylogénétique Novembre 2009
www.uniprot.org ‘query’ par nom de protéines ou nom de gènes Blast Utiliser http://www.uniprot.org/ Exemples: http://education.expasy.org/cours/FLO/Liste_prot_evol.html Blast Utiliser http://www.expasy.org/tools/blast/ ou le Blast@UniProt Phylogénétique Novembre 2009
Scénario 5: www.uniprot.org Phylogénétique Novembre 2009
www.uniprot.org (query ‘insulin’) Phylogénétique Novembre 2009
Protein and gene nameS www.uniprot.org/ query FOLH1 Phylogénétique Novembre 2009
Liste de protéines ‘candidats’ http://education. expasy Phylogénétique Novembre 2009
Le principe Sélection: set de séquences de protéines ‘homologues’ Comparaison: alignement multiple Construction de l’arbre: ‘calculer les différences’ Phylogénétique Novembre 2009
PhiloPhylo Phylogénétique Novembre 2009
www.uniprot.org (query ‘insulin’, align) Alignement multiple des séquences en acides aminés de l’insuline de différentes espèces www.uniprot.org (query ‘insulin’, align) Phylogénétique Novembre 2009
http://www.unige.ch/450/expositions/genome/presentation/slogans.html Phylogénétique Novembre 2009
Les mutations dans l’ADN peuvent être dûes à Des erreurs lors de la réplication de l’ADN Des agents chimiques ou physiques (fumée de cigarette, UV,…) Des virus Les conséquences des mutations peuvent être des changements ‘mineurs’ (changement d’un acide aminé pour un autre) ou majeurs (duplication de gènes, délétion d’un bout de chromosomes, …) Chez les mammifères, à chaque génération, il se produit en moyenne quelques dizaines de mutations dans le génome de chaque individu. Si ces mutations se trouvent dans l’ADN des cellules sexuelles, elles seront transmises à la descendance. La dérive génétique (‘genetic drift’) et/ou la sélection naturelle (favorisant la sélection des individus avec des mutations qui augmentent les chances de reproduction et de survie dans un environnement donné) fixeront les mutations dans une population puis une espèce donnée. Phylogénétique Novembre 2009
http://www3. interscience. wiley http://www3.interscience.wiley.com/cgi-bin/fulltext/117981248/HTMLSTART (i) FR1 The FRIGIDA (FR1) gene has been shown to be a major determinant of flowering time in Arabidopsis thaliana. A majority of early-flowering ecotypes shows one or two deletions that generate a frameshift in the FR1 open reading frame (ORF), suggesting that this phenotype has arisen at least twice. Le Corre, Roux & Reboud (2002) performed a population analysis on different ecotypes and confirmed that the loss of function mutations was associated with an early-flowering phenotype, these gene inactivations systematically evolved in a non-neutral fashion. Moreover, they confirmed that the gene inactivation was phenotypically linked to an early flowering ecotype adaptated to cold environments (Johanson et al., 2000; Le Corre et al., 2002). This represents a strong indication that environmental change has driven this genetic change. (ii) CCR5 This primate transmembrane receptor is a cellular gateway for the entry of HIV-1 and all strains of SIV. Human homozygotes for the CCR5 null allele which has a 32 base pair (bp) deletion are highly resistant to HIV-1 infection. Another null allele (24 bp deletion) of CCR5 has convergently evolved in sooty mangabeys (Cercocebus atys), a natural host of SIV. The occurrence of the mangabey null allele at an appreciable frequency (around 4%) could be explained by positive selection; null homozygotes are protected from SIV infection because the encoded protein is not transported to the cell surface (Palacios et al., 1998). The null allele has been shown to be positively selected in humans (Galvani & Novembre, 2005). However, the exact nature of the selective pressure involved in the origin of the CCR5-{delta} 32 allele and its high prevalence in European populations (approximately 10%) is unclear as the HIV epidemic in humans is much more recent than the age of the null allele (about 700 years). However, both HIV and poxviruses enter leukocytes using chemokine receptors; it is plausible that the loss of the CCR5 chemokine receptor originally conferred resistance against smallpox. This hypothesis is supported by a correlation between historical smallpox epidemics and allele geographic distribution (Galvani & Slatkin, 2003). Phylogénétique Novembre 2009
On ne peut pas ‘muter’ n’importe quoi…. Peptide signal Hélice alpha Hélice alpha Phylogénétique Novembre 2009
Propriétés physico-chimiques des différents acides aminés Tiny OH G P Hydrophilic A Aliphatic C Charged L S Hydrophobic I V T NH2 Y M F W R D N H E Q K Aromatic Positive Negative Phylogénétique Novembre 2009
www.uniprot.org (query ‘insulin’, align) Phylogénétique Novembre 2009
Les gènes (et les protéines) évoluent à des vitesses différentes L’histone H4 n’a accumulé que 2 mutations ‘conservatives’ en 1.5 milliard d’années Phylogénétique Novembre 2009
Les gènes (et les protéines) évoluent à des vitesses différentes Une protéine qui a évolué extrêmement rapidement: l’involucrin (une protéine de la peau): 10 % de changements en l’espace de 4 millions d’années (séparation des chimpanzés et de l’homme) Phylogénétique Novembre 2009
Le principe Sélection: set de séquences de protéines ‘homologues’ Comparaison: alignement multiple Construction de l’arbre: ‘calculer les différences’ Phylogénétique Novembre 2009
Un arbre phylogénétique est un modèle qui décrit les relations entre des unités taxonomiques Novembre 2009
Le résultat dépend de la protéine utilisée pour construire l’arbre… Le résultat dépend de la protéine utilisée pour construire l’arbre….et le résultat ne correspond pas toujours à l’’arbre des espèces’… Phylogénétique Novembre 2009
www.phylogeny.fr Introduire le set de séquences sélectionnées à www.uniprot.org (format ‘fasta’) Utiliser les paramètres par défaut (‘one’ click) Phylogénétique Novembre 2009
www.phylogeny.fr Phylogénétique Novembre 2009
Cladogramme obtenu à partir de l’analyse phylogénétique de l’alignement multiple des séquences d’insuline Le résultat dépend de la protéine utilisée pour construire l’arbre….et le résultat ne correspond pas toujours à l’’arbre des espèces’… www.phylogeny.fr Phylogénétique Novembre 2009
Les différents types d’arbres (1) Phylogénétique Novembre 2009
Arbres (cladogrammes) F G A B C D E F G End nodes Internal nodes Branches Roots Phylogénétique Novembre 2009
Peabody museum exhibition on the Tree of Life http://www.peabody.yale.edu/exhibits/treeoflife/ Phylogénétique Novembre 2009
Combien d’arbres différents ?
Les différents types d’arbres (2) Phylogénétique Novembre 2009
Arbres phylogénétiques Cladogramme Phylogramme Qui est le cousin de qui ? La longueur des branches est proportionnelle aux différences. Cette longueur n’est pas toujours facile à interpréter ! Elle dépend entre autre de la vitesse d’évolution…(nombres de variations par site dans un laps de temps donné)
- Qui est le cousin de qui ? Qui a un ancêtre commun ? Exemple de cladogramme obtenu à partir de l’analyse bioinformatique de l’alignement multiple des séquences d’insuline - Qui est le cousin de qui ? Qui a un ancêtre commun ? www.phylogeny.fr Phylogénétique Novembre 2009
Echelle: ‘expected number of changes per site’ Exemple de phylogramme obtenu à partir de l’analyse bioinformatique de l’alignement multiple des séquences d’insuline - Quelle protéine a évolué plus rapidement ? Echelle: ‘expected number of changes per site’ Le temps qui s’écoule….
Exemple de phylogramme obtenu à partir de l’analyse bioinformatique de l’alignement multiple des séquences d’insuline L’insuline de la carpe a ‘évolué’ (moins de changements dans sa séquences en acides aminés) moins rapidement que l’insuline des autres espèces… Probabilité que l’arbre ait la bonne configuration à chaque embranchement (> 0.95: OK) Le temps qui s’écoule…. Phylogénétique Novembre 2009
Les embranchements Spéciation Duplication de gènes Phylogénétique Novembre 2009
Spéciation et duplication de gène Frog gene A speciation Human gene A Orthologs speciation Mouse gene A Gene duplication Paralogs Mouse gene B Homologs speciation Ancestral gene Human gene B Orthologs speciation Frog gene B Drosophila gene AB Phylogénétique Novembre 2009
Spéciation et duplication de gène Duplication ins1 – ins 2 Spéciation rat - souris Phylogénétique Novembre 2009
"Ce qui n'est pas entouré d'incertitudes ne peut pas être la vérité » R. Feynmann Phylogénétique Novembre 2009
A vous de jouer… Phylogénétique Novembre 2009
Ressources taxonomiques Phylogénétique Novembre 2009
http://www.ncbi.nlm.nih.gov/guide/taxonomy/ Phylogénétique Novembre 2009
http://www.uniprot.org/taxonomy/ Phylogénétique Novembre 2009
Animal Diversity Web (ADW) http://animaldiversity. ummz. umich Phylogénétique Novembre 2009
Perspectives et applications Phylogénétique Novembre 2009
Facteur d’élongation Les mitochondries et chloroplastes sont d’origine bactérienne ‘endosymbiotique’ http://education.expasy.org/cours/FLO/Liste_prot_evol.html Phylogénétique Novembre 2009
~200 protéines universelles Arbre ‘global’ Applications Autres projets ~200 protéines universelles Arbre ‘global’ Applications métagénomes (identifications de nouvelles espèces, de nouveaux gènes (20 mo), de nouveaux enzymes….) 1ml d’eau de mer: 1 million de bactéries et 10 million de virus (C.Venter). découvertes de nouvelles bactéries (la moitié de la biomasse) médecine: identification de nouveaux pathogènes. Phylogénétique Novembre 2009
Références http://www.unige.ch/presse/Campus/campus95.html Phylogénétique Novembre 2009
Liste de gènes intéressants ‘Conceptual bases for quantifying the role of the environment on gene evolution: the participation of positive selection and neutral evolution’ http://www3.interscience.wiley.com/cgi-bin/fulltext/117981248/HTMLSTART Phylogénétique Novembre 2009
http://www3. interscience. wiley http://www3.interscience.wiley.com/cgi-bin/fulltext/117981248/HTMLSTART (i) FR1 The FRIGIDA (FR1) gene has been shown to be a major determinant of flowering time in Arabidopsis thaliana. A majority of early-flowering ecotypes shows one or two deletions that generate a frameshift in the FR1 open reading frame (ORF), suggesting that this phenotype has arisen at least twice. Le Corre, Roux & Reboud (2002) performed a population analysis on different ecotypes and confirmed that the loss of function mutations was associated with an early-flowering phenotype, these gene inactivations systematically evolved in a non-neutral fashion. Moreover, they confirmed that the gene inactivation was phenotypically linked to an early flowering ecotype adaptated to cold environments (Johanson et al., 2000; Le Corre et al., 2002). This represents a strong indication that environmental change has driven this genetic change. (ii) CCR5 This primate transmembrane receptor is a cellular gateway for the entry of HIV-1 and all strains of SIV. Human homozygotes for the CCR5 null allele which has a 32 base pair (bp) deletion are highly resistant to HIV-1 infection. Another null allele (24 bp deletion) of CCR5 has convergently evolved in sooty mangabeys (Cercocebus atys), a natural host of SIV. The occurrence of the mangabey null allele at an appreciable frequency (around 4%) could be explained by positive selection; null homozygotes are protected from SIV infection because the encoded protein is not transported to the cell surface (Palacios et al., 1998). The null allele has been shown to be positively selected in humans (Galvani & Novembre, 2005). However, the exact nature of the selective pressure involved in the origin of the CCR5-{delta} 32 allele and its high prevalence in European populations (approximately 10%) is unclear as the HIV epidemic in humans is much more recent than the age of the null allele (about 700 years). However, both HIV and poxviruses enter leukocytes using chemokine receptors; it is plausible that the loss of the CCR5 chemokine receptor originally conferred resistance against smallpox. This hypothesis is supported by a correlation between historical smallpox epidemics and allele geographic distribution (Galvani & Slatkin, 2003). Phylogénétique Novembre 2009
Exemple de gènes / protéines http://education.expasy.org/cours/FLO/Liste_prot_evol.html Phylogénétique Novembre 2009
Divers - Simulation par ordinateur: avec 2 mécanismes, le hasard et la sélection, l’informaticien Karl Sim a généré une complexité fascinante: http://www.archive.org/details/sims_evolved_virtual_creatures_1994 Phylogénétique Novembre 2009
Phylogenetic servers http://www.phylogeny.fr/ http://bioweb.pasteur.fr/seqanal/phylogeny/intro-uk.html http://atgc.lirmm.fr/phyml/ http://phylobench.vital-it.ch/raxml-bb/ http://power.nhri.org.tw/power/home.htm Phylogénétique Novembre 2009
Un ancêtre commun Phylogénétique Novembre 2009
La construction d’arbre phylogénétique ne serait pas possible … sans la notion d’ancêtre commun… Les espèces ne sont pas immuables, mais issues d’autres espèces et peuvent elles-mêmes donner naissance à de nouvelles. La sélection naturelle est opportuniste et ne poursuit aucun but à long terme. Jean-Baptiste de Lamarck et Charles Darwin Phylogénétique Novembre 2009
Cette notion d’ancêtre commun a été confirmée par la découverte de l’ADN et du code génétique ‘quasi universel’* que se partagent tous les organismes vivants. *http://www.ncbi.nlm.nih.gov/Taxonomy/Utils/wprintgc.cgi?mode=c par la découverte de gènes très conservés entre les espèces (exemples: gène ‘engrailed’, histone H4, ARN ribosomal) et de gènes ‘universels’ (~200). http://education.expasy.org/cours/FLO/Liste_prot_evol.html Phylogénétique Novembre 2009
Peabody museum exhibition on the Tree of Life http://www.peabody.yale.edu/exhibits/treeoflife/ Phylogénétique Novembre 2009
LUCA: Last Universal Common Ancestor LUCA est la ‘racine’ de l’arbre de la vie, mais probablement pas le premier organisme unicellulaire vivant. Il devait être déjà complexe et donc le résultat d’un long processus d’évolution Phylogénétique Novembre 2009
Peabody museum exhibition on the Tree of Life http://www.peabody.yale.edu/exhibits/treeoflife/ Phylogénétique Novembre 2009
http://www.peabody.yale.edu/exhibits/treeoflife/challenge.html Phylogénétique Novembre 2009
http://www.sciencedaily.com/releases/2009/11/091104132706.htm Phylogénétique Novembre 2009