Les nouvelles preuves de l’évolution: y accéder en classe PO 422 Phylogénétique Novembre 2009
Etude des relations de parenté entre espèces. Phylogénie Etude des relations de parenté entre espèces. Une analyse phylogénétique permet d’estimer (modéliser) les relations évolutives qui existent entre les espèces grâce à un arbre: qui a un ancêtre commun - qui est le cousin de qui ? Phylogénétique Novembre 2009
http://www.unige.ch/450/expositions/genome/presentation/slogans.html Phylogénétique Novembre 2009
Il est possible de construire un arbre phylogénétique à partir de différents types de données: Les données morphologiques (écailles ou plumes, présence de certains os du crâne, forme des feuilles…). Il existe quelques centaines de caractères définis dans ce but par les spécialistes. Les caractères physiologiques (température corporelle…) L’ordre des gènes (par exemple sur l’ADN des mitochondries) Les données moléculaires (séquences d’ADN ou de protéines). Des mutations modifient les séquences de l’ADN et par conséquent des protéines au cours de l’évolution. toutes les données existantes….(défi scientifique !) Phylogénétique Novembre 2009
Phylogénétique Novembre 2009
Il est possible de construire un arbre phylogénétique à partir de différents types de données: les données morphologiques (écailles ou plumes, présence de certains os du crâne,, forme des feuilles…). Il existe quelques centaines de caractères définis dans ce but par les spécialistes. Les caractères physiologiques (température corporelle…) L’ordre des gènes (par exemple sur l’ADN des mitochondries) les données moléculaires (séquences d’ADN ou de protéines). Des mutations modifient les séquences de l’ADN et par conséquent des protéines au cours de l’évolution. toutes les données existantes….(défi scientifique !) Phylogénétique Novembre 2009
Phylogénétique Novembre 2009 http://tecfa.unige.ch/perso/lombardf/calvin/images/restricted/index.php?op=5&path=evolution&file=cytochrome-divers-org.jpg Phylogénétique Novembre 2009
http://www.sciencedaily.com/releases/2009/11/091104132706.htm Phylogénétique Novembre 2009
http://www.unige.ch/450/expositions/genome/presentation/slogans.html Phylogénétique Novembre 2009
Les mutations dans l’ADN peuvent être dûes à Des erreurs lors de la réplication de l’ADN Des agents chimiques ou physiques (fumée de cigarette, UV,…) Des virus Les conséquences des mutations peuvent être des changements ‘mineurs’ (changement d’un acide aminé pour un autre) ou majeurs (duplication de gènes, délétion d’un bout de chromosomes, …) Chez les mammifères, à chaque génération, il se produit en moyenne quelques dizaines de mutations dans le génome de chaque individu. Si ces mutations se trouvent dans l’ADN des cellules sexuelles, elles seront transmises à la descendance. La sélection naturelle favorisera la sélection des individus avec des mutations qui augmentent les chances de reproduction et de survie dans un environnement donné. Phylogénétique Novembre 2009
Il est possible de ‘lire’ l’évolution dans les gènes (séquences en acide nucléique) ou les protéines correspondantes (séquences en acide aminé). Les données moléculaires peuvent être utilisées pour établir des relations de parenté phylogénétique entre les organismes, et donc pour reconstruire l’arbre de la vie. Ces données sont libres d’accès sur internet… Phylogénétique Novembre 2009
www.uniprot.org (query ‘insulin’) Phylogénétique Novembre 2009
www.uniprot.org (query ‘insulin’) Phylogénétique Novembre 2009
www.uniprot.org (query ‘insulin’, align) Alignement multiple des séquences en acides aminés de l’insuline de différentes espèces www.uniprot.org (query ‘insulin’, align) Phylogénétique Novembre 2009
On ne peut pas ‘muter’ n’importe quoi…. Peptide signal Hélice alpha Hélice alpha Phylogénétique Novembre 2009
- Qui est le cousin de qui ? Qui a un ancêtre commun ? Cladogramme obtenu à partir de l’analyse phylogénétique de l’alignement multiple des séquences d’insuline - Qui est le cousin de qui ? Qui a un ancêtre commun ? Le résultat peut dépendre de la protéine utilisée pour construire l’arbre….et le résultat ne correspond pas toujours à l’’arbre des espèces’… www.phylogeny.fr Phylogénétique Novembre 2009
Un ancêtre commun Phylogénétique Novembre 2009
La construction d’arbre phylogénétique ne serait pas possible … sans la notion d’ancêtre commun… Les espèces ne sont pas immuables, mais issues d’autres espèces et peuvent elles-mêmes donner naissance à de nouvelles. La sélection naturelle est opportuniste et ne poursuit aucun but à long terme. Jean-Baptiste de Lamarck et Charles Darwin Phylogénétique Novembre 2009
Cette notion d’ancêtre commun a été confirmée par la découverte de l’ADN et du code génétique ‘quasi universel’* que se partagent tous les organismes vivants. *http://www.ncbi.nlm.nih.gov/Taxonomy/Utils/wprintgc.cgi?mode=c par la découverte de gènes très conservés entre les espèces (exemples: gène ‘engrailed’, histone H4, ARN ribosomal) et de gènes ‘universels’ (~200). http://education.expasy.org/cours/FLO/Liste_prot_evol.html Phylogénétique Novembre 2009
Peabody museum exhibition on the Tree of Life http://www.peabody.yale.edu/exhibits/treeoflife/ Phylogénétique Novembre 2009
LUCA: Last Universal Common Ancestor LUCA est la ‘racine’ de l’arbre de la vie, mais probablement pas le premier organisme unicellulaire vivant. Il devait être déjà complexe et donc le résultat d’un long processus d’évolution Phylogénétique Novembre 2009
Peabody museum exhibition on the Tree of Life http://www.peabody.yale.edu/exhibits/treeoflife/ Phylogénétique Novembre 2009
http://www.peabody.yale.edu/exhibits/treeoflife/challenge.html Phylogénétique Novembre 2009
Comment construire des arbres phylogénétiques sur la base des séquences des protéines… Novembre 2009
Le principe 1. Sélection: set de séquences de protéines ‘homologues’ 2. Comparaison: alignement multiple 3. Construction de l’arbre: ‘calculer les différences’ Phylogénétique Novembre 2009
Le principe Sélection: set de séquences de protéines ‘homologues’ Comparaison: alignement multiple Construction de l’arbre: ‘calculer les différences’ Phylogénétique Novembre 2009
Trouver des séquences de protéines homologues… ‘query’ par nom de protéines ou nom de gènes Utiliser http://www.uniprot.org/ Exemples: http://education.expasy.org/cours/FLO/Liste_prot_evol.html Blast Utiliser http://www.expasy.org/tools/blast/ ou le Blast@UniProt Phylogénétique Novembre 2009
Protein and gene nameS www.uniprot.org/ query FOLH1 Phylogénétique Novembre 2009
www.uniprot.org Phylogénétique Novembre 2009
Limiter votre requête selon les propositions de l’outil de recherche Limiter votre requête selon les propositions de l’outil de recherche. Dans notre cas: ‘insulin est un ‘protein name’ Phylogénétique Novembre 2009
Phylogénétique Novembre 2009
Customize display Phylogénétique Novembre 2009
www.uniprot.org (query ‘name:insulin’) Phylogénétique Novembre 2009
1- Sélectionner les protéines homologues qui vous intéressent 2- Cliquer sur ‘Retrieve’ pour récupérer les séquences en format ‘Fasta’ Phylogénétique Novembre 2009
Cliquer sur ‘Open’ pour récupérer les séquences en format ‘Fasta’ Phylogénétique Novembre 2009
Phylogénétique Novembre 2009
Si vous souhaitez faire un alignement multiple: …utile comme moyen de vérifier la pertinence des séquences que vous avez sélectionnées… Phylogénétique Novembre 2009
Sélectionner les séquences homologues provenant d’espèces différentes !!! Les séquences doivent être homologues (même protéine chez différentes espèces) Phylogénétique Novembre 2009
Cliquer sur ‘Align’ pour faire une comparaison des séquences sélectionnées (alignement multiple) Phylogénétique Novembre 2009
2- cliquer ici 1- Éditer manuellement le texte: remplacer les numéros d’accession par le nom de l’espèce Phylogénétique Novembre 2009
Phylogénétique Novembre 2009
Le principe Sélection: set de séquences de protéines ‘homologues’ Comparaison: alignement multiple Construction de l’arbre: ‘calculer les différences’ Phylogénétique Novembre 2009
www.phylogeny.fr Introduire le set de séquences sélectionnées à www.uniprot.org (format ‘fasta’) Utiliser les paramètres par défaut (‘one’ click) Phylogénétique Novembre 2009
www.phylogeny.fr Phylogénétique Novembre 2009
Copier –coller les séquences en format ‘Fasta’ récupérées sur le site UniProt Phylogénétique Novembre 2009
Modifier le texte (nom des espèces) si vous le souhaitez… Phylogénétique Novembre 2009
Cliquer sur ‘submit’ Phylogénétique Novembre 2009
- Qui est le cousin de qui ? Qui a un ancêtre commun ? Cladrogramme obtenu à partir de l’analyse phylogénétique de l’alignement multiple des séquences d’insuline - Qui est le cousin de qui ? Qui a un ancêtre commun ? www.phylogeny.fr Phylogénétique Novembre 2009
Les différents types d’arbres (1) Phylogénétique Novembre 2009
Un arbre phylogénétique est un modèle qui décrit les relations entre des unités taxonomiques, basé sur des caractères homologues. Phylogénétique Novembre 2009
Arbres (cladogrammes) F G A B C D E F G End nodes Internal nodes Branches Roots Phylogénétique Novembre 2009
Peabody museum exhibition on the Tree of Life http://www.peabody.yale.edu/exhibits/treeoflife/ Phylogénétique Novembre 2009
Combien d’arbres différents ?
Les différents types d’arbres (2) Phylogénétique Novembre 2009
Arbres phylogénétiques Cladogramme Phylogramme Qui est le cousin de qui ? La longueur des branches est proportionnelle aux différences. Cette longueur n’est pas toujours facile à interpréter ! Elle dépend entre autre de la vitesse d’évolution…(nombres de variations par site dans un laps de temps donné)
- Qui est le cousin de qui ? Qui a un ancêtre commun ? Exemple de cladogramme obtenu à partir de l’analyse bioinformatique de l’alignement multiple des séquences d’insuline - Qui est le cousin de qui ? Qui a un ancêtre commun ? www.phylogeny.fr Phylogénétique Novembre 2009
Refaire le phylogramme en incluant le nombre de variations par site !!!!! Phylogénétique Novembre 2009
Echelle: ‘expected number of changes per site’ Exemple de phylogramme obtenu à partir de l’analyse bioinformatique de l’alignement multiple des séquences d’insuline - Quelle protéine a évolué plus rapidement ? Echelle: ‘expected number of changes per site’ Le temps qui s’écoule….
Echelle: ‘expected number of changes per site’ Exemple de phylogramme obtenu à partir de l’analyse bioinformatique de l’alignement multiple des séquences d’insuline - Quelle protéine a ‘évolué’ plus rapidement ? L’insuline de la carpe a ‘évolué’ (moins de changements dans sa séquences en acides aminés) moins rapidement que l’insuline des autres espèces… Probabilité que l’arbre ait la bonne configuration à chaque embranchement (> 0.95: OK) Echelle: ‘expected number of changes per site’ Le temps qui s’écoule….
Les gènes (et les protéines) évoluent à des vitesses différentes L’histone H4 n’a accumulé que 2 mutations ‘conservatives’ en 1.5 milliard d’années Phylogénétique Novembre 2009
Les gènes (et les protéines) évoluent à des vitesses différentes Une protéine qui a évolué extrêmement rapidement: l’involucrin (une protéine de la peau): 10 % de changements en l’espace de 4 millions d’années (séparation des chimpanzés et de l’homme)
Les embranchements Spéciation Duplication de gènes Phylogénétique Novembre 2009
Spéciation et duplication de gène Frog gene A speciation Human gene A Orthologs speciation Mouse gene A Gene duplication Paralogs Mouse gene B Homologs speciation Ancestral gene Human gene B Orthologs speciation Frog gene B Drosophila gene AB Phylogénétique Novembre 2009
Spéciation et duplication de gène Duplication ins1 – ins 2 Spéciation rat - souris Phylogénétique Novembre 2009
Perspectives et applications Phylogénétique Novembre 2009
Facteur d’élongation Les mitochondries et chloroplastes sont d’origine bactérienne ‘endosymbiotique’ http://education.expasy.org/cours/FLO/Liste_prot_evol.html Phylogénétique Novembre 2009
~200 protéines universelles Arbre ‘global’ Applications Autres projets ~200 protéines universelles Arbre ‘global’ Applications métagénomes (identifications de nouvelles espèces, de nouveaux gènes (20 mo), de nouveaux enzymes….) 1ml d’eau de mer: 1 million de bactéries et 10 million de virus (C.Venter). découvertes de nouvelles bactéries (la moitié de la biomasse) médecine: identification de nouveaux pathogènes. Phylogénétique Novembre 2009
Ressources taxonomiques Phylogénétique Novembre 2009
http://www.ncbi.nlm.nih.gov/guide/taxonomy/ Phylogénétique Novembre 2009
http://www.uniprot.org/taxonomy/ Phylogénétique Novembre 2009
Références http://www.unige.ch/presse/Campus/campus95.html Phylogénétique Novembre 2009
Liste de gènes intéressants ‘Conceptual bases for quantifying the role of the environment on gene evolution: the participation of positive selection and neutral evolution’ http://www3.interscience.wiley.com/cgi-bin/fulltext/117981248/HTMLSTART Phylogénétique Novembre 2009
Exemple de gènes / protéines http://education.expasy.org/cours/FLO/Liste_prot_evol.html Phylogénétique Novembre 2009
Divers - Simulation par ordinateur: avec 2 mécanismes, le hasard et la sélection, l’informaticien Karl Sim a généré une complexité fascinante: http://www.archive.org/details/sims_evolved_virtual_creatures_1994 Phylogénétique Novembre 2009
A vous de jouer… Phylogénétique Novembre 2009
Phylogenetic servers http://www.phylogeny.fr/ http://bioweb.pasteur.fr/seqanal/phylogeny/intro-uk.html http://atgc.lirmm.fr/phyml/ http://phylobench.vital-it.ch/raxml-bb/ http://power.nhri.org.tw/power/home.htm Phylogénétique Novembre 2009
Phylogénétique Novembre 2009