Anthony LEVASSEUR. Formation Phylogénomique- Décembre 2006 Concepts biologiques et prédiction fonctionnelle 14 Décembre 2006 Carry-le-Rouet Anthony LEVASSEUR EA 3781 - Evolution Biologique Laboratoire de Phylogénomique UP - Case 19, Pl. V. Hugo 13331 Marseille - France UMR 1163 INRA de Biotechnologie des Champignons Filamenteux ESIL-163 av. de Luminy 13288 Marseille - France Anthony LEVASSEUR. Formation Phylogénomique- Décembre 2006
Anthony LEVASSEUR. Formation Phylogénomique- Décembre 2006 Plan de la présentation I Introduction générale II Etude d’un cas : la famille lipase/féruloyl estérase A II.1 Exemple d’un outil de détection du shift évolutif II.2 Exploitation des données pour la prédiction fonctionnelle III Conclusion Anthony LEVASSEUR. Formation Phylogénomique- Décembre 2006
Introduction générale Objectif : tenter de répondre aux questions suivantes Comment exploiter l’information phylogénétique pour l’annotation fonctionnelle ? Comment les concepts de l’évolution pourraient-ils apporter de nouvelles informations ? Anthony LEVASSEUR. Formation Phylogénomique- Décembre 2006
Anthony LEVASSEUR. Formation Phylogénomique- Décembre 2006 Un exemple de reconstruction phylogénétique Anthony LEVASSEUR. Formation Phylogénomique- Décembre 2006
Anthony LEVASSEUR. Formation Phylogénomique- Décembre 2006 Recherche données fonctionnelles (expérimentales) Anthony LEVASSEUR. Formation Phylogénomique- Décembre 2006
Anthony LEVASSEUR. Formation Phylogénomique- Décembre 2006 Annotation par encadrement Anthony LEVASSEUR. Formation Phylogénomique- Décembre 2006
Anthony LEVASSEUR. Formation Phylogénomique- Décembre 2006 Intégration du shift évolutif pour l’annotation Anthony LEVASSEUR. Formation Phylogénomique- Décembre 2006
Anthony LEVASSEUR. Formation Phylogénomique- Décembre 2006 II. Etude d’un cas : la famille fongique lipase/féruloyl estérase A Reconstruction phylogénétique: Protéine d’entrée: FAEA Swissprot: locus FAEA_ASPNG, accession O42807 Utilisation de la plateforme FIGENIX (http://www.up.univ-mrs.fr/evol/figenix/index.html) Pipeline : CASSIOPE_PHYLO+M Production d’un arbre consensus fusionné Anthony LEVASSEUR. Formation Phylogénomique- Décembre 2006
Anthony LEVASSEUR. Formation Phylogénomique- Décembre 2006 Unknown protein: gris, lipase: vert, FAEA: jaune Anthony LEVASSEUR. Formation Phylogénomique- Décembre 2006
Anthony LEVASSEUR. Formation Phylogénomique- Décembre 2006 Arbre obtenu après intégration des données fonctionnelles (experimental data) FAEA Lipase Anthony LEVASSEUR. Formation Phylogénomique- Décembre 2006
Anthony LEVASSEUR. Formation Phylogénomique- Décembre 2006 II.1 Exemple d’un outil de détection du shift évolutif PAML inclut plusieurs programmes, dans notre exemple nous avons exploité codeml pour : Estimer le taux de substitutions synonymes et non synonymes et détecter la sélection positive Comparer différents modèles pour la validation d’hypothèses (Likelihood ratio tests) Anthony LEVASSEUR. Formation Phylogénomique- Décembre 2006
Anthony LEVASSEUR. Formation Phylogénomique- Décembre 2006 Modèles & analyses Théorie générale: Le ratio du taux de substitutions non-synonymes sur synonymes (ω) fournit une mesure de la sélection naturelle à l’échelle protéique dans laquelle: D(N)/D(S) <1 signifie que la séquence évolue sous sélection conservatrice D(N)/D(S) =1 … sous la neutralité D(N)/D(S) >1 … sous sélection positive La description détaillée des modèles est disponible sur les sites suivants : Anthony LEVASSEUR. Formation Phylogénomique- Décembre 2006
Anthony LEVASSEUR. Formation Phylogénomique- Décembre 2006 Différents modèles: Le shift évolutif peut se produire pendant une période brève & sur certains acides aminés uniquement… D’où le développement de différents modèles prenant en compte ces observations. 1. Modèles branches Les modèles dits par branches permettent au ratio ω de varier parmi les branches dans une phylogénie et sont utiles pour détecter la sélection positive se produisant sur des lignées particulières 2. Modèles par sites Ces modèles dits par sites permettent au ratio ω de varier parmi les sites de la séquence protéique Plusieurs modèles ont été développés. Il apparaît que les modèles M1a (Nearly Neutral) et M2a (Positive selection) sont particulièrement utiles pour la détection de la sélection positive et sont fortement recommandés pour les tests de données réelles. Anthony LEVASSEUR. Formation Phylogénomique- Décembre 2006
Anthony LEVASSEUR. Formation Phylogénomique- Décembre 2006 3. Modèles Sites + Branches Yang et Nielsen (2002) ont développé un modèle (model A) qui autorise ω à varier parmi les sites et parmi les lignées. Ce modèle tente de détecter la sélection positive sur plusieurs classes de sites et se focalise sur une branche donnée. 1 1. Yang Z, Nielsen R. 2002. Mol Biol Evol. 19:908-917. Sélection positive La validation de la sélection positive s’effectue par un test LRT (Likelihood Ratio Test). En supposant que le modèle le plus simple (null model) ait p0 paramètres, le modèle alternatif p1 paramètres et les valeurs log likelihood sous ces deux modèles soient l0 et l1, respectivement La différence 2Δl = 2(l1-l0) a une distribution χ2 avec df= p1-p0 si le null model est vrai. 2 Δl peut être comparé à une distribution χ2 pour tester si le modèle null est rejeté contre le modèle alternatif. Anthony LEVASSEUR. Formation Phylogénomique- Décembre 2006
Anthony LEVASSEUR. Formation Phylogénomique- Décembre 2006 Codeml ML analysis of protein-coding DNA sequences using codon substitution models (e.g., Goldman and Yang 1994) Données d’entrées nécessaires: 1/ Alignement (ClustalW) 2/ Arbre parenthèse Fichier de contrôle ctl. : Tableau de bord permettant de cibler le modèle appliqué, divers paramètres d’analyse… Anthony LEVASSEUR. Formation Phylogénomique- Décembre 2006
Anthony LEVASSEUR. Formation Phylogénomique- Décembre 2006 II.2 Exploitation des données pour la prédiction fonctionnelle Anthony LEVASSEUR. Formation Phylogénomique- Décembre 2006
Anthony LEVASSEUR. Formation Phylogénomique- Décembre 2006 Likelihood Ratio Tests Détection de la sélection positive confirmée Anthony LEVASSEUR. Formation Phylogénomique- Décembre 2006
Anthony LEVASSEUR. Formation Phylogénomique- Décembre 2006 Cartographie évolutive Utilisation des sites évoluant sous sélection positive pour la prédiction fonctionnelle 17M, 19T, 22Q, 29C, 51W, 63T, 70G, 71D, 74L, 75Q, 76L, 103G, 126A, 163S 209G, 226V, 248T, 257A La prédiction fonctionnelle s’est basée sur le « profil évolutif » et à permis de compléter l’annotation de cette famille Anthony LEVASSEUR. Formation Phylogénomique- Décembre 2006
Anthony LEVASSEUR. Formation Phylogénomique- Décembre 2006 Lipase FAEA Anthony LEVASSEUR. Formation Phylogénomique- Décembre 2006
Anthony LEVASSEUR. Formation Phylogénomique- Décembre 2006 Résultats 33 sites évoluent sous sélection positive (seuil de probabilité >95%) Détection de la sélection positive confirmée Anthony LEVASSEUR. Formation Phylogénomique- Décembre 2006
Alignement et conservation des sites: Une majorité des sites positivement sélectionnés est conservée dans le groupe féruloyl estérase A mais pas dans le groupe des lipases Confirme le rôle essentiel des ces sites pour la fonction enzymatique La présence de sites évoluant sous sélection positive a été démontrée. Est-ce que les sites positivement sélectionnés sont impliqués dans le changement fonctionnel Anthony LEVASSEUR. Formation Phylogénomique- Décembre 2006
Sites sous sélection positive et implication fonctionnelle 1. Asp71 et Tyr80 dans la région du « clapet » (69-80) 2. Tyr100 et le site catalytique La mutagénèse dirigée permet de connecter les sites positivement sélectionnés au changement fonctionnel Lien entre changements évolutif et fonctionnel FaeA Aspergillus niger (1USW) Anthony LEVASSEUR. Formation Phylogénomique- Décembre 2006
Anthony LEVASSEUR. Formation Phylogénomique- Décembre 2006 Conclusion III. Une relation entre shift évolutif et shift fonctionnel a été établie Les sites sous sélection positive représentent des « sondes évolutives » exploitables pour la prédiction fonctionnelle Pour plus d’infos… sur ces travaux : Levasseur et al. BMC Evolutionary Biology 2006, 6:92 (8 November 2006) sur la détection de la sélection positive : http://workshop.molecularevolution.org/people/faculty/files/codon.html Anthony LEVASSEUR. Formation Phylogénomique- Décembre 2006
Anthony LEVASSEUR. Formation Phylogénomique- Décembre 2006 Remerciements EA 3781 - Evolution Biologique Laboratoire de Phylogénomique UP - Case 19, Pl. V. Hugo 13331 Marseille - France UMR 1163 INRA de Biotechnologie des Champignons Filamenteux ESIL-163 av. de Luminy 13288 Marseille - France http://www.up.univ-mrs.fr/evol/ http://umrbcf.esil.univ-mrs.fr/ Anthony LEVASSEUR. Formation Phylogénomique- Décembre 2006
Anthony LEVASSEUR. Formation Phylogénomique- Décembre 2006
Anthony LEVASSEUR. Formation Phylogénomique- Décembre 2006
Anthony LEVASSEUR. Formation Phylogénomique- Décembre 2006 Un point sur les définitions 1.Shift fonctionnel : Changement de la « fonction » d’un produit de gène pouvant s’opérer à diverses échelles biologiques (protéine… compartiment cellulaire… organes…organismes…population etc…) Quelques causes du shift fonctionnel : Micro-mutations: substitutions, délétions, insertions… Gene shuffling Duplications (Évolution divergente des duplicats) Anthony LEVASSEUR. Formation Phylogénomique- Décembre 2006
Anthony LEVASSEUR. Formation Phylogénomique- Décembre 2006 Devenir & Conséquence du shift fonctionnel : Contre-sélection Evolution sous la neutralité Sélection : nouveauté conférant un avantage sélectif par rapport au milieu environnemental, reproduction… ? Acquisition de nouvelles caractéristiques biochimiques, colonisation de nouvelles niches écologiques… Adaptation à l’environnement Anthony LEVASSEUR. Formation Phylogénomique- Décembre 2006
Anthony LEVASSEUR. Formation Phylogénomique- Décembre 2006 Shift évolutif: Accélération (épisodique) du taux de substitutions d’une séquence Origine : Sélection positive Relâche de contraintes fonctionnelles Anthony LEVASSEUR. Formation Phylogénomique- Décembre 2006
Anthony LEVASSEUR. Formation Phylogénomique- Décembre 2006 Exemple d’un modèle statistique de prédiction fonctionnelle basé sur l’exploitation des informations phylogénétiques Anthony LEVASSEUR. Formation Phylogénomique- Décembre 2006
Anthony LEVASSEUR. Formation Phylogénomique- Décembre 2006 La famille lipase/feruloyl esterase A FERULOYL ESTERASES A LIPASES Lignocellulolyse Metabolisme Cette famille possède deux types d’activité enzymatique malgrè un pourcentage de similarité de séquences élevé. Comment expliquer une telle divergence fonctionnelle au sein de cette famille ? & Quelles sont les forces conduisant à de tels événements ? Anthony LEVASSEUR. Formation Phylogénomique- Décembre 2006
Anthony LEVASSEUR. Formation Phylogénomique- Décembre 2006 Koseki et al., Biochim Biophys Acta, 1722: 200-8 Anthony LEVASSEUR. Formation Phylogénomique- Décembre 2006
Anthony LEVASSEUR. Formation Phylogénomique- Décembre 2006