CHMI 4206 Bioinformatique appliquée Prof: Eric R. Gauthier, Ph.D. Département de chimie et biochimie Université Laurentienne Protéomique 3 - Bioinformatique: Structure des protéines CHMI 4206F - Automne 2010
Détermination de la structure des protéines Protéomique structurale: détermination et analyse de la structure des protéines; Pourquoi?: la structure 3-D des protéines est de loin mieux conservée que la séquence en acides aminés: Des protéines ayant moins de 10% de conservation de séquence peuvent quand même être structurellement très semblables; P. Ex: trypsine vs élastase, deux protéases à sérine active. CHMI 4206F - Automne 2010
Trypsine vs Élastase CHMI 4206F - Automne 2010
Trypsine vs Élastase Trypsine Elastase CHMI 4206F - Automne 2010
Détermination de la structure des protéines Seule la structure 3-D d’une protéine permet d’obtenir une compréhension approfondie de la fonction de la protéine: Identification de domaines protéiques fonctionnels Identification du site actif d’un enzyme Identification de domaines d’interactions protéine-protéine, protéine-ADN, protéine-biomolécule. Amélioration des propriétés de la protéine d’intérêt par bioingénierie. CHMI 4206F - Automne 2010
Manipulation des structures protéiques Plusieurs logiciels gratuits sont disponibles pour visualiser la structure 3D de protéines: Swiss-Pdb viewer: Très performant: permet de visualiser les liaisons H entre résidus d’intérêt; Différents niveaux de visualisation sont disponibles; Peut manipuler la façon de voir la molécule (zoom-in/out, tranches de structure, chaînes latérales, etc). RasMol: plus limité que Swiss-Pdb Viewer, mais beaucoup plus facile à maîtriser. Jmol: Applet (donc pas besoin de télécharger et installer un fichier) (Site Expasy) CHMI 4206F - Automne 2010
Base de données de structures protéiques – RCSB-PDB http://www.pdb.org/pdb/home/home.do CHMI 4206F - Automne 2010
Base de données de structures protéiques – RCSB-PDB CHMI 4206F - Automne 2010
Base de données de structures protéiques – RCSB-PDB CHMI 4206F - Automne 2010
Exemple 1 Site actif de la trypsine Triade catalytique des protéases à sérine active: His 63 Asp 107 Ser 200 CHMI 4206F - Automne 2010
Trypsine – site actif CHMI 4206F - Automne 2010
Exemple 2 Mutation du site actif de la trypsine Change Asp 107 pour Lys CHMI 4206F - Automne 2010
Exemple 2 Mutation du site actif de la trypsine CHMI 4206F - Automne 2010
Trypsine – wt vs mutant Trypsine Mutant D102K CHMI 4206F - Automne 2010
Détermination de la structure des protéines CHMI 4206F - Automne 2010
Détermination de la structure des protéines http://speedy.embl-heidelberg.de/gtsp/flowchart2.html CHMI 4206F - Automne 2010
Détermination de la structure protéique Méthodes expérimentales: Cristallographie aux rayons-X Spectroscopie de résonance magnétique nucléaire Méthodes prédictives: Modélisation comparative Similarité de repliement (threading) Méthodes ab initio CHMI 4206F - Automne 2010
Méthodes expérimentales: Cristallographie des protéines Basé sur le principe que le passage de radiations X dans un cristal de la molécule d’intérêt cause la diffraction de la radiation, donnant un profil unique à la molécule analysée. http://www-structmed.cimr.cam.ac.uk/Course/Overview/Overview.html CHMI 4206F - Automne 2010
Méthodes expérimentales: Cristallographie des protéines http://www.ruppweb.org/Xray/xrayequipment.htm Les cristaux sont mis en rotation pendant leur irradiation, permettant d’obtenir des patrons de diffraction de tous les angles possibles; Le résultat (après analyse informatique) est une représentation 3-D de la protéine. CHMI 4206F - Automne 2010
Méthodes expérimentales: Cristallographie des protéines Avantages Capacité de « voir » le nuage d’électrons des biomolécules Permet de déterminer la structure de biomolécules gigantesques P.ex. Structure du ribosome Visualisation des liaisons entre atomes Inconvénients: Préparation de cristaux de protéines (Étape limitante) La protéine d’intérêt peut ne pas se comporter de la même manière sous forme de cristal qu’en solution; Les régions « dynamiques » de la molécule (i.e. qui sont en mouvement) sont impossible à analyser. http://www.chem.indiana.edu/academics/ugrad/Courses/c484/documents/Lecture12-notes.pdf CHMI 4206F - Automne 2010
Méthodes expérimentales: Cristallographie des protéines 4 MAY 2001 VOL 292 SCIENCE CHMI 4206F - Automne 2010
Méthodes expérimentales: Spectroscopie RMN La RMN permet de déterminer la structure de biomolécules en déterminant l’interaction entre atomes (surtout 1H, 13H, 15N), ce qui donne une mesure de leur distance relative; instruct1.cit.cornell.edu/courses/biobm730/lecture01.ppt CHMI 4206F - Automne 2010
Méthodes expérimentales: Spectroscopie RMN Alors que le couplage de protons est simple d’interprétation et peut facilement mener à une structure 3-D complète pour les petites biomolécules, le patron RMN de peptides est très complexe; CHMI 4206F - Automne 2010
Méthodes expérimentales: Spectroscopie RMN Pour permettre d’obtenir davantage d’information structurale, le couplage de protons dans l’espace (i.e. entre protons qui ne sont pas associés via une liaison covalente) est analysé par Nuclear Overhauser Effect Spectroscopy – 2-D NOESY. Le couplage NOE entre deux protons signifie que ces deux protons sont au plus à 5 Å de distance, même si ils sont éloignés dans la séquence en acides aminés. CHMI 4206F - Automne 2010
Méthodes expérimentales: Spectroscopie RMN Les données de RMN imposent des contraintes sur le nombre de stucture possibles que la protéine d’intérêt peut adopter; Ces contraintes structurales déterminées par RMN sont combinées à la modélisation moléculaire pour générer des structures tridimensionnelles consistantes avec les données RMN obtenues. CHMI 4206F - Automne 2010
Méthodes expérimentales: Spectroscopie RMN Avantages: La structure de protéines en solution peut être déterminée La structure des régions dynamiques (en mouvement) des protéines est obtenue Pas besoin de préparer des cristaux: si la protéine est soluble en solution, une analyse RMN est possible. Inconvénients: Taille limite de 40 kDa très restrictive Distance entre atomes en sont qu’approximatives Certaines biomolécules ne donnent pas assez d’information pour que la structure puisse être déduite. CHMI 4206F - Automne 2010
Serveur Expasy Prédiction de la structure secondaire CHMI 4206F - Automne 2010
Serveur Expasy Prédiction de la structure secondaire CHMI 4206F - Automne 2010
Serveur Expasy Prédiction de la structure secondaire – p70S6K CHMI 4206F - Automne 2010
Serveur Expasy Prédiction de structure tertiaire CHMI 4206F - Automne 2010
Méthodes prédictives Modélisation par comparaison Basé sur le principe que deux protéines similaires au niveau de leur séquence en acides aminés seront aussi similaire au point de vue de leur structure 3D. Fonctionne bien si les deux séquences montrent au moins 30% d’identité de séquence sur 80 acides aminés ou plus. Très utile pour déterminer l’effet de mutations sur la structure protéique. CHMI 4206F - Automne 2010
Méthodes prédictives Modélisation par comparaison Requiert plusieurs étapes: 1. identifier des protéines dont la séquence en acides aminés est très similaire à celle de la protéine d’intérêt; 2. trouver, parmi ces protéines, celle(s) dont la structure 3-D est connue; Constitue le gabarit (template) sur lequel la modélisation sera effectuée; Ceci est le facteur limitant principal dans l’utilisation de cette méthode 3. la séquence de la protéine d’intérêt et du gabarit sont alignées par ClustalW P.ex.: on doit s’assurer que les résidus important pour la fonction de la protéine (p.ex. site actif) sont bel et bien alignés. 4. Soumettre cet alignement à un logiciel qui modélisera la structure de la protéine d’intérêt: Stratégie commune: identifier les acides aminés formant le cœur de la structure (conservés) et ceux impliqués dans la formation de boucles en surface (plus variables) L’orientation des chaîne latérales des acides aminés est faite soit en se basant sur le gabarit, ou, si l’acide aminé n’est pas conservé, de déterminer l’orientation qui donnera l’énergie libre la plus faible. CHMI 4206F - Automne 2010
Méthodes prédictives Modélisation par comparaison Logiciel : Swiss Model http://swissmodel.expasy.org//SWISS-MODEL.html CHMI 4206F - Automne 2010
Méthodes prédictives Modélisation par comparaison CHMI 4206F - Automne 2010
Méthodes prédictives Prédiction ab initio de structures protéiques Débute par la déduction de la structure secondaire à partir de la séquence en acides aminés: Détermine la probabilité qu’une partie de la séquence adoptera une structure en hélice a, feuillet b, etc; Basé sur les paramètres physico-chimiques des acides aminés; Donc, en principe, la structure 3D de toute protéine pourrait être déduite seulement à partir de la séquence en acides aminés; Les structures secondaires sont alors repliées en structure tertiaire, encore un fois en se basant sur les propriétés physico-chimiques; La qualité du modèle est vérifiée en le comparant avec la structure de protéines similaires; Problème principal: déterminer quelle structure, parmi toutes celles possibles en théorie, correspond à la structure 3D de la protéine. Ceci limite l’applicabilité de cette méthode aux protéines de moins de 200 acides aminés. CHMI 4206F - Automne 2010
Méthodes prédictives Modélisation par similarité de repliement (« threading ») Cette méthode tente de trouver le meilleur match entre la séquence en acide aminés de la protéine d’intérêt et la séquence de protéines présentes dans une base de données de domaines protéiques; CATH: http://www.cathdb.info/latest/index.html SCOP: http://scop.mrc-lmb.cam.ac.uk/scop/ Permet donc de trouver des similarités locales de séquences correspondant à des domaines structurels particulier, et d’utiliser ces blocs de domaines protéiques afin de dériver une structure 3D complète; Permet de déduire une structure 3D même si la protéine d’intérêt ne possède qu’une similarité de séquence faible avec d’autres protéines; CHMI 4206F - Automne 2010
Base de donnée de domaines CATH CHMI 4206F - Automne 2010
Base de donnée de domaines CATH CHMI 4206F - Automne 2010
Méthodes prédictives Modélisation par similarité de repliement (« threading ») CHMI 4206F - Automne 2010
Méthodes prédictives Modélisation par « threading » - 3D-PSSM CHMI 4206F - Automne 2010