1 Détermination de la structure 3D d'une protéine à partir de données de RMN B.

Slides:



Advertisements
Présentations similaires
DECOLLAGES ET MONTEES ADAPTES
Advertisements

LES NOMBRES PREMIERS ET COMPOSÉS
1. Résumé 2 Présentation du créateur 3 Présentation du projet 4.
CARACTERISTIQUES D’UN ENSEMBLE DE FORCES
AUTRES ASPECTS DU GPS Partie I : tolérance de Battement
Licence pro MPCQ : Cours
Non linéarités liées à la thermique
Distance inter-locuteur
Analyse temps-fréquence
Capteurs et Actionneurs
Outils chimiques pour létude des biomolécules 2 ème partie : Outils chimiques théorique : Modélisation Moléculaire 2) La modélisation moléculaire : optimisation.
Outils chimiques pour l’étude des biomolécules
Le remplacement moléculaire
CPMOH, Université Bordeaux 1
Ordonnancement des mouvements de deux robots
SERIE I : ELECTROSTATIQUE
Mr: Lamloum Med LES NOMBRES PREMIERS ET COMPOSÉS Mr: Lamloum Med.
Etienne Bertaud du Chazaud
LE SON & L’ AUDITION Dr CHAKOURI M.
1 Cours numéro 3 Graphes et informatique Définitions Exemple de modélisation Utilisation de ce document strictement réservée aux étudiants de l IFSIC.
Application des algorithmes génétiques
Classification Multi Source En Intégrant La Texture
Cours de physique générale I Ph 11
1.2 COMPOSANTES DES VECTEURS
Titre : Implémentation des éléments finis sous Matlab
Le point le plus près Montage préparé par : André Ross
1 Journée de regroupement des correspondants "Egalité et genre" - 21 novembre 2011 Rectorat de Rouen - SAIO - CD-HD Résultats scolaires, appréciations.
III – Convergence Asymptotique
Tableaux de distributions
Tableaux de distributions
Projet poker 1/56. Introduction Présentation de léquipe Cadre du projet Enjeux Choix du sujet 2.
LES NOMBRES PREMIERS ET COMPOSÉS
Tolérances géométriques
VOC 1 CE2 Je sais utiliser des mots de la vie quotidienne.
CHAPITRE 4 LE POTENTIEL ÉLECTRIQUE.
Partie 1: Ondes et Particules.
II- L’algorithme du recuit simulé (pseudo-code)
RACINES CARREES Définition Développer avec la distributivité Produit 1
Représentation des systèmes dynamiques dans l’espace d’état
Systèmes mécaniques et électriques
Représentation des systèmes dynamiques dans l’espace d’état
Représentation des systèmes dynamiques dans l’espace d’état
Courbes de Bézier.
1.1 LES VECTEURS GÉOMÉTRIQUES
1 Licence dinformatique Algorithmique des graphes Problèmes dordonnancement. Utilisation de ce document strictement réservée aux étudiants de l IFSIC dans.
Titre : Implémentation des éléments finis en Matlab
Hybridation sp3 du carbone
Équipe 2626 Octobre 2011 Jean Lavoie ing. M.Sc.A.
Programmation linéaire en nombres entiers : les méthodes de troncature
La Modélisation Moléculaire
ASI 3 Méthodes numériques pour l’ingénieur
Présentation de la méthode des Eléments Finis
Elaboré par M. NUTH Sothan 1. 2 Soit x, y et z des coordonnées cartésiennes à 3 dimension. G un ensemble de points dans le plan (u, v). Déf. : On appelle.
Antennes-BIE à surface combinée
Equation différentielle de 2ème ordre
1 - Programme de Seconde (juin 2009) Statistique et probabilités
1. Présentation générale du système
UHA-FST Année L1S1-1 Examen de janvier 2009 – Durée 90 minutes Introduction aux concepts de la Physique N° carte étudiant:………………… 1- De ces trois.
RÉSISTANCE DES MATÉRIAUX Les sollicitations internes
Suites numériques Définitions.
1 Une méthode itérative pour l'unfolding des données expérimentales, stabilisée dynamiquement(*) Bogdan MALAESCU LAL LLR 28/09/2009 (*arxiv: )
Les Chiffres Prêts?
Potentiel électrostatique
UHA-FST Année L1S1-1 Examen de janvier 2008 – Durée 90 minutes Introduction aux concepts de la Physique N° carte étudiant:………………… 2-La réunion.
Rappels de statistiques descriptives
UHA-FST Année L1S1-2 Examen de janvier 2006 – Durée 90 minutes Introduction aux concepts de la Physique N° carte étudiant:………………… 1-Donnez votre.
Partie II: Temps et évolution Energie et mouvements des particules
PREVISION DE LA GEOMETRIE DES MOLECULES
Dr. Florent Barbault, ITODYS (CNRS UMR 7086) La mécanique moléculaire.
Transcription de la présentation:

1 Détermination de la structure 3D d'une protéine à partir de données de RMN B.

2 B.Détermination de la structure 3D d'une protéine à partir de données de RMN I.Contraintes RMN utilisées pour les calculs II. Les méthodes de modélisation moléculaire appliquées aux peptides et protéines III. Evaluation de la qualité des structures Plan du Cours A.Principes de la modélisation moléculaire I.Généralités II. Représentation empirique de l'énergie moléculaire III. Les méthodes de calculs empiriques 1.Algorithmes de minimisation d'énergie 2.Dynamique moléculaire

3 I. Contraintes RMN utilisées pour les calculs B.

4 1. Contraintes de distances déduites des NOEs Intensités des pics NOEs obtenues à partir des spectres NOESY Intensité NOE (  ij ) = interactions dipôle-dipôle entre deux protons i et j où d(ij) ≤ 5 Å  ij = vitesse de relaxation croisée  ij = vitesse de relaxation longitudinale  i,  j = rapports gyromagnétiques des protons i et j La vitesse de relaxation croisée est reliée à la distance interproton r ij par: Intensité des pics NOE proportionnelle à 

5 1. Contraintes de distances déduites des NOEs -temps de corrélation (  c ) moyenné -phénomène de diffusion de spin Imprécision sur les distances déduites du volume des NOEs Solutions 2. Contraintes de distances introduites avec une marge d'erreur (20-25%) par rapport aux valeurs déterminées. d ±  d 1. Définition de classes de contraintes Exemple : Fort 1.8 -> 2.6 Å Moyen 2.6 -> 3.8 Å Faible 3.8 -> 5.0 Å Introduction d'intervalles de valeurs possibles [d min -d max ] 

6 2. Contraintes angulaires déduites des constantes de couplage Différents jeux de coefficients (A, B, C) ont été proposés dans la littérature : Les coefficients (A = 6.4, B = 1.4 et C = 1.9) proposés par Pardi et al. sont habituellement utilisés pour les peptides et les protéines

7 Imprécision sur la mesure des constantes de couplage Imprécision sur l'angle de torsion  Solution Contraintes angulaires introduites sous la forme d'un intervalle d'angles limites déterminés à partir des mesures de constantes de couplage 2. Contraintes angulaires déduites des constantes de couplage  ±  (°) J ±  J (Hz)  

8 Vitesse d'échange 1 H/ 2 D des protons amides + détermination des éléments de structures secondaire Localisation possible des liaisons H 3. Autres contraintes a. Liaison Hydrogène Introduction sous forme de contraintes de distance : NH OC d HN-O = 2 Å d HN-O d N-O = 3 Å d N-O 

9 Certains programmes ne considèrent pas les ponts disulfure comme une structure covalente 3. Autres contraintes b. Ponts disulfure Introduction sous forme de contraintes de distance : d S-S = 2,1 Å d S-S H2CH2C SSCH 2 d C1  -S2  = d C2  -S1  = 3,1 Å d C1  -S2  d C2  -S1  

10 4. Prise en compte des contraintes RMN Introduction sous forme de termes énergétiques s'ajoutant à ceux du champ de forces Lorsque l'intervalle autorisé d'une contrainte n'est pas respecté, augmentation du terme énergétique auquel appartient la contrainte violée E total = E liés + E non_liés + E distances + E PHI

11 4. Prise en compte des contraintes RMN a. Termes énergétiques des contraintes de distances Potentiel carré ("square") Utilisation d'un intervalle de distances limites [d min -d max ] : si d min < d < d max si d < d min alors d 0 = d min ou d > d max alors d 0 = d max d min,d max = limites inférieures et supérieures de l'intervalle de distance de la contrainte imposée Potentiel carré adouci ("soft-square") Utilisé lorsque la distance risque d'être largement en-dehors de l'intervalle autorisé a, b = constantes déterminées automatiquement c = pente du potentiel asymptotique en général softexp = 1 

12 4. Prise en compte des contraintes RMN b. Termes énergétiques des contraintes angulaires Potentiel carré si intervalle angulaire respecté si intervalle angulaire non respecté

13 II. Les méthodes de modélisation moléculaire appliquées aux peptides et protéines B.

14 2 grandes familles : 1. Méthodes dites de "géométrie des distances" Objectif: déterminer rapidement un jeu de structures qui satisfassent les données expérimentales 2. Méthodes de dynamique sous contraintes Objectifs: optimiser les structures d'une façon plus efficace Les méthodes de modélisation appliquées aux peptides et protéines

15 1. Méthodes dites de "géométrie des distances" Méthodes de géométrie des distances = méthodes permettant de calculer les positions dans l'espace d'un ensemble de points à partir d'un jeu de distances mesurées entre ces points 2 types de méthodes : a.Méthode de la matrice métrique (utilisant les coordonnées cartésiennes) b.Méthode de la fonction cible (utilisant les angles dièdres)

16 1. Méthodes dites de "géométrie des distances" a. Méthode de la matrice métrique Problématique Si on connaît les coordonnées cartésiennes des atomes Trouver l'ensemble des distances = problème solvable Si on n'a qu'un jeu de distances données (souvent incomplet) Remonter aux coordonnées cartésiennes = problème non trivial Car pour N atomes:3N coordonnéeset N(N-1)/2 distances Ex. pour 10 atomes:30 coordonnéeset 45 distances  Pour décrire correctement la structure, il faudrait connaître les 45 distances algorithme mathématique (algorithme "d'embedding") permettant le passage d'un ensemble de distances à un objet tridimensionnel représenté en coordonnées cartésiennes 

17 1. Méthodes dites de "géométrie des distances" a. Méthode de la matrice métrique Principe Calcul des valeurs propres de la matrice de distances (matrice métrique) G ij = r i.r j où r i, r j : vecteurs position des atomes i et j Un ensemble de distances correspond à un objet tridimensionnel ssi la matrice métrique est de rang 3 = elle possède 3 valeurs propres non nulles Théorème fondamental

18 1. Méthodes dites de "géométrie des distances" a. Méthode de la matrice métrique Mise en oeuvre 1 ère étape: construction de la matrice de distances en pratique, on ne dispose pas de toutes les distances entre atomes  introduction des informations sur la géométrie covalente: - longueurs de liaison = distances entre atomes consécutifs - angles de valence = distances entre atomes séparés par 2 liaisons 2 ème étape: L'ensemble de ces informations est représenté sous forme de 2 matrices de valeurs possibles : - L ij : matrice de limites inférieures - U ij : matrice de limites supérieures pour les distances inconnues, on fixe: - une limite supérieure = 999 Å - une limite inférieure = somme des rayons de van der Waals (1.8 Å) introduction des distances H…H déduites des NOEs

19 1. Méthodes dites de "géométrie des distances" a. Méthode de la matrice métrique Mise en oeuvre 3 ème étape: ajustement des valeurs des matrices ("bond smoothing") application de principes géométriques (inégalités triangulaires) 4 ème étape: construction d'une 3 ème matrice par tirage aléatoire entre les bornes des intervalles définis par les 2 matrices précédentes Lij ≤ Dij ≤ Uij 5 ème étape: application de l'algorithme d'"embedding" pour construire la structure tridimensionnelle plus de 3 valeurs propres non nulles les 3 valeurs propres les plus élevées sont sélectionnées pour obtenir les coordonnées cartésiennes distances non exactes les structures obtenues ne ressemblent que de façon très lointaine à des structures de protéines (violations structurales)   

20 1. Méthodes dites de "géométrie des distances" a. Méthode de la matrice métrique Mise en oeuvre 6 ème étape: phase d'optimisation = minimisation d'une fonction cible E = O si Lij ≤ Dij ≤ Uij dans le cas contraire Remarque plusieurs tirages aléatoires effectués obtention d'une famille de structures tridimensionnelles ajout possible de termes supplémentaires - pour tenir compte des informations sur les angles PHI - pour fixer la chiralité des groupements chiraux 

21 1. Méthodes dites de "géométrie des distances" a. Méthode de la matrice métrique Exemples de programmes DISGEO (Havel, 1984) DSPACE (Nerdal, 1986) EMBED, VEMBED (Kuntz, 1989) DGEOM (Blaney, 1990) DGII (Havel, 1991) XPLOR/DG (Brünger, 1992)

22 1. Méthodes dites de "géométrie des distances" a. Méthode de la matrice métrique Avantage Inconvénients permet de calculer rapidement un grand nombre de structures qui satisfont aux données expérimentales violations observées = données précises (ex. longueurs de liaison) = données incertaines (contraintes issues de la RMN)   imperfections au niveau de la géométrie covalente inversion locale ou globale du repliement possible pour une partie des structures   analyse fine des structures   acquisition d'un plus grand nombre de données pour trancher entre les 2 familles 1 ère génération de logiciels (DSPACE, DGEOM) = biais dans le tirage aléatoire des distances   espace conformationnel mal exploré  2 ème génération de logiciels (DGII, XPLOR/DG) = meilleur échantillonnage de l'espace conformationnel

23 1. Méthodes dites de "géométrie des distances" b. Méthode de la fonction cible Principe Faire évoluer la structure 3D d'une molécule d'une conformation aléatoire vers une conformation satisfaisant l'ensemble des données RMN longueurs de liaison, angles de valence, angles plans peptidiques = fixes seuls degrés de liberté = angles dièdres ( , ,  1, …  n ) Mise en oeuvre 1 ère étape: tirage aléatoire d'un jeu d'angles dièdres ( , ,  1, …  n ) avec possibilité de restriction dans zones de structure secondaire connues (choix de couples ( ,  ) avec valeurs caractéristiques)

24 1. Méthodes dites de "géométrie des distances" b. Méthode de la fonction cible Mise en oeuvre D ij : matrice des distances L ij : matrice de limites inférieures U ij : matrice de limites supérieures R ij : matrice de la somme de van der Waals des atomes i et j où  (x) = 0 si x 0 2 ème étape: calcul d'une fonction cible : T tient compte - des contraintes issues de la RMN - des rayons de van der Waals 

25 1. Méthodes dites de "géométrie des distances" b. Méthode de la fonction cible Mise en oeuvre 3 ème étape: minimisation de la fonction cible structures respectant à la fois les données de RMN et les contraintes de vdw  = détermination des jeux d'angles dièdres pour avoir des valeurs minimales de T Lors de la minimisation, contraintes expérimentales introduites progressivement : 1.effets intrarésiduels 2.effets séquentiels 3.effets à longue distance   on construit d'abord les structures locales puis le repliement global Remarque ajout possible de termes supplémentaires pour tenir compte des informations sur les angles PHI plusieurs tirages aléatoires effectués obtention d'une famille de structures tridimensionnelles 

26 1. Méthodes dites de "géométrie des distances" b. Méthode de la fonction cible Exemples de programmes DISMAN (Braun, 1985) DIANA (Günter, 1991) Avantage Inconvénients permet de calculer rapidement un grand nombre de structures qui satisfont aux données expérimentales et dont la géométrie covalente est respectée méthodes efficaces si jeu de données = grand nombre de contraintes précises de courte distance sinon diminution du % de structures satisfaisantes (structures avec violations) utilisation d'une géométrie fixe   biais dans l'échantillonnage de l'espace conformationnel

27 1. Méthodes dites de "géométrie des distances" c. Comparaison des deux méthodes Avec un même jeu de données, résultats similaires   résultat remarquable car méthodes travaillant dans des directions opposées : Conclusion méthodes de matrice métrique = génèrent la structure globalement avec les contraintes prises simultanément caractéristiques générales des structures obtenues indépendantes des procédures de calcul méthodes de fonction cible = construisent la structure localement en intégrant progressivement les effets

28 1. Méthodes dites de "géométrie des distances" d. Exemple de structures issues du programme DIANA

29 2. Méthodes de dynamique moléculaire sous contraintes Principe Introduction de termes supplémentaires dans la fonction d'énergie potentielle du champ de forces pour prendre en compte les données expérimentales Apport de ces méthodes contrainte entre deux atomes = force qui les éloigne ou les rapproche pour que distance les séparant dans l'intervalle déterminé expérimentalement amélioration de la qualité de l'espace conformationnel défini par le champ de forces = meilleur description des interactions interatomiques (liaisons, angles, vdw, …)   amélioration de la distribution des angles dièdres amélioration de la qualité de l'exploration de l'espace conformationnel   rectification possible d'un mauvais repliement

30 2. Méthodes de dynamique moléculaire sous contraintes Mise en oeuvre application directe de ces techniques à la détermination de la structure de protéines = approche longue et coûteuse en temps de calcul  1. génération d'un premier jeu de structures par les méthodes de géométrie des distances  2. raffinement des structures par dynamique moléculaire méthodes se distinguant par - l'utilisation de différentes températures - le poids relatif géométrie covalente/contraintes expérimentales - la nature du champ de forces utilisé 3 types d'approches : a.dynamique moléculaire à basse t° b.dynamique moléculaire à haute t° c.recuit simulé 

31 2. Méthodes de dynamique moléculaire sous contraintes a. Dynamique moléculaire à basse t° premières dynamiques moléculaires : T = 300 K poids faible des contraintes expérimentales (/géométrie covalente)   dynamiques longues (50 à 100 ps)  espace conformationnel mal exploré  bonne prise en compte des fluctuations des atomes autour de leur position d'équilibre

32 2. Méthodes de dynamique moléculaire sous contraintes Protocole en 3 phases: 1. chauffage 2. équilibration à haute t° = recherche de la conformation la plus favorable 3. refroidissement lent   bons résultats si repliement des structures de départ correct ! b. Dynamique moléculaire à haute t° Augmentation de la température à T = 600 ou 1000 K = augmentation de Ecinétique des atomes  meilleure exploration de l'espace conformationnel  nécessité d'augmenter les constantes de force sur la structure covalente (liaison peptidique)

33 2. Méthodes de dynamique moléculaire sous contraintes c. Recuit simulé même principe que précédemment + fonctions des termes d'énergie simplifiées : - plus de terme électrostatique - terme de vdw simplifié (terme répulsif) : si r < r min dans le cas contraire = champ de forces ne décrit plus les forces s'exerçant sur les atomes mais maintient juste la géométrie covalente

34 2. Méthodes de dynamique moléculaire sous contraintes c. Recuit simulé Exemple de protocole: temps (ps)0 T(°K) Minimisation Exploration conformationnelle k rep = 0.01 kcal temps (ps) Chauffage 0 k NOE E(kcal) E(kcal) k rep Augmenta° vdw k rep -> 4 kcal RefroidissementMinimisation

35 2. Méthodes de dynamique moléculaire sous contraintes c. Recuit simulé exploration de l'espace conformationnel beaucoup plus poussée rectification possible d'inversions topologiques   = méthode générale pour le raffinement des structures (RMN ou RX)

36 d. Exemple de structures DIANA raffinées avec X-PLOR 2. Méthodes de dynamique moléculaire sous contraintes

37 III. Evaluation de la qualité des structures B.

38 1. Energie intramoléculaire L'énergie intramoléculaire (E TOT ) doit être la plus basse possible (négative, en principe) Vérifier que E bond, E angle et E torsion sont faibles = géométrie covalente correcte Exemple: Energies liées à la géométrie (kcal.mol -1 )struc. DIANAstruc. X-PLOR E liaison ± ± 0.6 E angles ± ± 4.8 E dièdres ± ± 3.2 Eimpropres 6.02 ± ± 0.2 E vdw 103 ± ± 5.3 (-92.3; ) E élec. 0.3 ± ± 0.3 Energies liées aux contraintes expérimentales (kcal.mol -1 ) E NOE 3841 ± ± 4.0 E PHI 25.9 ± ± 0.6

39 2. Respect des contraintes expérimentales Les structures doivent respecter au mieux les contraintes expérimentales Ne sont conservées que les structures présentant - des violations de distances inférieures à 0.5 Å (voire 0.2 Å) - des violations d'angles inférieures à 10° par rapport aux intervalles fixés

40 3. Diagramme de Ramachandran La distribution des couples (PHI, PSI) ne doit pas trop s'écarter des zones stériques permises en particulier pour les éléments de structure secondaire bien définis feuillet  hélice  d Conformations les plus observées Conformations permises

41 4. Convergence des structures Calcul de l'écart quadratique moyen (RMSD : Root Mean Square Deviation) de chaque structure par rapport à une structure moyenne Valeur globale de RMSD < 1 Å = bonne convergence des structures Valeurs faibles de RMSD = bonne structuration du squelette = orientation privilégiée des chaînes latérales Valeurs élevées de RMSD = régions flexibles ou mal définies

42 4. Convergence des structures Exemple :

43 5. Calculs en retour impossible d'obtenir tous les NOEs erreur sur l'intensité de ces NOEs à cause de - la diffusion de spin - mouvements de la protéine en solution)   programmes de recalcul du spectre NOESY à partir des distances interprotons mesurées sur la structure en tenant compte - de la diffusion de spin - d'approximations sur les mouvements de la protéine Exemples de programmes CORMA (Keepers, 1984) IRMA (Boelens, 1988) MARDIGRAS (Borgias, 1990) X-PLOR (Brünger, 1990)   comparaison cartes expérimentale/simulée  amélioration du jeu de données  nouvelle modélisation