PARTIE IV Affinement du modèle
1. Principales Etapes Question biologique Clonage, expression, purification Cristaux Données de diffraction Interprétation biologique Collecte et intégration des données Phasage des réflexions Affinement cristallographique Cristallisation Question biologique Analyse bioinformatique Macromolécules de grande pureté Structure atomique = MODELE Carte de densité électronique
1. Principales Etapes Phasage des réflexions avec l’une des méthodes décrites Calcul d’une première carte de densité électronique Construction d’un premier modèle dans cette carte de densité AFFINEMENT : dernière étape avant validation et publication du modèle PRE-REQUIS : modèle doit être correct
Structure dans le cristal 2. Rappels Densité électronique Facteurs de Structure diffraction (r) Fh Transformation de Fourier Espace réel Espace réciproque Structure dans le cristal Fobs expérience Données de diffraction Transformée de Fourier calcul Modèle x,y,z,fj Fcalc, calc
3. Objectifs L’affinement du modèle est un processus cyclique dont le BUT est l’optimisation du modèle issu de l’interprétation de cartes de densités électronique Objectif : le modèle construit doit refléter le mieux possible l’ensemble des données expérimentales Interprétation de la densité électronique Affinement de la structure (module et phase) MODELE FINAL Construction d'un modèle atomique
4. Principes Minimisation de l’écart entre: - le modèle (xyz) Fcalc - les données de diffraction Fobs Plus Fcalc est proche de Fobs Plus le modèle est proche de la structure réelle OR Fobs = constantes C’est Fcalc qui est modifié (x,y,z,B) modifiés
4. Principes L’affinement est un problème délicat : Nombre de données expérimentales mesurées est souvent faible par rapport au nombre de paramètres à optimiser (x, y, z, B) Ex FdhD: 1900 Atomes / Xtal Diffracte à 2.8Å 7600 paramètres à définir / 8950 Réflexions uniques Le nombre important de paramètres à affiner Le modèle initial peut être de qualité médiocre, importance de la phase La fonction à optimiser est complexe, non linéaire et peut comporter plusieurs minima séparés par des barrières énergétiques Trouver une pondération adéquat entre les données cristallographiques et non-cristallographiques
4. Principes Considérations générales Importance de la résolution dans les paramètres à affiner: 3.8 – 3.2Å : Coordonnées, Groupes de B, pas de solvant, importance de NCS et d’acalc si possible; Utilisation des angles de torsion pour diminuer N 3.2 – 2.7Å : Bon modèle, Construction-reconstructions importantes, Groupes de B 2.7 – 2.2Å : Construction du modèle facile, B individuel, quelques molécules de solvant 2.2 – 1.4Å : Construction automatique, B individuel, bcp de solvant <1.2Å : B anisotrope, Hydrogènes
Construction, d'un modèle atomique 4. Principes Fobs acalc, aobs Cartes de densité électronique « Nouvelles » valeurs des Fcalc et des phases Interprétation de la densité électronique Optimisation des paramètres Modèle x+Δx, y+Δy, z+Δz Construction, d'un modèle atomique (x,y,z) MODELE FINAL
5. Observations et paramètres Observations : tout ce qui est connu sur la cristal avant l’étape d’affinement Paramètres cristallins Modules des Fobs (nombre fixé) Stéréochimie des macromolécules Paramètres : à améliorer pendant le processus Positions atomiques (x,y,z) des atomes du modèle Paramètres de déplacements atomiques
5. Observations et paramètres Les paramètres de déplacements atomiques : Ils traduisent le désordre statique et dynamique Désordre dynamique Vibration d’un atome autour de sa position d’équilibre, l’amplitude de ce mouvement est une fonction de la température Facteur d’agitation thermique w = exp (-Bj(sin θ/λ)2) Désordre statique Un atome ou un groupe d’atomes n’occupent pas la même position dans chaque maille Facteur d’occupation qj
5. Observations et paramètres Rappels : Facteurs de diffusion atomique 53 fj en fonction de sin / à 0 K sin / = 0 fj = Z fj diminue lorsque sin / augmente iode carbone 8 6 résolution
5. Observations et paramètres Facteurs d’agitation thermique La taille du nuage électronique est indépendante de la température diffraction par un cristal indépendante de la température ? En fait, les atomes vibrent autour d’une position d’équilibre position des atomes différente dans les mailles du cristal « pseudo-taille » des atomes Plus la vibration thermale est grande, plus « la pseudo-taille » de l’atome est grande Conséquences L’intensité des rayons diffractés diminue lorsque augmente fj doit être multiplié par un facteur dépendant de la température
5. Observations et paramètres Facteurs d’agitation thermique - Les facteurs d’agitation thermique (B) traduisent la vibration d’un atome autour de sa position d’équilibre - L’amplitude du mouvement dépend de la température - Définition d’un facteur de diffusion atomique dépendant de la température : 8 Les valeurs élevées de B entraînent un affaiblissement rapide des intensités diffractées pour des valeurs croissantes de S B = 20 Å2 B = 99 Å2 B = 0 Å2 B = 0 Å2
5. Observations et paramètres Facteurs d’agitation thermique anisotrope Protéine isotrope Molécule organique Valeurs faibles (cœur hydrophobe) Valeurs élevées (boucles flexibles) Agitation anisotrope (différente dans les 3 directions de l ’espace) : ellipse d’agitation (50 % de probabilité) Agitation isotrope En général 5 Å2 < B < 50 Å2
5. Observations et paramètres Paramètres variables Les coordonnées (x,y,z) Les facteurs de température (B) désordre dynamique Les facteurs d’occupation (q) désordre statique Nécessité d'ajouter des informations supplémentaires Exemple : ArgRS – ARNt P212121 a = 210.2 Å b = 146.2 Å c = 86.1 Å (12 000 atomes, 170 kDa dans l’ua) Résolution Réflexions Obs/ paramètres 3.0 51 300 1.1 2.7 70 410 1.5 2.5 88 700 2.8 2.0 173 200 3.6 Safety factor
5. Observations et paramètres Le rapport observations/paramètres est amélioré par ajouts d’informations supplémentaires : Diminuer Npar : affinement avec contraintes - Contrainte de certains paramètres à des valeurs fixes - Utilisation d’angle de torsion au lieu de positions x, y et z Augmenter Nobs : affinement restreint - Permet à certains paramètres de varier autour d’un idéal: Géométrie - Longueur liaisons covalentes - Angles liaisons covalentes - Angles de torsion - Contacts Van der Waals Symétries non cristallographiques Corrélation entre atomes liés
5. Observations et paramètres Distance Angle de liaison Angle dihédral
6. Procédures d’affinement Comment ? Définir une fonction d’énergie et trouver le minimum de cette fonction minimum local 3 types d’algorithmes: - Moindres carrés Dynamique moléculaire Maximum de vraisemblance E DE minimum Espace conformationnel
6. Procédures d’affinement Méthode des moindres carrés Déterminer le minimum de la fonction Avec Fobs facteurs de structure observés = données de diffraction Fcalc facteurs de structure calculés = modèle K’ facteur d’échelle whkl poids affecté à chaque réflexion
6. Procédures d’affinement Méthode des moindres carrés Ces méthodes ne permettent d’atteindre qu’un minimum local Leur rayon de convergence est faible Col +150
6. Procédures d’affinement Méthode des moindres carrés Ces méthodes ne permettent d’atteindre qu’un minimum local Leur rayon de convergence est faible Col +150
6. Procédures d’affinement Méthode de dynamique moléculaire Le modèle est artificiellement chauffé à 3000°K puis refroidi progressivement à 300°K (attribution d’une vitesse initiale aléatoire à chaque atome) = technique du « recuit simulé » exploration d’une plus grande gamme de conformations Fonction d’énergie totale de la molécule CNS EPOT dépend de la géométrie de la molécule ETOT = EPOT + w Ecryst 2 ) F K' ( w E hkl calc l k, h, obs cryst - å =
6. Procédures d’affinement Méthode dynamique moléculaire Obtention d’un minimum « vrai » Le rayon de convergence est plus important Col +150
6. Procédures d’affinement Méthode dynamique moléculaire Obtention d’un minimum « vrai » Le rayon de convergence est plus important Col +150
6. Procédures d’affinement Maximum de vraisemblance Méthode utilisée dans REFMAC5 (CCP4), Phenix,… Des programmes plus récents construisent une fonction de vraisemblance avec les paramètres à affiner Les paramètres à définir sont décrits par des distributions de probabilités Le maximum de vraisemblance utilise le théorème de Bayes
6. Procédures d’affinement Théorème de Bayes p(A;B) = probabilité que A soit vrai si B est vrai = 50% = 0.1/0.2 = p(A,B)/p(A) De la même manière: p(B;A)=p(B,A)/p(B) Théorème de Bayes: p(A)=20% p(A,B) = 10% p(B)=25%
6. Procédures d’affinement Méthode du maximum de vraisemblance C’est une technique qui, sous l’hypothèse que les variables ont une distribution connue usuellement la distribution normale ou gaussienne permet d’estimer les paramètres d’un modèle d’une équation ou d’un système, linéaire ou non linéaire avec des restrictions sur ces paramètres ou non coefficients, matrice de variances et covariances Plus spécifiquement la technique consiste à construire une fonction appelée fonction de vraisemblance construite à partir de la fonction de distribution et à maximiser son logarithme par rapport aux paramètres inconnus
7. Stratégies Plusieurs cycles affinement par recuit simulé Calcul de nouvelles cartes (2Fobs-Fcalc) et (Fobs-Fcalc) Correction manuelle du modèle Addition du solvant (eau, ions, ligands)
7. Stratégies, TLS Affinement de type TLS (Translation/Libration/Screw) Permet d’ajouter des éléments de descriptions intermédiaire sans ajouter de nombreux paramètres Description de domaines rigides Nombre de domaines au choix de l’utilisateur 20 paramètres / domaine Peut être utilisé à partir de 2Å de résolution (>2Å dans le cas de NCS)
7. Stratégies, TLS http://skuld.bmsc.washington.edu/~tlsmd/
8. Suivie de l’affinement Les étapes de l’affinement sont suivies par le facteur d’accord R atomes au hasard R = 60 - 50 % modèle de départ R = 40 – 50 % affinement à 2.5 Å R = 20 % affinement à 1.5 Å R = 15 % affinement petite molécule R = 4 - 8 % composé minéral R = 1 – 2 %
8. Suivie de l’affinement Utilisation d’un facteur d’accord Rfree Même définition que le facteur R mais utilise environ 1000 réflexions (1-5%; dépend de la résolution) qui sont prisent au hasard* et qui ne sont JAMAIS utilisées lors de l’affinement Permet le bon suivie d’un affinement Rfree > R: 5-7% à basse résolution <1% à très haute résolution Règle +/- générale: Rfree ≈ (Résolution en Å)/10 *Sauf dans le cas de Twinning
8. Suivie de l’affinement Tableau synthétique après affinement: Collection de données R/Rfree RMSD Longueurs de liaison RMSD Angles de liaison
9. Pratique / Refmac5 Restrained refinement Unrestrained Rigid body Structure idealisation TLS & Restrained refinement A tester en fin d’affinement
9. Pratique / Refmac5 FreeR NCS
9. Pratique / Phenix <4.5Å de résolution 2 - 3Å en début d’affinement <4.5Å de résolution Refinement Target Weights: - Optimize Xray/Stereochemistry - A utiliser! A utiliser à des résolutions modérées: 2 - 3 Å 9. Pratique / Phenix
Un fichier pdb Numéro d’atome Numéro de résidu Résidue Type Chaine X Y Z Occ B ATOM 4217 N PRO B 265 24.846 -10.676 50.273 1.00 27.45 N ATOM 4218 CA PRO B 265 25.497 -11.345 51.398 1.00 29.70 C ATOM 4219 C PRO B 265 27.029 -11.331 51.363 1.00 30.61 C ATOM 4220 O PRO B 265 27.648 -10.957 50.353 1.00 31.31 O ATOM 4221 CB PRO B 265 24.970 -12.783 51.286 1.00 30.01 C ATOM 4222 CG PRO B 265 23.648 -12.613 50.698 1.00 30.57 C ATOM 4223 CD PRO B 265 23.905 -11.584 49.610 1.00 27.97 C ... ATOM 4225 N AGLU A 302 15.152 -18.914 10.502 0.50 26.16 N ATOM 4226 N BGLU A 302 12.994 -20.474 10.131 0.50 20.40 N ATOM 4227 CA AGLU A 302 13.786 -18.984 9.961 0.50 28.63 C ATOM 4228 CA BGLU A 302 14.025 -19.938 11.034 0.50 23.96 C ATOM 4233 CB AGLU A 302 12.738 -19.272 11.031 0.50 28.05 C ATOM 4234 CB BGLU A 302 13.943 -18.424 11.242 0.50 23.64 C ATOM 4235 CG AGLU A 302 12.865 -20.600 11.598 0.50 30.67 C ATOM 4236 CG BGLU A 302 14.204 -17.609 10.058 0.50 26.18 C ATOM 4237 CD AGLU A 302 14.041 -20.678 12.508 0.50 30.01 C ATOM 4238 CD BGLU A 302 13.205 -17.894 8.993 0.50 27.17 C ATOM 4239 OE1AGLU A 302 14.351 -19.670 13.194 0.50 29.80 O ATOM 4240 OE1BGLU A 302 12.000 -17.756 9.273 0.50 24.71 O ATOM 4241 OE2AGLU A 302 14.661 -21.746 12.513 0.50 32.25 O ATOM 4242 OE2BGLU A 302 13.645 -18.264 7.891 0.50 29.49 O ATOM 4229 C AGLU A 302 13.398 -17.758 9.186 0.50 28.71 C ATOM 4230 C BGLU A 302 14.003 -20.591 12.381 0.50 23.41 C ATOM 4231 O AGLU A 302 12.365 -17.149 9.487 0.50 28.75 O ATOM 4232 O BGLU A 302 13.996 -19.917 13.418 0.50 24.41 O
Bibliographie Intermédiaire Intermédiaire
Bibliographie facile facile méthodologique
Bibliographie Cristallisation des protéines - Crystallization of Biological macromolecules (1999). A. McPherson, CSHL Press - Crystallization of Nucleic acids and Proteins (1992). A. Ducruix, R. Giegé, The Practical approach series, IRL Press, Oxford University Press - Crystallization of Membrane proteins (1991). H. Michel, Boca Raton, CRC Press Cristallographie des protéines Facile - Crystallography made crystal clear (1993). G. Rhodes. Academic Press - Outline of crystallography for biologist (2002) D. Blow, Oxford University Press - Crystal structure analysis (1992). Glusker et Trueblood, Oxford University Press
Bibliographie Théorie - Protein crystallography (1976). T.L. Blundell, L.N. Johnson, Academic Press - X-ray structure determination (1989). G.H. Stout, L.H. Jensen, Wiley & Sons - Methods in Enzymology, volumes 276 et 277, Academic Press Intermédiaire - Macromolecular crystallography (1997). C.W. Carter, R.M. Sweet - Introduction to macromolecular crystallography (2003). A. McPherson Wiley-Liss - Principles of protein X-ray crystallography (1994). J. Drenth, Springer-Verlag Méthodologique - Practical protein crystallography (1997). C. Carter, R. Sweet. Academic Press