La cristallographie en biologie structurale

Slides:



Advertisements
Présentations similaires
Chaîne de Synthèse Réel Modélisation Rendu Image Fichier Scène
Advertisements

FILTRAGE ET DEMULTIPLEXAGE DANS LES CRISTAUX PHONONIQUES À DEUX DIMENSIONS   Y. Penneca,b, B. Djafari-Rouhanib, J.O. Vasseurb, A. Khelifc, P.A. Deymier.
REDUCTION DE DONNEES. - < h < + - < k < + - < l < + - Set unique - Set complet réduction de données.
FORMATION DE FAISCEAU.
AUTRES ASPECTS DU GPS Partie I : tolérance de Battement
______________________________________________________________________________________________________________________________________________________________________.
III) Comportement ondulatoire des corpuscules
Inférence statistique
1 Introduction 1 - Equations de Maxwell dans le vide 2 - Equations de propagation du champ électromagnétique dans le vide 2 - Equations de propagation.
Outils chimiques pour l’étude des biomolécules
Prospection par ondes de surface
2 Interaction Quanton-Matière
Principe de résolution des structures
Notions de base de l’optique ondulatoire
LES TRIANGLES 1. Définitions 2. Constructions 3. Propriétés.
Géométrie cristallographique
Le remplacement moléculaire
Interaction RX matière
La fonction de Patterson
Générations et détections des rayons X
INTERFERENCES Des interférences se produisent lorsque deux ou plusieurs mouvements vibratoires de mêmes fréquences et de différence de phase nulle ou de.
POLARISATION Onde mécanique sur une corde :.
Des atomes aux ions.
SERIE I : ELECTROSTATIQUE
DIFFRACTION DES RAYONS X
Merci et bon visionnage.
LE SON & L’ AUDITION Dr CHAKOURI M.
Cours 1 : La symétrie ... Symétries de position
L’expérience de Young Sur une plage de Tel Aviv, (Israël), on peut très bien voir le phénomène de diffraction.
Géométrie vectorielle
Application des algorithmes génétiques
Cours de physique générale I Ph 11
Régression linéaire simple
La stoechiométrie : calculs chimiques
Tolérances géométriques
Introduction à la Théorie géométrique de la diffraction
Vers la dimension 3. La géométrie dans l'espace ne fait qu'étendre les concepts qui vous sont familiers en dimension 2 à la dimension 3. Le plus difficile.
1.Un rang de données multicolores 2. Deux permutations des n premiers entiers 3. b permutations des k premiers entiers 4. Choix de n points dans [0,1]
INTERACTION DES RAYONNEMENTS AVEC LA MATIERE
Partie 3 Architecture atomique Plan Des Matériaux
Bioinformatique et Biologie Structurale I/ – Principes et techniques A/ Linformation structurale B/ Les différentes techniques de détermination de structure.
Le microscope à effet tunnel (STM) Appliqué aux métaux
Chapitre 3 : lois de la réflexion et de la réfraction
Représentation des systèmes dynamiques dans l’espace d’état
Le magnétisme atomique
Distribution de charge dans GaAs
Les réseaux.
Les fentes multiples Méthode semi graphique d’addition d’ondes. La méthode trigonométrique n’est pas commode dans le cas de 3 sources ou plus, ou si les.
Chapitre 2 Les ondes mécaniques
Chapitre 7: L’optique physique II
Présentation de la méthode des Eléments Finis
Les méthodes de phasage
PARTIE IV Affinement du modèle.
Pr ZEGOUR DJAMEL EDDINE Ecole Supérieure d’Informatique (ESI)
Chapitre 2 : La lumière.
L'atome quantique préambule.
CHAPITRE I LE MODELE QUANTIQUE DE L'ATOME.
Notions de base de l’optique ondulatoire
Structures de données avancées : LH (Hachage linéaire) D. E ZEGOUR Institut National d ’Informatique.
Couche limite atmosphérique
Calorimètres électromagnétiques et hadroniques
PREVISION DE LA GEOMETRIE DES MOLECULES
La recherche de vertex dans CMS : le recuit déterministe Nicolas Estre – IPN Lyon – Journées Jeunes Chercheurs 2003.
Polarisation des ondes électromagnétiques
III. Dualité onde corpuscule
CHAPITRE III LE MODELE QUANTIQUE DE L'ATOME.
Acoustique musicale.
Notions de base de l’optique ondulatoire
1 1Justesse des longueurs d’onde PARTIE 3a : Applications en UV Pour vérifier que l’appareil mesure les bonnes longueurs d’onde, on utilise idéalement.
Processus ponctuels Caractéristiques et Modèles de répartitions spatiales.
Transcription de la présentation:

La cristallographie en biologie structurale R. Fourme Univ. Paris-Sud et SOLEIL roger.fourme@synchrotron-soleil.fr tel. 0608258675

1

Cristallisation Méthode de cristallisation dite de la goutte pendante Goutte de solution saturée de protéine Réservoir de solution avec proportion accrue de précipitant Méthode de cristallisation dite de la goutte pendante

Des cristaux aux propriétés très remarquables Des cristaux biphasiques mi-solides, mi-liquides (de 30 à 80% de liquide). L’arrangement du cristal est du à l’empilement des molécules, les parties vides étant comblées par la solution. Assez rigides pour présenter un ordre à très grande distance. La perfection de l’arrangement est attestée par la grande finesse des profils de diffraction, qui peut parfois atteindre quelques millièmes de degré. Assez plastiques pour supporter des réarrangements importants (déshydratation, amélioration de la qualité cristalline par recuit thermique, compression > 10% sous haute pression….) Peuvent être trempés à basse température (éventuellement en ajoutant de l’antigel à la solution ) mais ne supportent pas un refroidissement lent au-dessous de 0° (la glace doit rester amorphe, et non cristalliser).

Montage d’un cristal dans une mini-boucle de nylon Montage d’un cristal dans une mini-boucle de nylon. Cet échantillon est trempé dans de l’azote liquide puis conservé dans un jet de gaz froid pendant l’enregistrement des données pour diminuer les dommages secondaires sous irradiation X.

Les cristaux biologiques supportent bien une compression hydrostatique. La cristallographie sous haute pression (HPMX) est une méthode mature. Les enregistrements sont effectués sur les lignes de lumière CRISTAL (SOLEIL), ID27 et ID09 (ESRF). Coupe d‘une cellule haute-pression à diamants de grande ouverture, avec génération de force pneumatique. Dimensions du cylindre : 59 mm x 30 mm

1 2 3 Cristal frais de la protéine urate oxydase comprimé dans la cellule à diamants. Diamètre de la cavité dans le joint 350 mm Cristal de la protéine lysozyme après irradiations successives et translations. 3 Fragment de diamant utilisé pour combattre l’orientation préférentielle du cristal par rapport aux culots des diamants La gamme utile de pression est limitée par la pression de dénaturation de la macromolécule, 0,1-2 GPa (1000 à 20000 atmosphères).

C'est le problème des phases ! 2 La diffraction X 2 I ~ F cristal hkl hkl diffraction = T.F. RX équivalence reconstruction = T.F. -1 z Le calcul par TF-1 de la densité électronique en chaque point (x,y,z) donne une « image » du cristal. y x 1 (x,y,z) =  F e -2i(hx+ky+lz) V h k l hkl Coefficients = facteurs de structure = nombres complexes. (modules |F| connus à partir des intensités, mais les phases  restent inconnues) i |F| |F|  I  r hkl hkl C'est le problème des phases !

Fhkl =  fi e2i(hxi+kyi+lzi) 3 F = facteur de structure (nb. complexe) = contribution des atomes à la diffraction n n atomes en {xi, yi, zi} : Fhkl =  fi e2i(hxi+kyi+lzi) 1 Facteur de diffusion du ième atome La densité r est calculable si la position des atomes est connue (donc si … le problème est résolu) Un facteur de structure Fhkl est la somme des contributions de tous les atomes |F| f Tous les atomes interviennent pour établir la densité électronique en chaque point de l'espace et vice-versa. Technique globale

Variation du facteur de diffusion atomique f de quelques atomes avec l’angle de Bragg (unité: nombre d’électrons). f est la TF de la densité électronique de l’atome à symétrie sphérique. Pour un angle de Bragg nul, f = Z. f diminue rapidement aux grands angles, car l’extension du diffuseur (cortège électronique) n’est pas négligeable devant la longueur d’onde du rayonnement comme dans le cas des neutrons. Cette diminution est encore plus rapide si la densité est étalée par du désordre statique ou dynamique.

f = fo e-Bsin q fo = facteur de diffusion q (°) d (Å) basse moyenne 17 2 facteur d'atténuation dû à l’agitation thermique (et au désordre). f = fo e-Bsin q l2 fo = facteur de diffusion B = facteur d'agitation thermique (unité : Å2) (ou facteur de Debye-Waller) 1 Atome "ponctuel" ( à 0 K), B =0 Atome très peu agité (B~5Å2) Atome peu agité (B~10Å2) Atome assez agité (B>15Å2) 10 20 30 q (°) d (Å) 5,7 Å 2,8 Å 1,5 Å 1 Å Équivalence entre angle de Bragg et résolution pour l = 1 Å. basse moyenne haute (rare pour les macromolécules) U diffracte 8500 fois plus que H f ~ Z I ~ Z2

Paires de Friedel et réflexions équivalentes par symétrie 11 Paires de Friedel et réflexions équivalentes par symétrie Pour la diffusion « normale », les deux membres d’une paire de Friedel ont la même intensité I(hkl) = I(-h –k -l), les intensités des réflexions équivalentes par symétrie sont également identiques. Ex: pour une maille orthorhombique I(hkl) = I(-h k l) = I(h –k l) = I(h k –l) = I(-h -k l)… i Fh,k,l Ah,k,l fh,k,l = -f-h,-k,-l |Fh,k,l| = |F-h,-k,-l| Bh,k,l fh,k,l r B-h,-k,-l F-h,-k,-l

Notion de résolution Relation de Bragg: 2d sin q = l Les réflexions de Bragg aux « grands angles » (de Bragg), donc associées à des distances interréticulaires d petites, véhiculent l’information à haute résolution. Ces réflexions sont de faible intensité compte tenu du déclin des facteurs de diffusion aux grands angles, aggravé par de gros (10-60 Å2) facteurs de Debye-Waller. En cristallographie des macromolécules, la valeur moyenne des intensités est faible (la diffusion se partage entre un très grand nombre de réflexions) et le désordre statique et dynamique est important. L’art du cristallographe est d’améliorer le signal sur bruit: détecteur sans bruit propre, taches de Bragg petites (faisceau X parallèle et monochromatique, bon cristal), combattre la dégradation du cristal. Le RS est essentiel. On appelle résolution utile du diagramme de diffraction la valeur minimale dmin de d pour laquelle le signal de diffraction est supérieur au bruit. dmin correspond sensiblement à la distance minimale pour laquelle deux points de la structure sont vus séparément. La résolution «atomique» (rare) est obtenue pour dmin < 1,3 Å. La meilleure résolution jamais atteinte est autour de 0,5 Å.

Application et visualisation des densités électroniques 24 Application et visualisation des densités électroniques (x,y,z) =  |F | e 1 -2i(hx+ky+lz)+fhkl V h k l hkl En 2D : x z=n+1 etc... z=n y

Structure de la pénicilline (sel de K+) 25 En 3D : Structure de la pénicilline (sel de K+) x z y Dorothy Hodgkin-Crawfoot, 1949

Autre présentation en 3D ("TURBO", "O"…) 26 Autre présentation en 3D ("TURBO", "O"…)

FONCTION de PATTERSON (x,y,z) =  |F| e Ihkl ~ |F|hkl 20 FONCTION de PATTERSON Phase inconnue Fourier : (x,y,z) =  |F| e 1 -2i(hx+ky+lz) +fhkl V h k l hkl Modules connus à partir des intensités Noté : {|F|,f} 2 Ihkl ~ |F|hkl Ihkl = Fhkl F*hkl i=n j=n Ihkl =  fi e2i(hxi+kyi+lzi)  fj e-2i(hxj+kyj+lzj) i=1 j=1 Ihkl =   fi fje2i [ h(xi -xj ) + k(yi -yj) +l(zi - zj) ] i j Vecteur différence entre les deux atomes i et j facteurs de diffusion de la paire i-j Le facteur de structure F est la somme des contributions des positions atomiques L'intensité I (ou F2) est la somme des contributions des différences des positions atomiques (vecteurs différences) pondérées par le produit des facteurs de diffusion de la paire i-j.

FONCTION de PATTERSON P(u,v,w) =  |F|2 e Si r(x,y,z), calculée avec F, dépend de la position des atomes, la même fonction, calculée avec F2 dépendra des différences entre atomes. On l'appelle P(u,v,w) Si r(x,y,z) dépend d'une origine qui doit être connue ( vecteurs 0 -> atomes), P(u,v,w) ne dépend plus que des vecteurs-différence {u,v,w}, donc pas de l'origine. Ce Fourier (noté {|F|2,0} ) est appelé Patterson P(u,v,w) =  |F|2 e -2i(hu+kv+lw) hkl h k l 1 V P(u,v,w) calculable en tout point à partir de l’expérience. P(u,v,w) a la même périodicité que r(x,y,z) 21 Autres propriétés : Analogue à une densité mais les pics correspondent à des vecteurs-différences entre atomes. (n atomes n(n+1) pics Intensité des pics ~ SZ2. Beaucoup plus compliquée ! Symétrie initiale : les différences entre positions symétriques entraîneront des positions spéciales : sections de Harker. Symétrie du Patterson = celle du groupe de Laue (P2/m pour monoclinique, etc..). Donc centro-symétrique. Pic à l'origine = somme des distances entre atomes identiques (coord. zéro). Élargissement des pics  recouvrements importants.

Autres types de Patterson's 28 Autres types de Patterson's P(u,v,w) =  coef 2 e 1 -2i(hu+kv+lw) V h k l hkl Patterson différence Coef2 =(|Fo|-|Fc|)2 Pour les protéines : Coef2 =(|Fderivé|-|Fnative|)2 Patterson ponctualisé Coef2 =F2point Fpoint = facteur de structure ponctualisé Fpoint=Fréel. <Z> F0 e - Bsinq2/l2 Suppression du pic à l'origine si coef2= (F2point -Sfi2 ) Patterson anomal Coef2 = DF±2

Des détecteurs à localisation de surface haut de gamme

Détecteur MARResearch à plaque photosensible («imaging plate») Détecteur MARResearch à plaque photosensible («imaging plate»). Diamètre utile 345 mm. La lecture est faite par mesure de la luminescence excitée par laser, avec un balayage en spirale assurant un temps de mesure constant par point. (principe: le faisceau laser se déplace radialement à vitesse constante; la vitesse angulaire de la plaque varie continûment avec w = k/r. La plaque tourne donc de plus en plus vite à mesure que le faisceau laser se rapproche du centre). Temps de lecture: environ 60 sec (pour le diamètre maximal et des pixels de 140 mm). Pixels de 100 mm possibles.

Détecteur ADSC avec matrice de 9 grands CCD Détecteur ADSC avec matrice de 9 grands CCD. Surface active : carré de 315 mm de côté. Conversion photons X-visible par phosphore. Chaque CCD est couplé à l’écran par fibres optiques assurant une démagnification de l’image. Temps de lecture de l’ordre de la seconde. Utilisé sur la ligne de lumière PROXIMA I de SOLEIL

Détecteur MARResearch à conversion directe photons X-électrons dans une couche mince de sélénium. Dimensions 420 x 320mm. Les charges sont détectées sur une surface pixelisée. Temps de lecture de l’ordre de la seconde. Efficacité de détection correcte dans un domaine de longueurs d’onde étendu, notamment à courte longueur d’onde.

Pilatus 6M de DECTRIS. Compteur de photons X à pixels hybrides.

Number of modules 5 x 12 = 60 Sensor Reverse-biased silicon diode array Sensor thickness 320 µm Pixel size 172 x 172 µm2 Format 2463 x 2527 = 6,224,001 pixels Area 431 x 448 mm2 Intermodule gap x: 7 pixels, y: 17 pixels, 8.4% of total area Dynamic range 20 bits (1:1,048,576) Count rate per pixel > 2 x 106 photons/s Energy range 3 – 30 keV Calculated DQE 3 keV: 80%; 8 keV: 99%; 15 keV: 55% Energy resolution 500 eV Adjust. threshold range 2 – 20 keV Threshold dispersion 50 eV Readout time 3.6 ms Framing rate 12 Hz Point-spread function 1 pixel Data formats Raw data, TIF, EDF, CBF External trigger/gate 5V TTL, 3 different modes Software interface Through socket connection; clients for EPICS, SPEC and stand-alone operation are available Cooling Close-circuit cooling unit for temperature stabilization Power consumption 350 W Dimensions (WHD) Approx. 600 x 600 x 550 mm Weight Approx. 95 kg Caractéristiques du Pilatus 6M

Image obtenue avec le détecteur à CCD. La gradation des couleurs (+ chaud = + intense) image la gradation des intensités.

De l’intensité Ihkl au module du facteur de structure Fhkl 34 I - Polarisation - Correction de Lorentz - Dépendance angulaire 2 Io I Intensité |F| = c L p Facteur d’échelle Polarisation Facteur de Lorentz I Io Polarisation P   1+cos22 p = 2

Ihkl = Correction de Lorentz L S1 >> S2 S<Ii>hkl 35 Correction de Lorentz L Une sphère d’Ewald non-idéale a une certaine « épaisseur  » Les réflexions ne traversent pas toutes la sphère d’Ewald à la même vitesse Pour deux « équivalentes » : Sens de rotation  tangente directe I2  S2 I1  S1 I ~ aire S S1 >> S2 Géométrie de rotation : correction L ~ 1/sin pour que S1 = S2 I = n S<Ii>hkl Moyenne : Ihkl = I = 1 n (Si n équivalentes pour Ihkl)

Iabs=  fio e-2B(sin )/ 36 Facteur d’échelle c Comparaison de jeux de données Fhkl de : Cristaux différents Enregistrements à différentes  Pour une maille qui contient n atomes, l’intensité totale théorique (absolue) est : Iabs=  fi2 I = n (f = facteur de diffusion de l’atome) I = 1 Iabs=  fio e-2B(sin )/ I = n 2 2 2 Approximation : B ~ le même pour tous I = 1 2 2 I = n Iabs= e-2B(sin )/ .  fio 2 I = 1 2 I = n I réel = c I abs Iréel= c e-2B(sin )/  fio 2 2 I = 1 Iréel Iréel 2 2 c e-2B(sin )/ 2 2 ln ( ) = ln c -2B(sin )/ = I = n  fio 2 I = n  fio 2 I = 1 I = 1 = équation d’une droite (droite de Wilson)

Iréel  fio Facteur d’échelle c Droite de Wilson 37 Facteur d’échelle c Droite de Wilson Iréel : moyennes des Ihkl par tranche de résolution ln c Pente = -2B ln ( ) I = 1 I = n Iréel 2  fio 2 2 (sin )/ c = facteur d’échelle global B = facteur d’agitation thermique global

Importance des phases dans le calcul de la densité 4 Importance des phases dans le calcul de la densité Analogie en lumière visible (conte du canard et du chat) Réalisation d’une expérience de diffraction optique : Masque = « cristal fictif » « molécule » « cristal » masque Laser fentes écran Interférences

Importance des phases dans le calcul de la densité 5 Importance des phases dans le calcul de la densité FT-1 FT ..Un canard basse résolution FT-1 Un canard... 100 50 Sa transformée de Fourier.. Un chat .. FT Échelle d’intensités FT-1 Sa transformée de Fourier..

Variantes autour des données de diffraction Si on « coupe » en résolution : On voit un canard flou (mal résolu) Si on n’utilise que la haute résolution : on voit seulement les bords du canard

?? ?? Importance des phases dans le calcul de la densité 6 Importance des phases dans le calcul de la densité calculer un canardchat ou un chatcanard ? FT-1 Phases ?? Amplitudes Cartes composites FT-1 Phases ??  Les termes les plus important dans la transformée de Fourier sont les phases (inconnues) et non les amplitudes (connues) ! Kevin Cowtan's book of Fourier : http://www.ysbl.york.ac.uk/~cowtan/fourier/fourier.html

Si on omet une région (secteur) des données, la reconstruction perpendiculaire sera déformée : Si on supprime des petites (10 %) zones aléatoirement distribuées : on retrouve une image « correcte » mais avec du bruit

Résolution de la structure cristalline : Approches expérimentales

à la carte de densité électronique De la diffraction à la carte de densité électronique Données de diffraction Carte de densité électronique

Résolution de la structure : détermination de la phase

Remplacement moléculaire Structure 3D connue maille Il faut placer au mieux la modèle dans la maille. La connaissance d’un fragment de la structure peut suffire à amorcer le phasage. Programme AMORE de J. Navaza

Principe du phasage de novo Chaque facteur de structure Fhkl est une somme d’ondes planes. En traduction vectorielle, c’est un nombre complexe somme de nombres complexes. On détermine successivement la phase de chacun des Fhkl. On travaille donc réflexion par réflexion. Supposons que la structure totale puisse se décomposer en deux sous-ensembles: - La structure principale, complexe et inconnue, constituée d’atomes de Z petits (C, N, O, H…) ou moyens (S) - Une structure relativement simple (dite structure de référence) constituée d’atomes qui diffusent d’une manière remarquable : - soit des atomes lourds (à Z élevé) - soit des atomes lourds ou mi-lourds en situation de diffusion anomale La contribution de la diffusion de la structure de référence à chaque Fhkl est calculable (module et phase) car la position de tous ses atomes est connue (la structure a été «résolue» au préalable). Cette onde peut donc être utilisée comme onde de référence. L’expérience ne permet de mesurer que les amplitudes des ondes. Il faut donc transformer l’information sur les amplitudes en information sur les phases. Il faut en général faire trois mesures d’intensités pour déterminer une phase sans ambiguïté. On fait en effet une triangulation. Problèmes à résoudre dans l’ordre: - Fabriquer la structure de référence - Déterminer les coordonnées de ses atomes Déterminer la phase de la structure complexe en s’appuyant sur la (ou les) structure(s) de référence.

Comment résoudre en principe les phases Interférence constructive 39 Comment résoudre en principe les phases de novo Principe : utiliser comme pivot une structure de référence qui émet un contribution calculable à chaque facteur de structure L'onde de référence vient d'un ou plusieurs atomes diffusant de manière remarquable (atome lourd ou diffuseur anomal) placés à des positions connues dans le cristal. I protéine Hg Interférence constructive I Interférence destructive Ainsi, une information (inconnue) de phase a été transférée en amplitude (donc mesurable)

Remplacement isomorphe dérivée native Diffusion anomale à différentes longueurs d’onde λ1 λ2

Méthode MIR La méthode MIR pure et dure exige trois mesures de l’intensité du facteur de structure Fhkl Une mesure venant du cristal natif Une mesure venant d’un cristal dérivé I Une mesure venant d’un cristal dérivé II Avec deux mesures seulement, il y a 2 solutions pour la phase de la structure principale L’ambiguïté est levée par la 3ème mesure Avantages A ouvert la cristallographie des protéines (Max Perutz, Hb) Forts signaux, applicable à de très grosses structures. Difficultés: Fabriquer plusieurs dérivés Les mesures ne sont pas effectuées sur le même cristal  Perte de temps et cause d’erreurs. Et surtout, les structures dérivées doivent être strictement identiques à la structure native (aux atomes lourds près). Ceci n’est que rarement réalisé  Phases imprécises. La structure principale et les sous-structures ne sont pas complètement séparables (c’est à dire Fh1, Fh2… tirés des mesures sont approximatifs) ne structure de référence qui émet un contribution calculable à chaque facteur de structure

La référence des phases 41 La référence des phases Atome lourd : (Xh,Yh,Zh) Phases fh Fh(hkl) = fh e 2i(hXh + kYh + l Zh) fh condition d'isomorphisme : Fph = Fp + Fh Fph Fp  L'atome lourd ne doit pas perturber le réseau cristallin Fh |Fh| connu (approximativment) à partir de la variation Iph- Ip

fabrication de dérivés d’atomes lourds Remplacement isomorphe fabrication de dérivés d’atomes lourds Protéine + liqueur-mère + sel d’atome lourd Pt, Hg, U, Sm, Yb, Pb, Au,… sous forme de sel Par trempage de cristaux natifs Par co-cristallisation Acétate d'uranyle UO22+ 92 Fluoro-uranate de potassium UO2F53- 92 Sodium hexachloroplatinate Pt(Cl)62- 78 Chlorure de mercure Hg2+ 80 Triméthyl acétate de plomb Pb(CH3) 3+ 82 Chlorure de plomb Pb2+ 82 Xénon Xe 54

Quartz capillary crystal Xenon input 1- 60 bar M. Schiltz et al. (1994) J. Appl. Cryst. 27, 950

First structure solved using xenon binding under pressure 2 Xe sites with 100% occupancy LURE W32 beamline Ligand binding domain of the human nuclear receptor RXR W. Bourguet, M. Ruff, P. Chambon, H. Gronemeyer & D. Moras (1995), Nature 375, 377

42 Pour une sous-structure simple, calculer la Patterson-différence {||Fph|-|Fp||2,0} pour localiser les atomes lourds Site secondaire Site principal

fp Comment déterminer les phases de la protéine ? 44 Comment déterminer les phases de la protéine ? = construction de Harker Pour chaque hkl : Fh = facteur de structure d'un atome lourd-1 Fh Fh = facteur de structure d'un atome lourd-2 |Fph|1 = module du dérivé 1 |Fp| = module de la native |Fph|2 = module du dérivé 2 |Fph| 2 imaginaire A Plan complexe o” fp Fh o' A” |Fp| o réel |Fph| 1 A' Deux dérivés Une seule phase ! Un seul dérivé = 2 phases valident la relation: Fph = Fp + Fh

Autres "densités » utiles pour améliorer la structure. 27 Autres "densités » utiles pour améliorer la structure. Fo - Fc Visualisation des densités résiduelles Recherche des atomes d’hydrogène Mise en évidence des défauts Valable si fcalc @ fréel -2i(hx+ky+lz)+fcalchkl D(x,y,z)=  ||Fcalc|-|Fobs|| e 1 V h k l hkl 2Fo - Fc avec phases : fcalchkl - Pour amélioration des détails « Omit" maps On "enlève" la contribution d'une partie douteuse de la molécule dans le calcul des Fcalc. Une carte (Fo-Fc) ne montrera que la partie soustraite, sans biais du modèle initial.

Organigramme / Étapes : 53 Organigramme / Étapes : MOSFLM, DENZO SCALEIT, TRUNCATE... (h, k, l, F)p (h, k, l, F)h1 (h, k, l, F)h2 ... Mise à l’échelle SCALA Patterson différence {DF2, 0} FFT VECSUM, RSPS, PEAKMAX Localisation atome(s) lourds principaux {|Fh|, jh} MLPHARE, FHLE Affinement xi, yi,zi, Bi, occupi Fourier-différence {DF, jh} FFT Pics résiduels ? (Détection des sites minoritaires) Oui, (sites secondaires) inclusion dans la sous-structure S(x,y,z,B,Occup) SHARP, MLPHARE non i Choix d ’une origine commune (Fouriers croisés {DFi, jj} ) FFT Sous-structure d ’atomes lourds déterminée, donc Fh

(suite..) Organigramme / Étapes : 54 (suite..) Organigramme / Étapes : Sous-structure d’atomes lourds Calcul des Fh |F|obs Construction de Harker Détermination des phases probables SHARP, PHASE, MLPHARE, …. fdépart Calcul de Fourier (carte de densité) FFT Modification de densité (aplatissement de solvant ..) DM, SOLOMON fbest Fourier inverse, calcul des Fbest Fourier final, construction du modèle FFT, O, TURBO-FRODO

Amélioration des phases : Modification de densité 55 Amélioration des phases : Modification de densité Une "bonne" carte de densité doit avoir une région de solvant « plate » Rarement le cas car les phases fexp sont imprécises On impose donc une densité = 0 dans la région du solvant Méthode : 1) On calcule un masque M(x,y,z) pour lequel : Densité = 0 dans la zone solvant Densité = 1 dans la zone protéine 2) On modifie la densité expérimentale selon : rcorr(x,y,z) = rinitiale(x, y, z) x M(x, y, z) 3) On inverse (FT-1) pour obtenir les Fcorr(hkl) 4) On recalcule une carte avec |F|obs et fcorr

Amélioration des phases : Modification de densité 56 Amélioration des phases : Modification de densité Carte initiale : Résultat : En principe : meilleure carte, mais attention à bien définir la "frontière" protéine/solvant Tiré de : http://www.ccp4.ac.uk/talks

Méthodes de phasage de novo utilisant la diffusion anomale

... mais la décroissance régulière de f et m subit des 18 Dépendance de f selon l f (et m ) ~ l3 Pouvoir de diffusion et d’absorption d’un atome ... mais la décroissance régulière de f et m subit des variations brutales au passage d’un seuil d’absorption (cm-1) 

58 Si  est proche d’une transition électronique, le facteur de diffusion f de l’atome concerné est modifié et devient un nombre complexe, ce qui traduit des changements de l’amplitude et de la phase de l’onde diffusée. Ces changements sont dépendants de … f f = f° + f’ + if”   partie constante (indép. de ) corrections réelle et imaginaire Ex: variation de f’ et f ’’ pour Se au voisinage de son seuil d’absorption K

Conséquence sur les facteurs de structure : 61 Conséquence sur les facteurs de structure : La loi de Friedel ... ..n'est plus exacte : f ’ Fa f ” (+p/2) protéine Fa f ” f ’ at. lourd F total hkl   hkl hkl  F hkl hkl f ” sans diffuseur anomal : avec diffuseur anomal : |F| = |F| |F| ≠ |F| hkl hkl hkl hkl  ≠ hkl hkl hkl hkl ∆f±hkl=|F()|hkl - |F()|hkl F- F+ Dfhkl= différences anomale

Une sous-structure constituée de diffuseurs anomaux permet donc d’obtenir l’équivalent de dérivés lourds. Mais tout se passe à l‘intérieur du même cristal. La structure ne change pas, c’est l’onde diffusée qui est modulée par changement de la longueur d’onde. L’isomorphisme est parfait et un cristal est suffisant (s’il résiste au rayonnement X). Mesurer l’amplitude de Fhkl à 3 longueurs d’onde permet la détermination non ambiguë de la phase pour la structure principale. En fait, deux mesures suffisent à cause de la violation de la loi de Friedel (paire de Fridel) et de la séparation des réflexions équivalentes en deux classes (paires de Bijvoët). Dans la méthode MAD, on sépare sans approximation la sous-structure de la structure principale. En effet on obtient une liste des coefficients Fh qui permet de résoudre la sous-structure par méthode directe de phasage. Cette sous-structure peut posséder jusqu’à une bonne centaine d’atomes, la complexité d’une « petite » molécule.

Les termes dépendant & indépendant de la long. 62 Conclusion : Le problème des phase a une solution analytique ! Les termes dépendant & indépendant de la long. d’onde peuvent être séparés (Karle, Hendrickson): sous forme d'une fonction : GT() = FT(h) + DA() ( h : vecteur hkl ) T pour Total bleu = dépendant A pour Anomal noir = indépendant |GT(±h,)|2 = |FT (h)|2 + a() |FA(h)| 2 + b() |FT (h)| |FA(h)| cos (T-A) ± c() |FT(h)| |FA(h)| sin (T-A) |GT(±h,)|2 = p1+ a()p2 + b()p3 + c()p4

|GT(±h,)|2 = p1+ a() p2+ b() p3 + c() p4 63 |GT(±h,)|2 = p1+ a() p2+ b() p3 + c() p4 avec : p1 = |FT (h)|2 p2 = |FA (h)|2 inconnus p3 = |FT (h)| |FA (h)| cos (T-A) p4 = |FT (h)| |FA (h)| sin (T-A) (Contrainte additionnelle : p1 p2 = p32 + p42 ) Et aussi : f’2()+ f”2() a() = f°2 déterminés à 3 long. d'onde différentes f’() b() = 2 f° f”() c() = 2 (f' et f" connus) f° Ceci est un jeu de 4 équations linéaires à 4 inconnues avec une contrainte. p1…p4 peuvent être calculés, puis |FT| , |FA| et finalement .

seuils K (5e-) seuils LIII (10 -32 e-) seuils M ( 80 -100 e-) 60 Atomes possédant un signal anomal utilisable Domaine pratique des longueurs d'onde en diffraction X CuK MoK 0.5 0.707 1.5418 1.8 (Å) diffraction faible trop d’absorption seuils K (5e-) Fe Co Ni Cu Zn Ga Ge As Se Br Kr Rb Sr (1,7433 Å) (1,2837 Å) (0,9795 Å) (0,7699 Å) seuils LIII (10 -32 e-) Lanthanides Pt Hg U Sm Tb Ho Sm ... Lu (1.0093) (0.7223) (1.8460)..(1.3412) (1.0722) seuils M ( 80 -100 e-) limité à: U ( = 2,2-3,4 Å)

En résumé MIR MAD - metallo-enzymes - les atomes lourds 64 En résumé MIR MAD Deux ou trois enregistrements à des longueurs d’onde différentes Un seul cristal incluant un diffuseur anomal Trois enregistrements à longueur d’onde fixe 3 cristaux différents - les atomes lourds doivent être …“lourds” Ex : Pt, Hg, U - metallo-enzymes (Fe, Mn, Cu, Zn..) - protéines modifiées Se-Met, Se-Cys sources de RX: labos ou RS source de RX: accordable (RS) et très stable.

Autres méthodes de phasage (mixtes) 65 Autres méthodes de phasage (mixtes) SIR = Single Isomorphous Replacement 1 seul dérivé lourd (+ native). On accepte l'ambiguité de phase en prenant la valeur centroïde --> erreur importante SIRAS = SIR + Anomalous Scattering 1 dérivé lourd (+ signal anomal) + native. L'ambiguité de phase est levée par le terme anomal. SAD = Single Anomalous Diffraction 1 cristal avec diffuseur anomal à 2 long. d'ondes ( = native + dérivé anomal). Etc..

Construction du modèle moléculaire 67 Construction du modèle moléculaire Densité électronique à résolution  non-atomique Modèle moléculaire Pré-requis : - On part en général d'une chaîne poly-Ala construite sur un tracé-repère calculé automatiquement (Ex: option "bones" de O) - Si résolution ≥ 1,7 Å : séquence nécessaire - Utilisation de "contraintes" chimiques et structurales de la chaîne peptidique.

Étapes d'une "reconstruction" 68 Étapes d'une "reconstruction" Carte de densité initiale ( |F|obs, fcalc) "Squelettonisation" de la densité -Modèle poly-alanine (chaîne des Ca) -choix de la direction de chaîne Construction des chaînes latérales à partir de motifs-repères (Cys, Tyr, Trp..) + de résidus construits ? Oui Non Nouvelle densité Affinement de la structure

Affinement des structures obtenues 72 Affinement des structures obtenues But : Obtenir une structure aussi précise que possible, compatible avec les données de diffraction (résolution…) inconvénient : seuls les |F|obs sont expérimentaux (pas les phases) Critère : Minimisation d'un facteur d'accord observé/calculé S||F|calc-|F|obs| -Au sens de Hamilton : R = -Au sens des moindres-carrés : R = S|Fobs| S||F|calc-|F|obs|2 S|Fobs|2 … Sur l'ensemble des réflexions Méthode : affinement des différences (observées/calculées) Par moindres-carrés sur : - coordonnées - facteur de température - ...

Swr(Foi-Fci)2 La structure est décrite comme une fonction linéaire 73 La structure est décrite comme une fonction linéaire d'une série de n inconnues xi F = p1x1 + p2x2 + ….. + pnxn On possède m points de mesure (les modules |Fo|) m équations à n inconnues (m > n) Les valeurs exactes des paramètres pi sont ceux qui minimisent la quantité : i=m D = Swr(Foi-Fci)2 i=1 calculé observé Poids (de l'observation) On fait varier les paramètres de façon à ce que i=m ∂Fci Swr(Foi-Fci)2 =0 j = 1, 2, …, n ∂pj i=1 Calcul des dérivées trop long, on approxime (série de Taylor)

La dégradation des cristaux par irradiation X: Origine Le dommage par irradiation est un problème majeur car il limite la résolution de l’imagerie du matériau biologique. Le dommage initial est dominé par l’absorption photoélectrique: un photon X est absorbé avec éjection d’un électron d’une couche profonde. La lacune ainsi provoquée est comblée par un électron d’une couche externe. Pour les atomes concernés (principalement C, N, O, S, P) l’énergie de cette transition est transmise primairement à un autre électron externe, qui est éjecté comme un électron Auger. Ces électrons produisent des des cascades d’électrons secondaires. Ces divers processus sont courts, à l’échelle de quelques femtosecondes (fs). La perte d’électrons et la formation de radicaux dans la protéine et l’eau produisent, avec une échelle de temps comparativement beaucoup plus longue, des changements électroniques et chimiques dans l’échantillon.

Dommages par irradiation: les moyens d’y rémédier Les principaux procédés permettant de combattre ces effets sont les suivants: Refroidir les échantillons à très basse température(<100K), ce qui ralentit la propagation des radicaux produits. Dans le cas de cristaux, il faut empêcher la formation de glace en procédant à une trempe et/ou en ajoutant un antigel. Utiliser des photons X de haute énergie: 25-40 keV au lieu du canonique 12 keV). C’est un nouveau paradigme, mais qui nécessite un détecteur ayant une bonne efficacité à ces énergies. L’utilisation de composés chimiques piégeant les radicaux est généralement peu efficace. Une approche nouvelle consiste à utiliser un rayonnement constitué de pulses courts et extrêmement intenses produits par des lasers X à électrons libres (X-FEL) (par exemple le LCLS à Stanford, TESLA en construction à Hambourg). Dans ce cas, des diagrammes de diffraction avec une résolution limitée par la diffraction peuvent être enregistrés avant destruction de l’échantillon. Cette méthode ouvre aussi la perspective de résoudre la structure de nanocristaux ou même de matériaux non cristallisés. Dans ces deux cas, l’intensité diffractée est faible à cause de la réduction ou de la suppression de l’effet amplificateur d’un grand nombre d’unités répétées. L’énorme intensité du pulse compense plus ou moins cette perte d’intensité. Le problème des phases peut en principe être résolu par des méthodes de sur-échantillonnage avec des algorithmes itératifs. Ce domaine de recherches est en plein essor.

hémoglobine

Octanucléotide GGTATACC (modèle de la forme A de l’ADN). Structures précises (résolution 1,6 Å ) à P ambiante et 1.4 GPa (paire stéréo). Cette molécule est très compressible axialement et pratiquement pas transversalement. C’est un ressort moléculaire. La géométrie des paires Watson-Crick, qui portent l’information génétique, est quasi-invariante avec la pression. Importance possible de ces propriétés pour la sélection de molécules prébiotiques si conditions environnementales extrêmes.

Protéase de VIH avec un inhibiteur lié au site actif

Ribosome