Modélisation moléculaire et Drug Design Mastère recherche de Biochimie mention Biochimie Structurale et Fonctionnelle UE Bioinformatique Structurale Modélisation moléculaire et Drug Design Décembre 2004
Bon, j’ai mon modèle 3D, et maintenant, j’en fait quoi ?
Validation de mon modèle
Validation structurale Loi de Murphy: « Tout ce qui doit aller mal, ira mal; surtout si les choses sont aussi compliquées que les structures protéiques. »
Validation structurale Validation des empreintes Validation des modèles
Validation structurale des empreintes Pourquoi un homme sain d’esprit passerai 40 ans de sa vie à rechercher des millions d’erreurs dans la PDB ?
Parce que… Tout ce que nous savons sur les protéines vient des fichiers de la PDB. Si une empreinte est fausse, le modèle sera faux Les erreurs deviennent moins dangereuses quand nous les connaissons
Que va-t-on vérifier ? Les erreurs de frappe Les erreurs spécifiques au cristal Les erreurs spécifiques à la RMN Les erreurs les plus évidentes Les erreurs les plus improbables Les erreurs qui semblent les pires
Comment évaluer un modèle Comparaison avec l’empreinte (RMS, alignement…) Évaluer le repliement global (distribution des hydrophobes) Évaluer les paramètres structuraux de notre modèle
Une bonne structure 3D.. rmsd = 4 Å Forme de la molécule rmsd = 3 Å Discrimination des chaines polypeptidiques rmsd = 2 Å Discrimination des chaînes latérales rmsd = 1.5 Å OK rmsd = 0.8 Å Discrimination des atomes rmsd = 0.4 Å très bonne rmsd = 0.2 Å le rêve
Evaluation structurale Validation se fait par comparaison des paramètres structuraux du modèle avec des valeurs standards. Ces valeurs sont obtenues par: analyse de « bonnes » structures: RMSD moins de 1.2 Angstrom (rare) analyse des 300 meilleurs structures de la PDB (Protein DataBase) Analyse des 300 meilleurs fragments de la CSD (Cambridge Structural Database) Certains paramètres peuvent être obtenus par des calculs théoriques (ramachandran…) mais difficulté de discrimination des « bonnes » ou « mauvaises » structures.
Paramètres analysés Nomenclature: des angles (surtout V,T,I,L,R,Y,F,D,E) Poids (entre 0 et 1) Nom des chaînes Pas d’atomes manquants Présence de l’oxygène sur le C terminal … nomenclature.html
Nomenclature C-delta-1 et C-delta-2 semblent être les même donc 2 possibilités pour nommer les atomes
Nomenclature L’angle de torsion chi-2, définie par C-alpha, C-beta, C-gamma, C-delta-1, doit toujours être compris entre -90 et 90 degrés
Paramètres analysés Symétrie: Consistance Convention pour la cellule Combien de molécule dans la cellule Symétrie importante Symétrie non cristallographique symmetry.html
Paramètres analysés Géométrie: Chiralité (exemple) Longueur des liaisons (exemple) Angle des liaisons (exemple) Angle de torsion (exemple) Angles oméga, chi1/chi2 Ramachandran (exemple) Cycle et plan (exemple) Proline
Angle de torsion
Cycles et Plan
Ramachandran En 1963, G. N. Ramachandran, C. Ramakrishnan et V. Sasisekharan présentent un article sur la représentation graphique des 2 plus important angles de torsion du squelette Ca (phi and psi) (J.Mol.Biol 7:95-99 (1963)). Le premier outil sérieux de vérification de la structure des protéines
Ramachandran
Ramachandran 33 résidus dans les zones les + favorables 2 résidus dans les zones permises
Paramètres analysés Structure: Distribution des résidus (inside/outside) Clash stériques Environnement Squelette a Chaînes latérales Molécules d’eau B-factor ou facteur de température Liaisons hydrogène
Clash stérique 2 atomes peuvent être distant au minimum de 1.4 Angstroms. (i.e. la distance inter-nucleaire doit être égale au minimum à la somme des rayons de Van der Waals radii minus 0.4 Angstrom) Des exceptions existent (liaisons entre les atomes…)
Chaînes latérales Vérification de la conformation des rotamères chi-1 avec une base de donnée 3D
Volume, Rayon de giration Léger Dense Protéine Protéines sont fortement repliées
En résumé Critères permettant de juger la validité de structures obtenues par RMN ou diffraction Méthodes et critères permettant d’évaluer la validité d’un modèle 3D
Une bonne structure 3D Minimum d’angles de torsion non permis Maximum de liaison H Maximum de résidus hydrophobes non exposés Maximum de résidus hydrophiles exposés Minimum d’espace interstitiels
Une bonne structure 3D Minimum de mauvais contact Minimum de résidus chargés non exposés Minimum du rayon de giration Minima des énergies covalentes et non covalentes (van der Waals et coulomb)
Validation d’une structure de la PDB La qualité des structures de la PDB peut être vérifiée avec PDBREPORT http://www.cmbi.kun.nl/gv/pdbreport/
pdbreport_1crn.html
PDBREPORT Plus de 25 000 structures PDB analysées Plus de 20 millions de problèmes répertoriés (nomenclature des acides aminés, atomes manquants, chaîne latérale de HIS, ASN, GLN…, conformation du squelette Ca etc…)
Validation d’un modèle Les nouvelles structures et modèles peuvent être vérifiés en utilisant des outils disponibles via le web ou en téléchargement.
Via le web What IF Web Server – Biotech Validation Suite – http://swift.cmbi.kun.nl/WIWWWI/ Biotech Validation Suite – http://biotech.ebi.ac.uk:8400/ Verify3D - http://shannon.mbi.ucla.edu/DOE/Services/Verify_3D/ VADAR – http://redpoll.pharmacy.ualberta.ca/vadar/ Rampage – http://raven.bioc.cam.ac.uk/rampage.php Molprobity – http://kinemage.biochem.duke.edu/molprobity/index.html
What IF Web Server
What IF Web Server
What IF Web Server pdbout_1crn.txt
Biotech Validation Suite
Biotech Validation Suite
Biotech Validation Suite
Biotech Validation Suite
RAMPAGE
RAMPAGE rampage_1crn.pdf
MOLPROBITY
MOLPROBITY
MOLPROBITY
Logiciels de validation structurales PROCHECK - http://www.biochem.ucl.ac.uk/~roman/procheck/procheck.html PROSA II - http://www.came.sbg.ac.at/Services/prosa.html VADAR - http://redpoll.pharmacy.ualberta.ca/vadar DSSP - http://www.cmbi.kun.nl/gv/dssp/index.html WHAT IF – http://www.cmbi.kun.nl/gv/whatif/
DRUG DESIGN © www.pinkpigpage.com
Avant tout… Identification d’une cible correspondant à la pathologie Conception de tests biologiques permettant l’évaluation de l’affinité et de l’activité des molécules synthétisées
Comment sont découvertes les nouvelles drogues ? Approche classique HTS-Chimie combinatoire Par conception rationnelle
Approche classique A partir de substances naturelles : Extraits/broyats Recherche d’activité Synthèse et Production (ex: pénicilline, taxol, cyclosporine…) Constitution d’une bases de données
HTS-Chimie combinatoire Synthèse automatique et rapide de 1000er de molécules Criblage expérimental à haut débit (Hight Throughput Screening) Analyse des informations, tri et évaluation de la diversité moléculaire
Conception rationnelle
Cibles et mécanisme d’action de la molécule thérapeutique Enzymes – inhibiteurs (réversible ou non) Récepteurs – agonistes ou antagonistes Canaux ioniques – bloqueurs Transporteurs – inhibiteurs de transport ADN – agents intercalants, drogue antisens, liants au petit sillon
Nouvelles stratégies du Drug Design Création d’inhibiteurs à partir de la structure du substrat Création de pharmacophore et de peptidomimétiques Structure-based design de ligands (affinité, sélectivité, résistante aux drogues) Création de ligands de novo Criblage virtuel pour des propriétés voulues (règle des 5)
Conception rationnelle A partir du ligand A partir de la structure du ligand et/ou du récepteur
Conception rationnelle A partir d’un produit naturel actif, recherche : Un dérivé plus actif Moins toxique, mieux toléré Plus assimilable Coût de fabrication faible etc… A partir des dérivés : Tests biologiques Mesure d’activité Constitution d’une base de données
Conception rationnelle Optimisation d’un produit naturel peut se faire par : une synthèse systématique d'analogues structuraux une optimisation systématique basée sur le métabolisme des composés actifs une approche rationnelle (quantitative ou qualitative) par l‘étude des relations structure-activité
Conception rationnelle A partir du ligand A partir de la structure du ligand et/ou du récepteur
Conception rationnelle Cible Ligand Connue Inconnue A CHAQUE SITUATION, SES OUTILS…
Conception rationnelle Cible Ligand Connue Inconnue
? ? ?
Cible et ligand sont connus « Structure-based drug design » Docking, dynamique moléculaire
Conception rationnelle Cible Ligand Connue Inconnue
A partir de la structure du récepteur
La cible seule est connue « Analog-based drug design » Conception de novo, criblage virtuel
Conception rationnelle Cible Ligand Connue Inconnue
Le ligand seul est connue Situation la plus commune Développement d’un pharmacophore ou d’un modèle QSAR puis criblage d’une banque de donnée 3D.
Pharmacophore Représentation en 3D des propriétés les plus essentielles d’une molécule active
Criblage sur pharmacophore Dopamine L = site lipophilique; D = Donneur H; PD = Donneur H protoné
Méthodes de corrélation Quantitative Association des variations de l'activité biologiques de certaines molécules à leur paramètres structuraux Donne, pour une série chimique donnée et pour une activité définie, une équation de corrélation
Conception rationnelle Cible Ligand Connue Inconnue
La cible comme le ligand sont inconnus Chimie combinatoire Utilisation d’informations à partir d’autres ligands actifs si connus, analyse de similitude…
Docking Largement inspiré de la présentation de G. Schaftenaar Explain docking is fitting ligand into the receptor, steric and electrostatic match Largement inspiré de la présentation de G. Schaftenaar
Objectif Identifier la conformation géométrique correcte du ligand dans son site actif Observation: Des ligands similaires peuvent parfaitement se lier de différentes façons dans un site actif
Docking Se divise en 3 étapes : Caractérisation du site actif Positionnement du ligand dans le site actif Évaluation des interactions entre le ligand et la protéine (définition d’un score)
Le site actif Différentes méthodes : Les cavités de la protéine (récepteur) sont utilisées pour définir une image négative du site actif se composant d’un jeu de sphères se superposant (DOCK) Définition de descripteurs ensuite recherchés à la surface de la protéine descripteurs chimiques (grpt méthyle, aromatique…) ou physico-chimiques (hydrophobicité, potentiel électrostatique)
Positionnement du ligand Le ligand peut être définit comme rigide ou flexible Généralement, le récepteur est toujours définit comme rigide Historiquement, la 1ère approche: tout rigide
Ligand rigide La protéine et le ligand sont fixes. On recherche l’orientation relative des 2 molécules avec la plus basse énergie. On utilise généralement la Transformée de Fourier pour accélérer les calculs (FTDock…)
Ligand rigide On peut également chercher à évaluer les énergies d’interactions électrostatiques et de VDW pour un complexe Ou encore utiliser des descripteurs (points dans l’espace à qui on assigne certaines propriétés physico-chimique). Les descripteurs du ligand et du récepteur doivent alors coïncidés géométriquement et chimiquement.
Complémentarité d’interactions FlexX
Ex. du logiciel FlexX
Flexibilité Si on désire introduire la notion de flexibilité du ligand, il faut en plus considérer son espace conformationnel Incorporation des méthodes de: Monte Carlo (FLO98, MCDOCK, AUTODOCK) Dynamique moléculaire (SYBYL) Recuit simulé (AUTODOCK) Algorithme génétique (GOLD, AUTODOCK)
En résumé… Monte carlo (FlexX) « recuit simulé » (AutoDock) dynamique moléculaire (SYBYL) Algorithmes génétiques (GOLD AutoDock) Géométrie des distances
Reconstruction du ligand dans le site actif Identification d’un ou plusieurs fragments significatifs dans le ligand (ex: cycle d’un aa…) Placement de ces fragments dans le site actif en essayant de maximiser les contacts favorables Chaque orientation de ces fragments est le point de départ d’une étude conformationnelle du ligand entier
Flexibilité du ligand
Flexibilité du ligand Analyse conformationelle Insensibilité de la conformation de départ Rapide (1 à 2 min par molécule) Précision insuffisante (rmsd < 2 A dans 75% des cas) Protéine rigide Eau Analyse conformationelle non exhaustive
Scoring
Expression de la fonction de scoring Permet d’estimer la complémentarité ligand-protéine dans les complexes Le plus souvent = estimation du gain d’énergie libre du ligand en interaction avec le récepteur par rapport à la forme libre.
Expression de la fonction de scoring De nombreux faux positifs sont générés mais peuvent être réduits par l’utilisation de fonction de scoring consensus.
Exemple de scores Forme et Complémentarité chimique Empirique Champ de force Base de données Consensus (Cscore)
Evaluation de l’interaction
Amber99 (!) … ;BOND PARAMETERS ;=============== ;<Atom1-Atom2> <Energy [kcal/(mol*^2)]> <Equilibrium distance []> ;Energy must be multiplied with 0.013895611e-13 to obtain YASARA units [N/fm] ;[*4.182*2*1000*1e20/(6.022045e23*1e15)] OW-HW 553.0 0.9572 ! TIP3P water HW-HW 553.0 1.5136 TIP3P water C -C 310.0 1.525 Junmei et al, 1999 C -CA 469.0 1.409 JCC,7,(1986),230; (not used any more in TYR) C -CB 447.0 1.419 JCC,7,(1986),230; GUA C -CM 410.0 1.444 JCC,7,(1986),230; THY,URA C -CT 317.0 1.522 JCC,7,(1986),230; AA
Exemple But: Trouver un inhibiteur non peptidique comme possible Nouvelle antibiotique Procédure : - utilisation de la structure 3D de l‘enzyme - docking de 210,000 molecules de ACD (Available Chemical Directory) avec DOCK4.0 - sélection des 100 meilleurs ligands - visualisation des 100 complexes - elimination des doublons - proposition de structure pour 25 inhibiteur - tests biologiques AR-175 Enzyme I of the Phosphoenolpyruvate-Sugar Phosphotransferase System (PTS) IC50 = 50mM
Les logiciels DOCK (http://dock.compbio.ucsf.edu/) FlexX (http://www.tripos.com/sciTech/inSilicoDisc/virtualScreening/flexx.html) GOLD (http://www.ccdc.cam.ac.uk/products/life_sciences/gold/) AutoDOCK (http://www.scripps.edu/pub/olson-web/doc/autodock/)
Conception de novo
Conception de novo
Conception de novo
Assemblage
Conception rationnelle A partir d’un composé naturel, on peut théoriquement synthétiser des millions de dérivés. Nécessité de méthodes quantitatives corrélant paramètres structuraux et activité Quantitative Structure Activity Relationship (QSAR)
Méthodes de corrélation Quantitative Association des variations de l'activité biologiques de certaines molécules à leur paramètres structuraux Donne, pour une série chimique donnée et pour une activité définie, une équation de corrélation
Equation de corrélation Permet de déterminer les valeurs des paramètres qui correspondent à une activité maximale et ainsi de prédire l'activité des molécules qui n'ont pas encore été synthétisée La validité d'un modèle QSAR dépendra donc du choix que l'on aura fait sur les paramètres
Les paramètres les plus pertinents Les paramètres associés aux substituants moléculaires Les paramètres associés aux atomes Les paramètres associés à la topologie 1D Les paramètres associés à la topologie 3D
Les paramètres associés aux substituants moléculaires Les paramètres électroniques Les paramètres stériques (encombrement) Les paramètres de lipophilie
Les paramètres électroniques Une variation de la distribution électronique sur une molécule se traduit par une réactivité chimique différente. De nombreux exemples ont montré qu'une augmentation de la densité électronique conduit à un renforcement de l'activité biologique.
Activité insecticide du diéthyl phényl phosphate et du diéthyl 2,4-dicloro-phényl phosphate
Les paramètres stériques et lipophiles Encombrement stérique modifie l’interaction entre une molécule et son récepteur Le caractère lipophile rend compte souvent des propriétés biologiques comme le métabolisme, la distribution dans les tissus, la liaison avec le site récepteur...
logP Logarithme du coefficient du rapport 1-octanol/eau (logKOW) Permet d’estimer la biodisponibilité d’une molécule Équilibre hydrophile/hydrophobe Suffisamment hydrophile pour être soluble dans le sang (eau) Suffisamment hydrophobe pour traverser les membranes cellulaires
logP -3 +7 Fortement hydrophile 2 5 Fortement hydrophobe plupart des molécules thérapeutiques
Les paramètres les plus pertinents Les paramètres associés aux substituants moléculaires Les paramètres associés aux atomes Les paramètres associés à la topologie 1D Les paramètres associés à la topologie 3D
Les paramètres associés aux atomes Le volume atomique Les surfaces atomiques Les charges atomiques partielles L‘électronégativité Les constantes fragmentales de lipophilie
Les paramètres les plus pertinents Les paramètres associés aux substituants moléculaires Les paramètres associés aux atomes Les paramètres associés à la topologie 1D Les paramètres associés à la topologie 3D
Les paramètres associés à la topologie 1D Le volume moléculaire La réfractivité moléculaire Le coefficient de partage La chaleur de formation le potentiel d'ionisation Les constantes d'ionisation
Les paramètres les plus pertinents Les paramètres associés aux substituants moléculaires Les paramètres associés aux atomes Les paramètres associés à la topologie 1D Les paramètres associés à la topologie 3D
Les paramètres associés à la topologie 3D (3D-QSAR) La surface moléculaire, accessible au solvant, de connolly ou surface de contact Le potentiel électrostatique (position des groupements chargés) Participation à des liaisons hydrogènes Le potentiel de lipophilie moléculaire Les orbitales moléculaires La forme de la molécule
Les paramètres associés à la topologie 3D (3D-QSAR) La surface moléculaire, accessible au solvant, de connolly ou surface de contact Le potentiel électrostatique (position des groupements chargés) Participation à des liaisons hydrogènes Le potentiel de lipophilie moléculaire Les orbitales moléculaires La forme de la molécule
Lignes de contour des potentiels électrostatiques
Les paramètres associés à la topologie 3D (3D-QSAR) La surface moléculaire, accessible au solvant, de connolly ou surface de contact Le potentiel électrostatique (position des groupements chargés) Participation à des liaisons hydrogènes Le potentiel de lipophilie moléculaire Les orbitales moléculaires La forme de la molécule
La règle des 5 de Lipinski Poids moléculaire < 500 (opt ~= 350) Nbre de liaisons H accepteurs < 10 (opt ~=5) Nbre de liaisons H donneurs < 5 (opt ~=2) -2 < clogP < 5 (opt ~= 3) Nbre d’angles de rotations =< 5 Lipinski et al, Adv. Drug. Del. Rev., 23, 3-25 (1997)
Quelques réussites falcipain inhibitors Ring et al. Proc. Natl. Acad. Sci. USA, 90, 3583-3587 (1993) FluA HA fusion inhibitors Bodian et al., Biochemistry, 32, 2967-3978 (1993) HIV Tat-TAR interaction inhibitors Filikov et al. J. Comput-Aided Mol. Des. 12, 229-240 (1998) CD4-MHC II inhibitors Gao et al. Proc. Natl. Acad. Sci. USA., 94, 73-78 (1997) HIV gp41 inhibitors Debnath et al.; J. Med. Chem, 42, 3203-3209 (1999)