Suzanne Sirois Professeure Associée Département de Chimie UQÀM Liens entre le criblage virtuel (vHTS) de cibles thérapeutiques potentielles et la conception de molécules réelles Suzanne Sirois Professeure Associée Département de Chimie UQÀM
Champs d’applications in silico Biologiques Génomiques, protéomique, chemogénomique Chimiques Catalyse, séparations, réactions Découvertes d’agents thérapeutiques optimisation, développement, biodisponibilité Polymères Gels, adhésifs, lubrifiants, peintures Matériaux Prédiction de structures, spectroscopie Nano-technologie
Présentation Chimiothèques et Cibliothèques Exemple d’application: SARS-CoV Mpro
Vers la Bio-intelligence LEAD/Candidate seeking DRUG DEVELOPMENT TARGET DISCOVERY Genomics Pathway Structural HTS and Virtual de novo Ligand-based Synthetic Pharmaceutical Pharmaco Dosing analysis biology screening design design chemistry optimization genetics optimization Clinical Testing HITS Target validation Silver lead Bronze lead Gold lead Target 3D structure 3D Bioinformatics
Projet du Génome Humain Selon l’International Human Genome Sequencing Consortium, on estime le nombre de gènes encodant les protéines humaines entre 20,000-25,000 Lincoln D. Stein. Human genome: End of the beginning. Nature 431, 915 - 916 2004
L’Univers Chimique 10100-400 molécules Molécules organiques 1024-40 Ertl, P. J. Chem. Info. Comput. Sci., 43, 374-380 (2203) Molécules actuellement synthétisées106 Molécules se liant à des cibles thérapeutiques 10?
L’union des deux Découverte et mise au point de molécules thérapeutiques Identification de la fonction des protéines Intègre les informations génomique biologique chimique pharmacologique et pharmacocinétique Sert à comprendre la base moléculaire de l'efficacité d'une molécules et à prédire sa toxicité potentielle et autres effets indésirables Interactions protéine-protéine
Liste de touches (hits) Cibliothèque Ensemble de chimiothèques Structure Modèle Base de molécules 2D Structure 3D Expérimentale connue Pas de structure 3D déterminée Base de molécules 3D Conversion Criblage in silico Criblage Virtuel Docking Pharmacophore Modèle SAR Chimiothèques Filtrage 5 M S. Sirois et al. Assessment of Chemical Libraries for their Druggability, Comput. Biol and Chem., 29 55-67 (2005). Liste de touches (hits) Test in vivo Mesure affinité Mesure activité
Filtrage: propriétés physico-chimiques
Filtrage Groupes Réactifs
Criblage virtuel de cibles potentielles (virtual High Throughput Screening) vHTS Structure 3D cible Site Fonction de la protéine Chimiothèques Ligand Complexé Modèle pharmacophore Algorithmes, Ordinateurs Liste de touches (hits) Criblage vHTS
Criblage Virtuel sur SARS-CoV Mpro Application Criblage Virtuel sur SARS-CoV Mpro
Données du WHO sur le SARS au 31 décembre 2003 http://www.who.int/csr/sars/country/table2004_04_21/en/index.html 29 pays touchés 8096 cas 774 morts Canada 251 cas 43 morts Transmission par contact face-à face
SARS Mpro as Target All coronaviruses encode a chymotrypsin-like (3CLPro) protease for proteolytic procession during virus maturation. SARS-CoV main proteinase Mpro or 3C like similar to the Picornavirus Cys-His catalytic dyad (Cys145-His41) similar to TGEV Mpro (Cys144-His41) HcoV Mpro (Cys144-His41).
SARS Mpro as Target Because of its essential role in proteolytic processing, the SARS Mpro considered an attractive target for antiviral drugs against SARS and other coronavirus infections
Protease Susceptible Sites Usually extend to an octopeptide with the scissile bond located between the subsites P1 and P1’ SARS Mpro cleaves at least 11 inter-domain sites on the pp1a and pp1ab polyproteins involving Leu-Gln (Ser, Ala, Gly) sequences: LQ(S,A,G)
Modélisation 3D par Homologie Si la structure 3D de la cible est inconnue Structure 3D d’une protéine connue Modéliser la structure 3D de la protéine cible basée sur celles connues Construire la serrure pour ensuite trouver la clé
Modélisation par Homologie Structure 3D - SARS-CoV Mpro HCov 40%, TGEV 44% 304 AA. domaine 1 (res. 8–99) mauve domaine 2 (res. 100–183) jaune domaine 3 (res. 200–300) bleu Boucle (res. 184–199 ) liant les domaines 2 et 3 mauve . Site de liaison localisé entre les domaines 1-2 HCoV 229E ou 3C-like proteinase (3CLpro) Approcher la structure 3D à partir de la comparaison de la séquence avec les banques de donées Recherche d' homologies Si la protéine étudiée partage plus de 30% d'acides aminés, après alignement , avec une protéine connue, on peut supposer que ces deux séquences possèdent des structures 3D proches K. Anand, et al. Coronavirus Main Proteinase (3CLpro) Structure: Basis for Design of Anti-SARS Drugs. Science 300, 1763-1737 (2003)
Modélisation et Superposition des Structures 3D Modélisation 3D de SARS MPro à partir de HCoV PDB: 1P9S Expérimentale PDB: 1UJ1 RMS = 1.4 Å This is primarily achieved by the 33.1-kD HCoV 229E main proteinase (Mpro) (7), which is frequently also called 3C-like proteinase (3CLpro) to indicate a similarity of its cleavage-site specificity to that observed for picornavirus 3C proteinases [3Cpro (table S1)], although we have recently shown that the structural similarities between the two families of proteinases are limited (8). The Mpro (3CLpro) cleaves the polyprotein at no less than 11 conserved sites involving Leu-Gln (Ser,Ala,Gly) sequences (the cleavage site is indicated by ), a process initiated by the enzyme's own autolytic cleavage from pp1a and pp1ab (9, 10). This cleavage pattern appears to be conserved in the Mpro from SARS coronavirus (SARS-CoV), as we deduced from the genomic sequence published recently (11, 12) and prove experimentally here for one cleavage site (see below). The SARS-CoV polyproteins have three noncanonical Mpro cleavage sites with Phe, Met, or Val in the P2 position, but the same cleavage sites are unusual in other coronaviruses as well. The functional importance of Mpro in the viral life cycle makes this proteinase an attractive target for the development of drugs directed against SARS and other coronavirus infections.
Dyade Catalytique de SARS-CoV Mpro His-41 et Cys-145 Peptidomimétique The reason to select the octapeptide AVLQSGFR is as follows. (1) The protease-susceptible sites in proteins usually extend to an octapeptide, as generally formulated by P4P3P2P1P1′P2′P3′P4′ with the scissile bond located between the subsites P1 and P1′, as generally expressed by P1↓P1′ [2, 3 and 4]. (2) The SARS coronavirus enzyme and several viral proteinases exhibit Gln ↓ (Ser, Ala, and Gly) specificity [1]. (3) According to the "lock-and-key" mechanism in enzymology, the octapeptide cleavable by the SARS proteinase must have a good fit for binding to the active site. However, such a peptide, after a modification of its scissile bond with some simple routine procedure, will completely lose its cleavability but it can still bind to the active site. Actually, the molecule thus modified can be compared to a "distorted key" that can be inserted into a lock but can neither open the lock nor be pulled out from it, spontaneously becoming an ideal competitive inhibitor against the SARS proteinase. Therefore, it would provide us with useful insights for drug design by studying the binding mechanism of SARS proteinase with octapeptides that are cleavable by the enzyme itself. For a detailed discussion about the rationale of "distorted key," see a review by Chou [5] and Fig. 2 therein. Dyade Catalytique de SARS-CoV Mpro His-41 et Cys-145
preparative HPLC is used to purify the final product.
Gan, Y.R. et al Synthesis and activity of an octapeptide inhibitor designed for SARS coronavirus main proteinase, Peptide, 27(4), 622-5, (2006)
Comment trouver d’autres types d’inhibiteurs Superposition des ligands naturels Superposition des peptides 1UK4-SARS (vert) et 1P9U-TGEV (rouge) à partir des coordonnées des structures cristallines Donne un RMS de 2.19Å pour tous les Ca. Modes de liaisons différents pour les ligands du SARS et TGEV MPro
Superposition des ligands naturels Domaines I et II Superposition de 6 structures complexées du SARS: 1UK4, 1WOF, 2A5I, 2AMD, 2AMQ, 2D2D Montre une poche de liaison conservée où le sous-site S1 est dans un creux prononcé qui contient les résidus de la diades catalytiques Cys145 and His41.
Superposition des ligands naturels Surface moléculaire de la poche à partir des 6 ligands complexés 1UK4, 1WOF, 2A5I, 2AMD, 2AMQ, 2D2D. Bleu: région hydrophobe Vert hydrophile Rouge: surface exposée au solvent
Superposition des ligands naturels Surface moléculaire consensus à partir des 6 ligands complexés 1UK4, 1WOF, 2A5I, 2AMD, 2AMQ, 2D2D. Pair d’électrons libre: pourpre hydrophobe: vert Enthalpie, entropie
Comment trouver d’autres types d’inhibiteurs Mathews , D.A. et al. Structure-assisted design of mechanism-based irreversible inhibitors of human rhinovirus 3C protease with potent antiviral activity against multiple rhinovirus serotypes. Proc.Natl.Acad.Sci.USA v96 pp.11000-11007 , 1999 Superposition de la protease 3C du rhinovirus (1CQQ) complexée avec l’inhibiteur AG7088 sur protéase principale du CoV (SARS-CoV Mpro ) (1UJ1) KZ7088 (A) AG7088 (B)
Modèle Pharmacophore de KZ7088 KZ7088 amarré dans site de liaison de SARS-CoV Mpro 7 points pharmacophores S. Sirois, et al., Virtual Screening for SARS-CoV Protease Based on KZ7088 Pharmacophore Points, J. Chem. Inf. Comput. Sci. 44, 1111-1122, (2004).
Criblage Virtuel sur 5M molécules a donné 2789 touches (hits) 0.07% satisfait 5 des 6 liaisons hydrogènes (points pharmacophore) Propriétés physico- chimiques % Violation 17 0 23 1 17 2 47 >2 S. Sirois, et al., Virtual Screening for SARS-CoV Protease Based on KZ7088 Pharmacophore Points, J. Chem. Inf. Comput. Sci. 44, 1111-1122, (2003).
Exemples de touches obtenues Fonction d’évaluation
Modification virtuelle Calcul E int Convergence?
HTS Identifies Inhibitors of the SARS Cov J.E. Blanchard et al. HTS Identifies Inhibitors of the SARS Cov Mpro, Chem & Biol. 1, 1445-53, (2004)
HTS Identifies Inhibitors of the SARS Cov
Provisional patent filings Revise design From Hit to Lead proposed Pharmacophore For QSAR Validated hits from HTS screening Proposed focused library Purchase cpds Test in in vitro assays Actives? Provisional patent filings Revise design NO YES Scaffolds identified Identified pharrmacophores Computational Chemistry Cheminformatics Lead for further optimization
Résumé Méthodes in silico et CHP Cibliothèques Chimiothèques Identification Cible Structure 3d Structures 3D Ligand Topologie Site Topologie Fragment Génération Pharmacophore Agents thérapeutiques Fonctions des protéines
High Throughput Virtual Screening
Projet d’envergure Screensaver Lifesaver Project Computational Drug Design at the University of Oxford The National Foundation for Cancer Research Centre United Devices members Virtual screening using grid computing: the screensaver project” W. Graham Richards Nature Reviews Drug Discovery 1, 551-555 [2002]. “
Le Projet THINK http://www.chem.ox.ac.uk/curecancer.html 3.5 milliard molécules criblées 3.5 millions provenant de chimiothèques connues respectant les critères de Lipinski d’agents thérapeutiques Chaque molécule est variée 100 fois en ajoutant un substituant aléatoirement Chimie combinatoire 3 semaines pour processer une cible
Combien d’années? Si 25000 cibles potentielles X 3 semaines pour 3.5 milliard molécules criblées Si 1024-40 milliard molécules potentielles Avec une chimiothèque de 3.5 milliard molécules On a criblé uniquement 109/10 24 soit 10-15 de toutes les molécules potentielles
Nombre de structures dans PDB X-ray Diffraction 28807 NMR 5124 Total 33931
Solution: Calculs sur Réseaux d’Ordinateurs (Grid Computing)
Construction de Chimiothèques Diversifiées But: Augmenter la qualité du criblage en fonction diversité moléculaire Propriétés ADMET
Processus Chimiothèque Filtre: Enlève indésirables Molécules “Drug-like” Filtre: Enlève indésirables Analyse Diversité: Enlève redondants Espace Chimique Augmente le potentiel de succès du criblage Ajoute les molécules avec Chimie Combinatoire
Soit une chimiothèque réelle Nombre de Violation 0: mauve 1 : bleu 2: vert n: orange- rouge Enlève les composés non-ADMET Défini un espace de diversité drug-like
Comment la diversité est-elle définie? Comment représenter plus de 4 descripteurs? Salaire? Grandeur? Age? Nombre d’enfants? Une combinaison de tous?
2-D formules structurales Types de Descripteurs Moléculaires Topologique 2-D formules structurales Géométrique 3-D forme et structure Quantique Orbitales atomiques et moléculaires Électrostatique Charge positive ou négative
Exemple avec 25 Descripteurs 25 descripteurs DLI (Drug-like Index) Chaque structrure est représentée par un point dans un espace à 25 dimensions Utilise méthode PCA (Principal Component Analysis) Réduit la dimensionalité de l’ensemble Graphiques 3D: choisit les 3 premiers-PCAs
Soit 2 Chimiothèques
Où se situe le domaine des molécules biodisponibles? Chimiothèque assemblée de 125K mauve WDI rouge ?
Merci A tous les collaborateurs V. Makarenkov et René Roy