Suzanne Sirois Professeure Associée Département de Chimie UQÀM Liens entre le criblage virtuel (vHTS) de cibles thérapeutiques potentielles et la conception de molécules réelles Suzanne Sirois Professeure Associée Département de Chimie UQÀM
Champs d’applications in silico Biologiques Génomique, protéomique, chemogénomique Chimiques Catalyse, séparations, réactions Découvertes d’agents thérapeutiques optimisation, développement, biodisponibilité Polymères Gels, adhésifs, lubrifiants, peintures Matériaux Prédiction de structures, spectroscopie Nano-technologie
Présentation Chimiothèques et Cibliothèques Exemple d’application: SARS-CoV Mpro Interaction protéine-protéine: boucle V3 de gp120 VIH-1:CCR5 e Projet d’envergure Criblage à grande échelle sur cibles thérapeutiques
Projet du Génome Humain Selon l’International Human Genome Sequencing Consortium, on estime le nombre de gènes encodant les protéines humaines entre 20,000-25,000 Lincoln D. Stein. Human genome: End of the beginning. Nature 431, 915 - 916 2004
L’Univers Chimique 10100-400 molécules Molécules organiques 1024-40 Ertl, P. J. Chem. Info. Comput. Sci., 43, 374-380 (2203) Molécules actuellement synthétisées106 Molécules se liant à des cibles thérapeutiques 10?
L’union des deux: Chimiogénomique Découverte et mise au point de molécules thérapeutiques Identification de la fonction des protéines Intègre les informations génomique biologique chimique pharmacologique et pharmacocinétique Sert à comprendre la base moléculaire de l'efficacité d'une molécules et à prédire sa toxicité potentielle et autres effets indésirables Interactions protéine-protéine
Liste de touches (hits) Cibliothèque Ensemble de chimiothèques Structure Modèle Base de molécules 2D Structure 3D Expérimentale connue Pas de structure 3D déterminée Base de molécules 3D Conversion Criblage in silico Criblage Virtuel Docking Pharmacophore Modèle SAR Chimiothèques Filtrage 5 M S. Sirois et al. Assessment of Chemical Libraries for their Druggability, Comput. Biol and Chem., 29 55-67 (2005). Liste de touches (hits) Test in vivo Mesure affinité Mesure activité
Chimiothèques (~5M)
Filtrage: propriétés physico-chimiques
Filtrage Groupes Réactifs
% de molécules < 2 violation des critères
Criblage virtuel de cibles potentielles (virtual High Throughput Screening) vHTS Structure 3D cible Site Fonction de la protéine Chimiothèques Ligand Complexé Modèle pharmacophore Algorithmes, Ordinateurs Liste de touches (hits) Criblage vHTS
Criblage Virtuel sur SARS-CoV Mpro Application Criblage Virtuel sur SARS-CoV Mpro
Données du WHO sur le SARS au 31 décembre 2003 http://www.who.int/csr/sars/country/table2004_04_21/en/index.html 29 pays touchés 8096 cas 774 morts Canada 251 cas 43 morts Transmission par contact face-à face
Projet SRAS: Nos Collaborateurs S. Sirois, et al., Virtual Screening for SARS-CoV Protease Based on KZ7088 Pharmacophore Points, J. Chem. Inf. Comput. Sci. 44, 1111-1122, (2003). Q-S. .Du, et al. , Polyprotein Cleavage Mechanism of SARS-CoV MPro and Chemical Modification of the Octapeptide, Peptides 25, 1857-1864 (2004). Dongqing Wei, et al. , Anti-SARS Drug Screening by Molecular Docking, Amino Acids, accepted (2005) Q-S. .Du, et al. , Molecular Modelling and Chemical Modification for Finding Peptide Inhibitor Against SARS-CoV Mpro, Analytical Biochemistry, 337, 262-270 (2005). Tianjin Institute of Bioinformatics and Drug Discovery (TIBDD) et Tianjin Normal University
Modélisation 3D par Homologie Si la structure 3D de la cible est inconnue Structure 3D d’une protéine connue Modéliser la structure 3D de la protéine cible basée sur celles connues Construire la serrure pour ensuite trouver la clé
Modélisation par Homologie Structure 3D - SARS-CoV Mpro HCov 40%, TGEV 44% 304 AA. domaine 1 (res. 8–99) mauve domaine 2 (res. 100–183) jaune domaine 3 (res. 200–300) bleu Boucle (res. 184–199 ) liant les domaines 2 et 3 mauve . Site de liaison localisé entre les domaines 1-2 HCoV 229E ou 3C-like proteinase (3CLpro) Approcher la structure 3D à partir de la comparaison de la séquence avec les banques de donées Recherche d' homologies Si la protéine étudiée partage plus de 30% d'acides aminés, après alignement , avec une protéine connue, on peut supposer que ces deux séquences possèdent des structures 3D proches K. Anand, et al. Coronavirus Main Proteinase (3CLpro) Structure: Basis for Design of Anti-SARS Drugs. Science 300, 1763-1737 (2003)
Modélisation et Superposition des Structures 3D Modélisation 3D de SARS MPro à partir de HCoV PDB: 1P9S Expérimentale PDB: 1UJ1 RMS = 1.4 Å This is primarily achieved by the 33.1-kD HCoV 229E main proteinase (Mpro) (7), which is frequently also called 3C-like proteinase (3CLpro) to indicate a similarity of its cleavage-site specificity to that observed for picornavirus 3C proteinases [3Cpro (table S1)], although we have recently shown that the structural similarities between the two families of proteinases are limited (8). The Mpro (3CLpro) cleaves the polyprotein at no less than 11 conserved sites involving Leu-Gln (Ser,Ala,Gly) sequences (the cleavage site is indicated by ), a process initiated by the enzyme's own autolytic cleavage from pp1a and pp1ab (9, 10). This cleavage pattern appears to be conserved in the Mpro from SARS coronavirus (SARS-CoV), as we deduced from the genomic sequence published recently (11, 12) and prove experimentally here for one cleavage site (see below). The SARS-CoV polyproteins have three noncanonical Mpro cleavage sites with Phe, Met, or Val in the P2 position, but the same cleavage sites are unusual in other coronaviruses as well. The functional importance of Mpro in the viral life cycle makes this proteinase an attractive target for the development of drugs directed against SARS and other coronavirus infections.
Dyade Catalytique de SARS-CoV Mpro His-41 et Cys-145 Peptidomimétique The reason to select the octapeptide AVLQSGFR is as follows. (1) The protease-susceptible sites in proteins usually extend to an octapeptide, as generally formulated by P4P3P2P1P1′P2′P3′P4′ with the scissile bond located between the subsites P1 and P1′, as generally expressed by P1↓P1′ [2, 3 and 4]. (2) The SARS coronavirus enzyme and several viral proteinases exhibit Gln ↓ (Ser, Ala, and Gly) specificity [1]. (3) According to the "lock-and-key" mechanism in enzymology, the octapeptide cleavable by the SARS proteinase must have a good fit for binding to the active site. However, such a peptide, after a modification of its scissile bond with some simple routine procedure, will completely lose its cleavability but it can still bind to the active site. Actually, the molecule thus modified can be compared to a "distorted key" that can be inserted into a lock but can neither open the lock nor be pulled out from it, spontaneously becoming an ideal competitive inhibitor against the SARS proteinase. Therefore, it would provide us with useful insights for drug design by studying the binding mechanism of SARS proteinase with octapeptides that are cleavable by the enzyme itself. For a detailed discussion about the rationale of "distorted key," see a review by Chou [5] and Fig. 2 therein. Dyade Catalytique de SARS-CoV Mpro His-41 et Cys-145
Superposition des ligands naturels Superposition des peptides 1UK4-SARS (vert) et 1P9U-TGEV (rouge) à partir des coordonnées des structures cristallines Modes de liaisons différents pour les ligands du SARS et TGEV MPro
Superposition des ligands naturels Domaines I et II Superposition de 6 structures complexées du SARS: 1UK4, 1WOF, 2A5I, 2AMD, 2AMQ, 2D2D Montre une poche de liaison conservée où le sous-site S1 est dans un creux prononcé qui contient les résidus de la diades catalytiques Cys145 and His41.
Superposition des ligands naturels Surface moléculaire de la poche à partir des 6 ligands complexés 1UK4, 1WOF, 2A5I, 2AMD, 2AMQ, 2D2D. Bleu: région hydrophobe Vert hydrophile Rouge: surface exposée au solvent
Superposition des ligands naturels Surface moléculaire consensus à partir des 6 ligands complexés 1UK4, 1WOF, 2A5I, 2AMD, 2AMQ, 2D2D. Pair d’électrons libre: pourpre hydrophobe: vert Enthalpie, entropie
Comment trouver d’autres types d’inhibiteurs Mathews , D.A. et al. Structure-assisted design of mechanism-based irreversible inhibitors of human rhinovirus 3C protease with potent antiviral activity against multiple rhinovirus serotypes. Proc.Natl.Acad.Sci.USA v96 pp.11000-11007 , 1999 Superposition de la protease 3C du rhinovirus (1CQQ) complexée avec l’inhibiteur AG7088 sur protéase principale du CoV (SARS-CoV Mpro ) (1UJ1) KZ7088 (A) AG7088 (B)
Modèle Pharmacophore de KZ7088 KZ7088 amarré dans site de liaison de SARS-CoV Mpro 7 points pharmacophores
Criblage Virtuel sur 5M molécules a donné 2789 touches (hits) 0.07% satisfait 5 des 6 liaisons hydrogènes (points pharmacophore) Propriétés physico- chimiques % Violation 17 0 23 1 17 2 47 >2 S. Sirois, et al., Virtual Screening for SARS-CoV Protease Based on KZ7088 Pharmacophore Points, J. Chem. Inf. Comput. Sci. 44, 1111-1122, (2003).
Exemples de touches obtenues Fonction d’évaluation
Modification virtuelle Calcul E int Convergence?
Principales Cibles anti-VIH-1 gp120/gp41 RT In Pr
gp120/gp41 :CCR5/CXCR4
Modèles théoriques: CCR5 Superposition de 3 modèles CCR5 1OPN, 1OPW et 1OPT
Structure 3D: gp120 (1G9M)
Complexe CCR5 gp120 incluant boucle V3 Servir à la conception rationnelle de nouveau inhibiteurs basée sur interactions entre le co-receptor CCR5 et la boucle V3. HIV-1 V3 Loop for Structure-Based Drug Design S. Sirois, T. Sing and K.C.-Chou,Current Protein and Peptide Science, 6(5), 413-422 (2005)
Structure of a V3-Containing HIV-1Gp120 core Huang et al Structure of a V3-Containing HIV-1Gp120 core Huang et al. Science 11 Nov 2005
Superposition des Boucles V3 (RMN)
Structure 3D boucle V3 (RMN) GPG Position 25 Arg + bleu Gln - rouge Position 10 Lys + bleu
Modélisation par homologie des structures 3D de la boucle V3 Suite du projet Improving HIV-treatment: Predicting HIV coreceptor CCR5 and CXCR4 usage through V3 genotype Modélisation par homologie des structures 3D de la boucle V3 Corrélation avec l’usage du corécepteur Choix de traitement R5 R5X4 X4
Virus Influenza H5N1 356 gènes HA de H5N1 Genetic Insight of The H5N1 Influenza Virus High Pathogenicity, Wei et al. soumis à Nature Genetics novembre 2005
Criblage virtuel pour H5N1 Neuraminidase Hemagglutinin Sialoside Hyperbranché Membrane virus Influenza
Projet d’envergure Screensaver Lifesaver Project Computational Drug Design at the University of Oxford The National Foundation for Cancer Research Centre United Devices members Virtual screening using grid computing: the screensaver project” W. Graham Richards Nature Reviews Drug Discovery 1, 551-555 [2002]. “
Le Projet THINK http://www.chem.ox.ac.uk/curecancer.html 3.5 milliard molécules criblées 3.5 millions provenant de chimiothèques connues respectant les critères de Lipinski d’agents thérapeutiques Chaque molécule est variée 100 fois en ajoutant un substituant aléatoirement Chimie combinatoire 3 semaines pour processer une cible
Combien d’années? Si 25000 cibles potentielles X 3 semaines pour 3.5 milliard molécules criblées Si 1024-40 milliard molécules potentielles Avec une chimiothèque de 3.5 milliard molécules On a criblé uniquement 109/10 24 soit 10-15 de toutes les molécules potentielles
Nombre de structures dans PDB X-ray Diffraction 28807 NMR 5124 Total 33931
Solution: Calculs sur Réseaux d’Ordinateurs (Grid Computing)
Construction de Chimiothèques Diversifiées But: Augmenter la qualité du criblage en fonction diversité moléculaire Propriétés ADMET
Processus Chimiothèque Filtre: Enlève indésirables Molécules “Drug-like” Filtre: Enlève indésirables Analyse Diversité: Enlève redondants Espace Chimique Augmente le potentiel de succès du criblage Ajoute les molécules avec Chimie Combinatoire
Soit une chimiothèque réelle Nombre de Violation 0: mauve 1 : bleu 2: vert n: orange- rouge Enlève les composés non-ADMET Défini un espace de diversité drug-like
Comment la diversité est-elle définie? Comment représenter plus de 4 descripteurs? Salaire? Grandeur? Age? Nombre d’enfants? Une combinaison de tous?
2-D formules structurales Types de Descripteurs Moléculaires Topologique 2-D formules structurales Géométrique 3-D forme et structure Quantique Orbitales atomiques et moléculaires Électrostatique Charge positive ou négative
Exemple avec 25 Descripteurs 25 descripteurs DLI (Drug-like Index) Chaque structrure est représentée par un point dans un espace à 25 dimensions Réduit la dimensionalité de l’ensemble Représentation Graphiques 3D:
Soit 2 Chimiothèques
Où se situe le domaine des molécules biodisponibles? Chimiothèque assemblée de 125K mauve WDI rouge ?
Résumé Méthodes in silico et CHP Cibliothèques Chimiothèques Identification Cible Structure 3d Structures 3D Ligand Topologie Site Topologie Fragment Génération Pharmacophore Agents thérapeutiques Fonctions des protéines
Processus de découverte de médicaments: temps et coûts `> 10,000,000 composés sont criblés pour trouver une seule drogue >1,000 “hits” 12 “leads” 6 drogues candidates 1 drogue Études pré-cliniques Études cliniques: Phase I à III 10-15 ans $300 to >$800 million
Vers la Bio-intelligence LEAD/Candidate seeking DRUG DEVELOPMENT TARGET DISCOVERY Genomics Pathway Structural HTS and Virtual de novo Ligand-based Synthetic Pharmaceutical Pharmaco Dosing analysis biology screening design design chemistry optimization genetics optimization Clinical Testing HITS Target validation Silver lead Bronze lead Gold lead Target 3D structure 3D Bioinformatics
Merci A tous les collaborateurs DQ Wei, KC Chou T Sing, R Harrigan R. Roy et V. Makarenkov