DO NOT DISTRIBUTE WITHOUT AGREEMENT – CONFIDENTIAL INFORMATION InTech : Bio-informatique François Delfaud – 23 Octobre 2003 –
InTech Presentation – Oct 23rd p2 More info at or by at Plan 1. Comprendre les fonctions protéiques à partir de modèles 3D 2. En bout de chaine de la bioinformatique: les outils de Drug Design 3. SuMo 4. MEDIT: une jeune start-up
InTech Presentation – Oct 23rd p3 More info at or by at -1- 3D & Fonctions les interactions atomiques observées Exemple dune protéase à sérine : la thrombine A léchelle atomique : Caché derrière un K i (une réaction): tout un chemin réactionnel Aspect entropique à 37°C (310°K) : ΔG= ΔH – T.ΔS Un très grand nombre de degrés de liberté Triad Catalytique: Asp-His-Ser …LDPRSFLLRN… Thrombine Trp60D : poche hydrophobe spécifique de cette sérine protéase de cette sérine protéase
InTech Presentation – Oct 23rd p4 More info at or by at Interaction ionique Liaison hydrogène Interaction aromatique Interaction hydrophobe -1- 3D & Fonctions Les interactions non covalentes stabilisantes
InTech Presentation – Oct 23rd p5 More info at or by at -1- 3D & Fonctions vers un modèle par approximations succéssives Modélisation MoléculaireExpérimental Structure Image T=0°K ! - à T=310°K Flexibilité - Allostérie Concentration 1, mol/l 1 molécule simulée ! (ou quelques) Seuil de détection = Picomol Mesure=Observable => Effet de moyenne Environnement Pour certains modèles: - Solvant - Sels - Membrane cellulaire … Infiniment complexe ! Echelle de temps Simulation de lordre de la dizaine de Nano seconde (10 -9 s) Reaction: k in et k off variant entre la nanosec et lheure RMN: moyenne dans le temps Xray: effet de packing cristallin, facteur de température
InTech Presentation – Oct 23rd p6 More info at or by at -1- 3D & Fonctions Structure RX : exemple de la Thrombine …LDPRSFLLRN… Thrombine 19 structures RX superposées Glu192 très flexible Ser195 Boucle dautolyse peu ou pas résolue ! Trp60D boucle sixties: facteur temp. élevé
InTech Presentation – Oct 23rd p7 More info at or by at 1. Comprendre les fonctions protéiques à partir de modèles 3D 2. En bout de chaine de la bioinformatique: les outils de Drug Design 3. SuMo 4. MEDIT: une jeune start-up Plan
InTech Presentation – Oct 23rd p8 More info at or by at -2- InSilico Drug Design : Molecular Modeling Genes Target characterization Generation of active molecules Lead Genomics and Proteomics Bioinformatics Tools Ligand identification Virtual screening DeNovo Ligand Design 3D Pharmacophore QSAR Diversity selection Hit optimization Selectivity profiling ADME/Tox profiling Protein Function/Structure determination NMR Xray Diffraction Homology Modeling Structure comparison Molecular Dynamics Target identification
InTech Presentation – Oct 23rd p9 More info at or by at 1. Comprendre les fonctions protéiques à partir de modèles 3D 2. En bout de chaine de la bioinformatique: les outils de Drug Design 3. SuMo 4. MEDIT: une jeune start-up Plan
InTech Presentation – Oct 23rd p10 More info at or by at -3- SuMo : Collaboration avec lIBCP Unique technology to compare surfaces and detect similarities between macromolecular structure VERY fast Unique annotation to characterize the function from a 3D generated model Under discussion with the FIST & C. Geourjon Subtilisin Trypsin Same function but only active site is similar and No sequence similarity
analogie locale squelette différent -3- SuMo Evolution Convergente
squelette et séquences semblables fonctions différentes ou antagonistes | | | | | | | | | | | | 2PELAx0 AETVSFNFNSFSEGNPAINFQGDVTVLSNGNIQLTNLN-----KVNSVGRVLYAMPVRIWSSATGNVASFLTSFSFEMKDIKDYDPADGIIFFIAPEDTQIPAGSIGGGTLGVSDTKGAGHFVGV 1IOAAx1 ATETSFNFPNFHTDDKLI-LQGNATISSKGQLQLTGVGSNELPRVDSLGRAFYSDPIQIKD--SNNVASFNTNFTFIIRAKNQSISAYGLAFALVPVNSPPQKKQEFLGIFNTNNPEPNARTVAV *.****.*.: * :**:.*: *:*::***.:. :*:*:**.:*: *::*. :.***** *.*:* :: ::.* *: * :.* ::. * :...:.:.: *.* Prim.cons. A222SFNF22F222222IN2QG22T22S2G22QLT222SNELP2V2S2GR22Y22P22I22SA22NVASF2T2F2F A2G22F222P G V2V | | | | | | | | | | | | 2PELAx0 EFDTYSNSEYNDPPTDHVGIDVNSVDSVKTVPWNSVSGAVVKVTVIYDSSTKTLSVAVTNDNGDITT-IAQVVDLKAKLPERVKFGFSASG--SLGGRQIHLIRSWSFTSTLITTTRRS IOAAx1 VFNTFKNR--IDFDKNFIKPYVN-----ENCDFHKYNGEKTDVQITYDSSNNDLRVFLHFTVSQVKCSVSATVHLEKEVDEWVSVGFSPTSGLTEDTTETHDVLSWSFSSKFRNKLSNILLNNIL *:*:.* *.:.: ** :. ::..*..* : ****.: * * :.::. ::.*.*: :: * *..***.:. :. : * : ****:*.:... Prim.cons. 2F2T22N2EY2D VNSVDSV G2222V222YDSS222L2V S2222V2L22222E2V22GFS222GL H222SWSF2S LLNNIL -3- SuMo Evolution Divergente
séquence chaîne principale groupements d'atomes ACGYVRLAKCDD Y-x(2)-[LV]-x-KC -3- SuMo les différents niveaux d'étude des protéines
Affichage et visualisation SuMo Sites 3D de fixation de ligands (12000 sites sélectionnés) Structure 3D d'intérêt PDB (21000 structures publiques) SuMo server -3- SuMo Prédiction de sites de fixation de ligands par SuMo
élément abstrait ponctuel groupe d'atomes instanciation selon l'environnement position position physique position fonctionnelle géométrie propre aromatique donneur de liaison H accepteur de liaison H -3- SuMo Définition des groupements chimiques
Amas globulaire non orienté ex : charge + ou - Polarisation simple ex : dipôle Polarisation symétrique ex : plan aromatique Double polarisation semi-symétrique ex : acide carboxylique Double polarisation ex : amide -3- SuMo Géométrie des groupements chimiques
instanciation des groupements chimiques sélection de groupements chimiques création automatique de triplets Formation de triplets Sélection de groupements chimiques P1 P2 P3 -3- SuMo Triplets de groupements chimiques
T3 T2 T1 T4 Groupements chimiques Graphe des triplets de groupements chimiques Base de données Utilisation (comparaisons) T3 T2 T1 T4 -3- SuMo Représentation finale des molécules
formation des paires de triplets similaires connexion des paires voisines extraction des sous-graphes indépendants T1 T2 T3 T4 T1' T5' T3' T2' T4' T3/T3' T2/T2' T1/T1' T4/T4' -3- SuMo Heuristique d'extraction des listes de correspondances
Critères essentiels groupements chimiques de même type distances similaires orientation similaire similarité de forme de l'environnement local Autres critères enfouissement similaire (densité atomique) disposition du triplet par rapport à la protéine -3- SuMo Critères de similitude des triplets
programme sumo (157 modules, lignes) : Langage OCaml (Développé par lINRIA) programme central utilisation locale ou indirecte, langage sumo interface web (10000 lignes) HTTP/CGI/HTML requêtes interactives ou via langage SuMoQ optimisation des ressources de calcul machines multiprocesseurs clusters -3- SuMo les différentes composantes de SuMo
Interfaces entre SuMo et les plate-formes de modélisation moléculaire (SPL, SVL, VB) intégration dans un pipeline de modélisation et drug design -3- SuMo Les développements en cours (MEDIT)
InTech Presentation – Oct 23rd p23 More info at or by at 1. Comprendre les fonctions protéiques à partir de modèles 3D 2. En bout de chaine de la bioinformatique: les outils de Drug Design 3. SuMo 4. MEDIT: une jeune start-up Plan
Contract research Service Integration Commercial software Grid Computing olecular xtended istribution nformation echnology in MEDIT distribution BioinfoCheminfoMol.Modeling
InTech Presentation – Oct 23rd p25 More info at or by at -4- MEDIT exemple de produit en R&D 3D model generation from multiple sequence alignment - for low homology area - to score the quality of the model FASTER with Grid Computing – Can process full proteome - Unique annotations to characterize the function from a 3D generated model MED-3Dgen MED-ProScore MED-SuMo
InTech Presentation – Oct 23rd p26 More info at or by at Protéine cible (fichier PDB): Extraire une carte dinteraction avec les points pharmacophoriques N Ligands (fichier SD): Pour chaque ligand n : recherche conformationnelle par Distance Geometry et/ou recuit simulé K conformations Pour chaque conformation N°k : extraction des points pharmacophoriques Prot Don Acc Hyd Acc Passage aux points pharmacophoriques projetés Hyd Don1 Don2 Acc1 -4- MEDIT R&D autour du docking
InTech Presentation – Oct 23rd p27 More info at or by at -4- MEDIT services en informatique et contrats de recherche Molecular Modeling contract research Virtual screening including selectivity prediction 1D-2D-3D molecular descriptors to QSAR model generation Homology modeling for Proteomics or Pharmacogenomics purposes QM/MM reactivity prediction profile … Training All can be done on a linux farm or with Grid Computing Software development C++, VB, Java, Python, PERL development Corba, XML,.NET, SOAP web services MySQL, PostGreSQL databases Unix, Linux administration x10 to x1000 (or more) time faster !
Merci To contact M.E.D.I.T. : Parc Théogone, Toulouse, France Rue du Belvédère, Palaiseau, France Tel: +33 (0) &