Directeur de thèse: Didier Rognan Nathanaël Weill

Slides:



Advertisements
Présentations similaires
Probabilistic Record Linkage (PRL). Base SAMU Base hôpital Base unique Enrichissement des bases locales Combiner plusieurs ensembles de données en un.
Advertisements

Théorie des récepteurs
Classification et prédiction
Classification et prédiction
Regroupement (clustering)
Évaluation de la qualité d'une clusterisation
Image et apprentissage
InVS - novembre 2002 INSTITUT DE VEILLE SANITAIRE INSTITUT DE VEILLE SANITAIRE ACTIVITE DE DEPISTAGE DU VIH DANS LES LABORATOIRES D'ANALYSES MEDICALES.
Outils chimiques pour létude des biomolécules 2 ème partie : Outils chimiques théorique : Modélisation Moléculaire 2) La modélisation moléculaire : optimisation.
Application de réseaux bayésiens à la détection de fumées polluantes
1. Les caractéristiques de dispersion. 11. Utilité.
Page : 1 / 8 Conduite de projet Examen du 29 avril 2003 Durée : 3h30mn Le support de cours et les notes sont nécessaires La notation tiendra compte très.
Page : 1 / 8 Conduite de projet Examen du 3 juin 1988 Durée : 4 heures Le support de cours est toléré La notation tiendra compte très significativement.
Page : 1 / 7 Conduite de projet Examen du 17 mai 2000 Durée : 3 heures Le support de cours et les notes sont nécessaires La notation tiendra compte très.
Page : 1 / 6 Conduite de projet Examen du 6 mai 1999 Durée : 4 heures Le support de cours est toléré La notation tiendra compte très significativement.
Page : 1 / 6 INSA Rouen département ASI UV MGPI Examen du 25 juin 2003 Durée : 120 mn Le support de cours est toléré La notation tiendra compte très significativement.
Yann Chevaleyre et Jean-Daniel Zucker
Prédiction de sites dinteraction des protéines par analyse darbres phylogénétiques Stéfan Engelen Génomique Analytique, INSERM U511 Université Pierre et.
Le remplacement moléculaire
variable aléatoire Discrète
La loi normale et l’estimation de paramètres
MasterMind en spécialité i.s.n.
Identification des personnes par l’iris
Laboratoire LCOMS Equipe « Evaluation de Performance et Systèmes d’Aide à la Personne » (EPSAP) Guy Bourhis CENRob 4-5 avril.
Apprendre à partir des observations
Le Mouvement Le Mouvement.
Validation Structurale et Drug Design
FDD et Arbres de Décision
Serveurs Partagés Oracle
Le MouvementLe Mouvement Le Mouvement. Introduction Ta vie dépend de ta capacité à observer et à analyser le mouvement. Ex. Diriger ta bicyclette · Tu.
Une approche non-paramétrique pour caractériser les changements récents dans les séries temporelles d'indices de population Verena Trenkel et Marie-Joëlle.
Structure et fonction de la membrane cellulaire
Méthode des k plus proches voisins
RECONNAISSANCE DE FORMES
Construction de modèles visuels
Présenté par Mathieu Almeida, Amine Ghozlane
SPECIFICATIONS GEOMETRIQUES
Génétique CONNAN Delphine LOPEZ Lise MOROS NICOLAS Carla
Docking et Scoring.
Bioinformatique et Biologie Structurale I/ – Principes et techniques A/ Linformation structurale B/ Les différentes techniques de détermination de structure.
Les molécules organiques
Révisions - IA Généralité: problèmes de lIA Recherche Logique Traitement de lincertitude Apprentissage Langue naturelle.
Liaisons chimiques.
Hybridation sp3 du carbone
E) ACIDES ET BASES ACIDE BASE
Chapitre 2 Biochimie et Biosynthèse
ANALYSE D’UNE TENSION ALTERNATIVE PERIODIQUE.
La Modélisation Moléculaire
printemps des sciences
I MAGIS est un projet commun CNRS - INPG - INRIA - UJF iMAGIS-GRAVIR / IMAG Optimisation à base de flot de graphe pour l'acquisition d'informations 3D.
Segmentation (1ère partie)
GRAPHES EN INFORMATIQUE. INTRODUCTION Les objets mathématiques appelés graphes apparaissent dans de nombreux domaines comme les mathématiques, la biologie,
Programmation dynamique
Mise-à-jour de données de haute incertitude spatiale Présentation dans le cadre du groupe de discussion sur la fusion de données géospatiales – 22 nov.
1 Alain Casali Christian Ernst Extraction de Règles de Corrélation Décisionnelles 29 Janvier 2009.
Séance 8 30 novembre 2005 N. Yamaguchi
La biochimie (Ch 1. 1) Dans chaque cellules vivantes, des réactions chimiques se produisent des millions de fois chaque secondes. Ce sont les réactions.
Olivier Leclair, Université Laval Un algorithme de fouille dans une représentation des données par objets: une application médicale SIMON, Arnaud.
Révision page Les atomes de la même période ont la même quantité de couches électroniques. Les atomes de la même famille (groupes) ont la même.
Thibault ROY & Olivier SAGIT Exposé du mercredi 17 décembre 2003 Apprentissage Interactif Apprentissage avec SpamAssassin UFR de Sciences Département d’Informatique.
Présenté par Mathieu Almeida, Amine Ghozlane
Atelier COX Comment concevoir un médicament anti-inflammatoire sans effet secondaire pour l'estomac ? Version 5 sept 2014.
1 Prédiction de mobilité basée sur la classification selon le profil DAOUI Mehammed Université Mouloud Mammeri Tizi-Ouzou Rencontres sur.
Le Marketing Prédictif
UNIVERSITE DE PICARDIE JULES VERNE Faculté de Pharmacie
Les Extra-Trees+SW Réalisé par : Encadrante:
Pharmacodynamie, Pharmacocinétique
Equipe Projet DOLPHIN 03/04/08.
Couche limite atmosphérique Micrométéorologie. Équations de Reynolds 7 équations et 16 inconnues...
IFT 501 Recherche d'information et forage de données Chapitre 4 : Classification concepts de base, arbres de décision et évalution des modèles Partie 3.
Transcription de la présentation:

Directeur de thèse: Didier Rognan Nathanaël Weill Conception de méthodes in silico afin de trouver de nouveaux ligands de Recepteur Couplé aux Protéines G (RCPG). Directeur de thèse: Didier Rognan Nathanaël Weill Laboratoire de la Pharmacochimie de la Communication Cellulaire LC1 - UMR CNRS/ULP 7175 Faculté de Pharmacie

RCPG récepteurs couplés aux protéines G: 30-45% des protéines cibles de médicaments. Cibles de 26 médicaments parmi les 100 les plus vendus (23.500.000.000 $/an). 30 / 366 RCPG non olfactifs humains utilisés comme cibles intérieur extérieur Membrane cellulaire +++ signal+++

Objectifs: Être capable de prédire l'interaction entre un ligand et un RCPG. ? ? ? ? ? ?

État de l'art: + = Méthode basée sur la structure (Docking): Ligand 1 seule structure 3D pour 366 RCPG. Méthode basée sur la complémentarité: Géométrique Interaction = Évaluation de la pose Structure 3D + Ligand

État de l'art (suite): Méthode basée sur le ligand: A partir des ligands connus, il s'agit de s'en "inspirer" de ces ligands pour en créer de nouveaux. Recherche de sous structure. Similarité chimique basée sur les propriétés moléculaires. Histamine (ulcère gastrique) Burimamide (1972) Cimetidine (1976)

Méthode proposée: On dispose de 366 RCPG non olfactifs. Plusieurs dizaines de milliers de ligands. Fouille de données ("Machine Learning").

Petite analogie: agence matrimoniale But: savoir si un couple proposé a des chances de marcher… Données de départ : un ensemble de couples qui a déjà été formé. Certains couples subsistent d'autres non. Méthode: Créer un modèle de règles qui va permettre de déterminer les chances d'un nouveau couple. Outils de fouille de données.

Petite analogie: agence matrimoniale Chaque personne remplit un questionnaire (qui peut être différent pour les hommes et les femmes). Chaque question est un "descripteur". Ex: âge, taille, longueur des cheveux, se maquille… Un homme Une femme Un couple + On scinde les données de départ en deux: Set d'entraînement qui sert à créer le modèle Set de test qui sert à évaluer le modèle. Création du modèle + évaluation. Évaluation de nouveaux couples

Descripteur 1 Le couple marche Le couple ne marche pas Descripteur 2

Dans notre cas… Représenter les données (vecteur) Données connues (cavité-ligand) Set d'entraînement Set de test "Learning machine" Entraînement Création de modèle Évaluation du modèle Modèle validé Données non connues (récepteurs orphelin -ligands)

Les résultats dépendent: De la quantité et la qualité des données disponibles. De la manière dont la question est posée (attribut à prévoir). De l'algorithme de fouille de données utilisé ainsi que ses paramètres. De la pertinence des descripteurs. Représentation des données. Il s'agit de créer une représentation cohérente de l'information reflétant les possibilités d'interactions. Ligands. Protéines.

Descripteurs de protéines (Cavité) Pour chaque acide aminé, un tableau de 8 cases représente les différentes caractéristiques: Donneur de liaison Hydrogène (0-1) Accepteur de liaison Hydrogène (0-1) Aromatique (0-1) Hydrophobe (0-1) Chargé positivement (0-1) Chargé négativement (0-1) Taille de la chaîne latérale (2 cases): Petite : 00 Moyenne : 01 Grande: 11 Pour la totalité de la cavité, 30 résidus sélectionnés*: 8x30 = 240 cases par RCPG. * Surgand et al. (2006). Proteins 62: 509-538.

Descripteurs de Ligand Basé sur SHED ("Shannon Entropy Descriptor") 7 propriétés : Apolaire (aP). Donneur de liaison H (D). Accepteur de liaison H (A). Aromatique (R). Chargé positivement (+). Chargé négativement (-). SHED Shannon Entropy Descriptors from Topological Feature Distributions. E. Gregori-Puigjané and J. Mestres J. Chem. Inf Model. 2006, 46, 1615-1622

Descripteurs de Ligand Assigner les propriétés aux atomes: S=0.7 E=2 21 couples de propriétés: Descripteur de 378 valeurs Descripteur de 21 valeurs  

Évaluation des descripteurs Protéine: Être capable d'évaluer la similitude entre les RCPG => reconstituer les familles. Ligand: Capacité à discriminer des molécules actives de molécules inactives pour des récepteurs données.

Résultats Protéine : 366 RCPG non olfactifs Métrique utilisée: Distance Euclidienne. Méthode UPGMA (bootstrap = 1000) Classification cohérente est obtenue.

Résultats Ligands : Descripteur 1 Descripteur 2 Données: inhibiteurs cox2 (426 actifs, 13726 inactifs) Inhibiteurs p38 (453 actifs, 9700 inactifs). 7 différentes méthodes optimisées: SVM SMO Arbres de décision Random Forest Réseaux neuronaux OneR Modèles Bayesiens Meilleurs résultats

Empreintes circulaires* Résultats Ligands : Courbe ROC: On ordonne les molécules selon leur score. Parcoure la base de données. Aire sous la courbe. idéale : Aire = 1 aléatoire : Aire = 0.5   descripteur 1 (378) descripteur 2 (21) Empreintes circulaires* cox2 0.99 0.92 p38 0.97 0.90 *PipeLine Pilot. SciTegic

Conclusion Jeux de descripteurs (cavités, ligands) validés. Méthode applicable dans le criblage de ligands ou le criblage de RCPGs orphelins 366 protéines x 2 millions de ligands. Intérêt de la fouille de données dans un contexte de pharmacologie => approche globale.

MERCI