La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Présenté par Mathieu Almeida, Amine Ghozlane Analyses de Données Biologiques 05 février 2008 Rantanen V.V., Gyllenberg M., Koski T. et Johnson M.S. Mars.

Présentations similaires


Présentation au sujet: "Présenté par Mathieu Almeida, Amine Ghozlane Analyses de Données Biologiques 05 février 2008 Rantanen V.V., Gyllenberg M., Koski T. et Johnson M.S. Mars."— Transcription de la présentation:

1 Présenté par Mathieu Almeida, Amine Ghozlane Analyses de Données Biologiques 05 février 2008 Rantanen V.V., Gyllenberg M., Koski T. et Johnson M.S. Mars 2002 – Bioinformatics Étude des classes datomes des protéines pour la prédiction dinteractions moléculaires

2 Introduction Interactions moléculaires des protéines – Nombreuses cibles possibles Ions, petites molécules, protéines, ADN, ARN – Conception dun médicament Prédiction du ligandIdentification du ligand Criblage virtuel Docking RMN Cristallographie Rayon x

3 Introduction Interactions moléculaires des protéines – Nombreuses cibles possibles Ions, petites molécules, protéines, ADN, ARN – Conception dun médicament Prédiction du ligandIdentification du ligand Criblage virtuel Docking RMN Cristallographie Rayon x On a besoin de comprendre comment seffectue la liaison

4 Identification des interactions Introduction Modélisation Moléculaire Reconnaissance statistique des modèles Analyse dune base de donnée Identification des interactions Évaluation des champs de force (GRID, AQUARIUS) Évaluation statistique des liaisons dun groupement (SuperStar, X-Site) Utilisation de classes datomes Amélioration des classifications des atomes intervenant dans les interactions protéiques

5 Construction dune librairie dinteraction fichiers de coordonnées Interaction protéine -ligand 930 pairs dinteraction protéine – protéine non homologues Classification en 24 classes des atomes des protéines impliqués dans ces liaisons Atomes impliqués dans les interactions Li A.J. et Nussinov R Classes comportant les même types datomes

6 Construction dune librairie dinteraction Hypothèse : Existence dun groupement plus naturel des atomes pour une meilleure prédiction Estimation de lerreur : classe Oxygèneclasse Carbone

7 I - Classification des ligands en 30 fragments 9 classes Azotes 9 classes Oxygène 10 classes Carbones 2 classes Sulfures Estimation de la distribution des atomes de protéines autour de ligands

8 autres atomes du ligand liés à M M atome principal du ligand Centre du repère x,y,z T atome de la classe Ck Distance entre latome M du fragment et latome de la classe Ck angles α, г Estimation de la distribution des atomes de protéines autour de ligands II - Disposition des atomes de protéines dans un systèmes de coordonnée centré sur F x = {r, α, г}

9 Estimation de la densité de probabilité dune interaction III – Estimation du nombre optimal de mélanges gaussiens Utilisation de plusieurs lois normales

10 Estimation de la densité de probabilité dune interaction Distribution optimal des intéractions dès le mélange de 3 distributions gaussiennes Dispositions des atomes doxygène carboxylé de la classe 23 autour dun atome dAzote. III – Estimation du nombre optimal de mélanges gaussiens

11 Estimation de la densité de probabilité dune interaction IV - Densité de probabilité dinteraction entre Ck et F Mfk = nombre de composante du mélange Gaussien βj = distribution du mélange Gaussien Pf(x|Ck, θj) = Fonction de distribution Gaussienne Maximisation de la log-vraisemblance de la densité de probabilité par lalgorithme EM Lf(Ck, Θ) = Estimation du paramètre θj de la classe

12 Calcul de la matrice de dissimilarité des classes datomes de protéine Ecart entre la densité de probabilité que F interagisse avec une atome de la classe Ci ou Cj (distance de Jeffrey) distances Euclidiennes entre les classes datomes Ck But: Estimer la différence dassociation aux fragments de ligand entre les classes datome Ck.

13 But : Visualiser la différence dassociation aux fragments des atomes des protéines (Ck) Hypothèse: Les classes datomes de protéine 4, 5, 6 et 8, 10 peuvent être regroupées. Classification hiérarchique des classes datomes protéiques Coefficient cophénétique : r²= 72% de la variance de la matrice de dissimilarité Validation des résultats Bootstrap Jackknife MANOVA Qualité des classes Coefficent de corrélation cophénétique Estimation de la précision Dendrogramme construit par KITCH Package PHYLIP (Felsenstein ) Estimation de la cohérence interne et de la stabilité des classes

14 Package PHYLIP (Felsenstein ) Classification hiérarchique des classes datomes protéiques Classe des Carbones Classe des Sulfures Classe des Oxygènes Classe des Azotes

15 Package PHYLIP (Felsenstein ) Classification hiérarchique des classes datomes protéiques Forte proximité entre les classes datomes de carbone ( D 4-5 =19,6, D 5-6 =23.0) et 7-8 (D 7-8 =14,4) Forte dissimilarité entre les classes datomes 8-10 Proposition des auteurs : – fusion des classes 7-8, 4-5 et 8-10

16 Distribution de la dissimilarité des classes datomes des protéines Pas de stress indiqué But : Visualiser la dissimilarité au sein des classes datomes de protéine par MDS Classe des Carbones Classe des oxygènes et azotes Fort regroupement de la classe carbone – Redondances de cette classe

17 Discussion - Conclusion Réalisation dune matrice des dissimilarités entre les classes datomes grâce aux mélanges gaussiens Estimation des distances classes datomes + Informe bien sur la dissimilarité des classes datome - Contradiction sur les interprétations des distances lié à son estimation globale Étude des interactions atomes – ligands par Reconnaissance statistique des modèles + Pas limitation lié au temps calcul, ni danalyse de base de donnée + Permet de considérer les interactions protéine – protéine - Interprétation complexe : considère simultanément plusieurs caractéristiques - Méthode prédisant encore mal les interactions de la classe Carbone Visualisation des dissimilarités par Classification Hiérarchique et MDS Mise en évidence des regroupements des classes Redondance de la classe Carbone : fusion des classes datomes 4-5, 7-8 et Mise en évidence du regroupement sur des distances - Classe 8-10 : Problème de la classification hiérarchique

18 Perspectives Étudier les 30 matrices individuellement nature environnemental (complexe avec le solvant) et chimique des dissimilarités Déterminer si la nouvelle classification proposé par les auteurs améliore les prédictions dinteraction Réalisation dun logiciel de prédiction des interactions protéine - ligand et protéine - protéine

19 Annexes

20 Banque de donnée PDB Informations contenu dans les structures 3D est la clé de la compréhension des fonctions protéiques au niveau atomique

21 MDL Minimum description length Dimension du modèle de mélange

22 ERROR Erreur importante pour les classes carbones


Télécharger ppt "Présenté par Mathieu Almeida, Amine Ghozlane Analyses de Données Biologiques 05 février 2008 Rantanen V.V., Gyllenberg M., Koski T. et Johnson M.S. Mars."

Présentations similaires


Annonces Google