La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Bioinformatique ABI-1001 2ème Partie: La Biologie Structurale Cours #2 Domaines, classification et prédictions 2ème Partie: La Biologie Structurale Cours.

Présentations similaires


Présentation au sujet: "Bioinformatique ABI-1001 2ème Partie: La Biologie Structurale Cours #2 Domaines, classification et prédictions 2ème Partie: La Biologie Structurale Cours."— Transcription de la présentation:

1 Bioinformatique ABI ème Partie: La Biologie Structurale Cours #2 Domaines, classification et prédictions 2ème Partie: La Biologie Structurale Cours #2 Domaines, classification et prédictions

2 Domaines: définition Les domaines peuvent être définis de différentes façons:   Séquence: hérédité de (sous)séquences.   Fonction: modules fonctionnels protéiques.   Structure: unité de repliement ou contacts atomiques. Fragment de structure capable de se replier ou d’adopter une conformation indépendamment du reste de la structure.

3 Domaines: définition Domaine: Biologie structurale  Région d’une prot. qui possède son propre cœur hydrophobe et qui est structurellement indépendant du reste de la prot.  généralement colinéaire en séquence. Biochimie/Génétique  Fragments minimale d’un gène capable d’effectuer une fonction donnée. Module: domaines similaires se retrouvant dans plusieurs prot. (ex. Immunoglobine, SH2) Domaine: Biologie structurale  Région d’une prot. qui possède son propre cœur hydrophobe et qui est structurellement indépendant du reste de la prot.  généralement colinéaire en séquence. Biochimie/Génétique  Fragments minimale d’un gène capable d’effectuer une fonction donnée. Module: domaines similaires se retrouvant dans plusieurs prot. (ex. Immunoglobine, SH2)

4 Domaines: évolution… NN NN NN NN NN NN NN NN NN NN Domaines ancestraux (ère pré-biotique) (ère pré-biotique) Domaines ancestraux (ère pré-biotique) (ère pré-biotique) Hétéro-dimèresHétéro-dimères Fusion de gènes Sélection: intermédiaires ancestraux Protéines multi-domaines

5 Identification des domaines structuraux Les domaines sont omniprésents dans les protéines:  La plupart des grosses protéines sont composées d’unités semi-indépendantes: Modularité. Efficacité de repliement. Ségrégation fonctionnelle. Les domaines sont omniprésents dans les protéines:  La plupart des grosses protéines sont composées d’unités semi-indépendantes: Modularité. Efficacité de repliement. Ségrégation fonctionnelle. D-Amino Acid Oxidase FAD/NAD(P)-binding domain HYDROXYBENZOATE HYDROXYLASE: 1PHH

6 Identification des domaines structuraux > 60% des protéines ne sont constituées que d’un seul domaine. Environ 70% des protéines multi-domaines n’ont pas plus de 2 domaines. Il existe une relation linéaire entre la taille des protéines (en acides aminés) et le nombre de domaine qu’elles possèdent. > 60% des protéines ne sont constituées que d’un seul domaine. Environ 70% des protéines multi-domaines n’ont pas plus de 2 domaines. Il existe une relation linéaire entre la taille des protéines (en acides aminés) et le nombre de domaine qu’elles possèdent. N=787N=787 Jones S et al. (1998) Protein Science 7:233

7 Identification des domaines structuraux La grosseur moyenne des domaines se situe environ à ~ 100 résidus. Approximativement 70% des domaines sont continus en séquence. La grosseur moyenne des domaines se situe environ à ~ 100 résidus. Approximativement 70% des domaines sont continus en séquence. N=787N=787 Jones S et al. (1998) Protein Science 7:233

8 Identification des domaines structuraux Quel est l’importance d’identifier ces domaines:  L’évolution s’effectue au niveau de la séquence mais sélectionne des fonctions.  L’identification des domaines dans une structure peut révéler des unités fonctionnelles qui ont évoluées indépendamment. L’alignement et la recherche de séquence en fonction des domaines est beaucoup plus spécifique.  Les domaines sont les unités fondamentales de l’analyse de la structure des protéines. Quel est l’importance d’identifier ces domaines:  L’évolution s’effectue au niveau de la séquence mais sélectionne des fonctions.  L’identification des domaines dans une structure peut révéler des unités fonctionnelles qui ont évoluées indépendamment. L’alignement et la recherche de séquence en fonction des domaines est beaucoup plus spécifique.  Les domaines sont les unités fondamentales de l’analyse de la structure des protéines.

9 Identification des domaines structuraux Concept: interactions atomiques à l’intérieur d’un domaine sont plus nombreuses qu’entre domaines.  La quête: groupes de résidus avec le max. de contact entre résidus mais avec un min. de contact avec d’autres groupes de résidus.  Problème: parfois ces groupes appartiennent à des segments non- contiguës ⇒ discontinuité séquentielle du domaine. Concept: interactions atomiques à l’intérieur d’un domaine sont plus nombreuses qu’entre domaines.  La quête: groupes de résidus avec le max. de contact entre résidus mais avec un min. de contact avec d’autres groupes de résidus.  Problème: parfois ces groupes appartiennent à des segments non- contiguës ⇒ discontinuité séquentielle du domaine.D1D1D2D2 D1D1D2D2NN CC NN CCD1D1D2D2 NN CCD1D1D2D2

10 Identification des domaines structuraux L’identification des domaines est en fait un problème d’optimisation. Plusieurs méthodes ou algorithmes:  STRUDL  DomainParser  PUU  DETECTIVE  DOMAK L’identification des domaines est en fait un problème d’optimisation. Plusieurs méthodes ou algorithmes:  STRUDL  DomainParser  PUU  DETECTIVE  DOMAK Jones S et al. (1998) Protein Science 7:233

11 Identification des domaines structuraux Comment peut-on évaluer l’efficacité d’une méthode?  Teste la méthode avec un groupe de protéines dont les domaines sont connus (experts) avec et/ou d’autres méthodes. Comment peut-on évaluer l’efficacité d’une méthode?  Teste la méthode avec un groupe de protéines dont les domaines sont connus (experts) avec et/ou d’autres méthodes. Jones S et al. (1998) Protein Science 7:233

12 Identification des domaines structuraux La méthode la plus efficace reste tout de même l’identification manuelle.  Mise à jour difficile vue le nombre croissant de structures. La méthode la plus efficace reste tout de même l’identification manuelle.  Mise à jour difficile vue le nombre croissant de structures. Jones S et al. (1998) Protein Science 7:233

13 Identification des domaines structuraux CATH SCOPSCOP 3Dee CATH SCOPSCOP 3Dee

14 Classification?Classification? La structure d’une protéine peut nous renseigner sur ses fonctions et son passé évolutif.  Nécessite la connaissance de la structure et de sa relation avec les autres protéines. Requiert un savoir générale du repliement de la protéine et des informations détaillées sur la structure de beaucoup de protéines. D’un point de vue évolutif, la structure est beaucoup mieux conservé que la séquence. La structure d’une protéine peut nous renseigner sur ses fonctions et son passé évolutif.  Nécessite la connaissance de la structure et de sa relation avec les autres protéines. Requiert un savoir générale du repliement de la protéine et des informations détaillées sur la structure de beaucoup de protéines. D’un point de vue évolutif, la structure est beaucoup mieux conservé que la séquence.

15 ??? Le repliement évolutif ??? Protéines divergentes du point de vue séquence, retiennent l’architecture et la topologie de leur repliement ancestrale. Les prot. peuvent avoir plus d’un repliement énergétiquement stable.  pression sélective = contraintes fonctionnelles. Les similarités structurales entre prot. sans parenté s’explique souvent par la convergence d’un repliement stable plutôt que par la divergence d’un ancêtre commun.  évolution parallèle. Évolution nécessite la subsistance fonctionnel des prot. existantes sinon…R.I.P. Protéines divergentes du point de vue séquence, retiennent l’architecture et la topologie de leur repliement ancestrale. Les prot. peuvent avoir plus d’un repliement énergétiquement stable.  pression sélective = contraintes fonctionnelles. Les similarités structurales entre prot. sans parenté s’explique souvent par la convergence d’un repliement stable plutôt que par la divergence d’un ancêtre commun.  évolution parallèle. Évolution nécessite la subsistance fonctionnel des prot. existantes sinon…R.I.P.

16 S tructural C lassification O f P roteins Organisation hiérarchique des prot. selon leur structure et leur origine évolutive.  Procure un réductionnisme qui facilite les comparaisons structurales.  Inspection/comparaison automatique et visuel L’unité principale de catégorisation son les domaines; ceux-ci étant l’unité évolutive, fonctionnelle et structurale des prot. Organisation hiérarchique des prot. selon leur structure et leur origine évolutive.  Procure un réductionnisme qui facilite les comparaisons structurales.  Inspection/comparaison automatique et visuel L’unité principale de catégorisation son les domaines; ceux-ci étant l’unité évolutive, fonctionnelle et structurale des prot.

17 S tructural C lassification O f P roteins Niveaux hiérarchiques de SCOP:  Class: dérive du contenu en structure secondaire.  Fold: provient de la topologie, l’arrangement et l’orientation des éléments de structures secondaires. (968) Similarités structurales proviennent des propriétés physico-chimique ≠ évolution  Superfamilly: regroupent les prot. Avec peu d’identité de séquence mais dont la structure et la fonction sont relié. (~1300) Origine évolutive commune probable  Familly: Structure et fonction similaire ainsi que > 30% d’identité de séquence (~2300) Origine évolutive certaine Niveaux hiérarchiques de SCOP:  Class: dérive du contenu en structure secondaire.  Fold: provient de la topologie, l’arrangement et l’orientation des éléments de structures secondaires. (968) Similarités structurales proviennent des propriétés physico-chimique ≠ évolution  Superfamilly: regroupent les prot. Avec peu d’identité de séquence mais dont la structure et la fonction sont relié. (~1300) Origine évolutive commune probable  Familly: Structure et fonction similaire ainsi que > 30% d’identité de séquence (~2300) Origine évolutive certaine

18 S tructural C lassification O f P roteins SCOP 1.65 Classes Août 2003 ( PDB Entries/54745 Domains) All  All  Others Proteins All  /  All  +  Multi-domainMulti-domain Membrane and cell surfaceMembrane and cell surface Small proteinsSmall proteins Coiled coilCoiled coil Low resolutionLow resolution PeptidesPeptides Designed proteinsDesigned proteins

19 S tructural C lassification O f P roteins

20 Ex. 1GTM

21 S tructural C lassification O f P roteins 2 domaines en tout Relié à l’activité catalytique RasmolRasmol ChimeChime Liens externes 3 chaînes dans le fichiers pdb dont le domaine inclus les a.a. de 181 à 419

22 S tructural C lassification O f P roteins Swiss-PDBviewerSwiss-PDBviewer Pour connaître le second domaine

23 C lassification, A rchitecture, T opology and H omology Classification semi-automatique:  Selon des protocoles et algorithmes (PUU, DETECTIVE et DOMAK).  Valider manuellement en cas d’ambiguïté. Ne considère que les structures résolu à une résolution de 3 Å ou moins. Les prot. multi-domaines sont subdivisées selon leur domaines constitutifs de manières automatique. Classification semi-automatique:  Selon des protocoles et algorithmes (PUU, DETECTIVE et DOMAK).  Valider manuellement en cas d’ambiguïté. Ne considère que les structures résolu à une résolution de 3 Å ou moins. Les prot. multi-domaines sont subdivisées selon leur domaines constitutifs de manières automatique.

24 C lassification, A rchitecture, T opology and H omology Quatre niveaux majeurs de classification:  Class: déterminer automatiquement par la composition en structures secondaires.  Architecture: déterminer manuellement selon l’orientation des éléments de structures secondaires sans toutefois tenir compte de la connectivité.  Topology: classer automatiquement en famille de conformation (fold family) selon la forme globale et la connectivité des éléments structuraux.  Homology(superfamille): regroupe les domaines de prot. ayant un ancêtre commun (homologue). Sequence families: regroupe à l’intérieur de superfamilles les homologues selon leur identité de séquence Quatre niveaux majeurs de classification:  Class: déterminer automatiquement par la composition en structures secondaires.  Architecture: déterminer manuellement selon l’orientation des éléments de structures secondaires sans toutefois tenir compte de la connectivité.  Topology: classer automatiquement en famille de conformation (fold family) selon la forme globale et la connectivité des éléments structuraux.  Homology(superfamille): regroupe les domaines de prot. ayant un ancêtre commun (homologue). Sequence families: regroupe à l’intérieur de superfamilles les homologues selon leur identité de séquence

25 C lassification, A rchitecture, T opology and H omology 4 Classes:  Mainly   Mainly   Mixed  &   Few secondary structures 37 Architectures 813 Topologies 1467 Homologues 4 Classes:  Mainly   Mainly   Mixed  &   Few secondary structures 37 Architectures 813 Topologies 1467 Homologues Mainly  Mainly  Mixed  &  Few secondary structures

26 C lassification, A rchitecture, T opology and H omology Le site de CATH contient d’autres ressources utiles:  SSAP server: comparaison structurale de 2 prot. et alignement structurale  GRATH server: recherche de topologie pour une structure donnée.  DHS: dictionnaire des homologues.  Gene3D: Base de données d’identification de gène structuraux pré-calculés à travers 120 génomes.  IMPALA: Comparaison de séq. avec une base de données PSI-BLAST. Le site de CATH contient d’autres ressources utiles:  SSAP server: comparaison structurale de 2 prot. et alignement structurale  GRATH server: recherche de topologie pour une structure donnée.  DHS: dictionnaire des homologues.  Gene3D: Base de données d’identification de gène structuraux pré-calculés à travers 120 génomes.  IMPALA: Comparaison de séq. avec une base de données PSI-BLAST.

27 CATH, exemple…1GTM 2 domaines/ chaînes

28 CATH, exemple…1GTM Généralement relié à l’activité

29 CATH, exemple…1GTM

30 C lassification, A rchitecture, T opology and H omology Il semblerait que les prot. peuvent adopter environ 1000/5000 conformations différentes. ( on est loin de pour une protéine moyenne: nombre qui soit dit en passant est plus grand que le nombre d’atome dans l’univers ) À ce jour on connaît au moins un représentant de chacune de ces conformations. Environ une dizaine de topologies contiennent plus de la moitié de toutes les prot. Il semblerait que les prot. peuvent adopter environ 1000/5000 conformations différentes. ( on est loin de pour une protéine moyenne: nombre qui soit dit en passant est plus grand que le nombre d’atome dans l’univers ) À ce jour on connaît au moins un représentant de chacune de ces conformations. Environ une dizaine de topologies contiennent plus de la moitié de toutes les prot.

31 Comparaison et Alignement de structure Importance de la comparaison et l’alignement:  Classification: assignation de classe de repliement et éventuellement création de bibliothèques de configuration.  Fonction: identification de la fonction d’une prot. inconnu en comparant avec la structure de prot. connue.  Prédiction: évaluation de la qualité d’un modèle avec les structures connues.  Évolution: permet de révéler des relations évolutives non identifiable par l’alignement de séquence seulement. Importance de la comparaison et l’alignement:  Classification: assignation de classe de repliement et éventuellement création de bibliothèques de configuration.  Fonction: identification de la fonction d’une prot. inconnu en comparant avec la structure de prot. connue.  Prédiction: évaluation de la qualité d’un modèle avec les structures connues.  Évolution: permet de révéler des relations évolutives non identifiable par l’alignement de séquence seulement.

32 Comparaison et Alignement de structure Alignement ≠ Superposition  L’alignement c’est l’identification de résidus qui possèdent un même arrangement spatiale (3D).  La superposition nécessite au préalable l’alignement de résidus pour pouvoir superposer le reste de la structure…un genre de nœud de transformation géométrique. Alignement ≠ Superposition  L’alignement c’est l’identification de résidus qui possèdent un même arrangement spatiale (3D).  La superposition nécessite au préalable l’alignement de résidus pour pouvoir superposer le reste de la structure…un genre de nœud de transformation géométrique. Chaîne A Chaîne B alignementalignement superpositionsuperposition

33 Comparaison et Alignement de structure Comment mesure-t-on l’erreur de superposition?  RMSD: root mean square deviation. Comment mesure-t-on l’erreur de superposition?  RMSD: root mean square deviation. Atome a Coordonnée (x a, y a, z a ) Atome a Coordonnée (x a, y a, z a ) Atome b Coordonnée (x b, y b, z b ) Atome b Coordonnée (x b, y b, z b ) RMSD =  { (x – x ) 2 +(y – y ) 2 +(z – z ) 2 } i i N N Où N= nombre d’atomes comparés aiaiaiai bibibibi aiaiaiai bibibibi aiaiaiai bibibibi

34 Comparaison et Alignement de structure Å ⇒ Identique. <1.5 Å ⇒ Très similaire. < 5.0 Å ⇒ Modérément bon Å ⇒ Relié structurellement. > 7.0 Å ⇒ Relation incertaine. > 12.0 Å ⇒ Aucunement relié Å ⇒ Identique. <1.5 Å ⇒ Très similaire. < 5.0 Å ⇒ Modérément bon Å ⇒ Relié structurellement. > 7.0 Å ⇒ Relation incertaine. > 12.0 Å ⇒ Aucunement relié.

35 Comparaison et Alignement de structure NomDescription URL et ressources WEB CE Combinatorial Extension of the Optimum Path DALI Distance Matrix Alignement HOMSTRAD Homologous Structure Alignement Database cryst.bioc.cam.ac.uk/~homstrad/ SARF2 Spatial Arrangement of Backbone Fragments SSAP Sequential Structure Alignement Program bin/cath/GetSsapRasmol.pl VAST Vector Alignement Search Tool ure/VAST/vast.shtml

36 CE exemple…

37 Votre requête: utilisez le code pdb et précisez la chaîne avec > (ex. 1A3G:A…fichier 1A3G chaîne A. Si il n’y pas de chaînes à spécifier, la notation est 1A3G:_ ) Importance statistique p/r à un alignement avec une structure aléatoire. (conformation similaire: > 3.5) % de différence de longueur en a.a entre les structures alignées % de GAPs permis dans l’alignement des structures.

38 CE exemple… Faites vos sélections!

39 CE exemple… Lignes pointillées = Gap Lettrages pâles (très pâles…) = résidus non-alignés Lignes pointillées = Gap Lettrages pâles (très pâles…) = résidus non-alignés RMSDRMSD % d’identité # de résidus alignés Z-ScoreZ-Score

40 CE exemple… Souris bouton droit Souris Nécessite l’installation du plug-in Chime/ protein explorer Le fichiers sera en format.txt mais reconnu par Rasmol et Swiss PDBviewer…

41 CE exemple… RMSD = 0.5 Seq. Id. = # résidus alignés = 274 Z-score = 7.5 1A3G:A1A3G:A 1I1M:C1I1M:C

42 CE exemple… RMSD = 1.4 Seq. Id. = 27.3 # résidus alignés = 275 Z-score = 7.5 1A3G:A1A3G:A 2DAB:B2DAB:B

43 CE exemple… RMSD = 2.0 Seq. Id. = 20.5 # résidus alignés = 260 Z-score = 7.2 1A3G:A1A3G:A 1ET0:A1ET0:A

44 CE exemple… RMSD = 5.2 Seq. Id. = 5.2 # résidus alignés = 77 Z-score = 3.9 1A3G:A1A3G:A 1I6H:E1I6H:E

45 CE exemple… RMSD = 6.0 Seq. Id. = 2.3 # résidus alignés = 83 Z-score = 3.9 1A3G:A1A3G:A 1B76:B1B76:B

46 CE exemple… RMSD = 8.6 Seq. Id. = 10.3 # résidus alignés = 107 Z-score = 3.7 1A3G:A1A3G:A 1B76:B1B76:B

47 CE exemple…

48 VAST exemple…

49 Faites vos sélections!

50 VAST exemple… À télécharger au préalable!

51 VAST exemple…

52 Prédiction de structures (Prédiction en 1D ) Prédiction de structures secondaires  Principe générale: AAs ont une certaine propension à former des structures secondaires (Chou & Fasman). Prédiction d’accessibilité du solvant  Principe générale: AAs ont une certaine hydrophobicité face au solvant (Richards, Connolly). Prédiction d’hélices trans-membranaires  Principe générale: hélices TM sont apolaire et de résidus. Distribution asymétrique des AAs de part et d’autre de la membrane. Prédiction de structures secondaires  Principe générale: AAs ont une certaine propension à former des structures secondaires (Chou & Fasman). Prédiction d’accessibilité du solvant  Principe générale: AAs ont une certaine hydrophobicité face au solvant (Richards, Connolly). Prédiction d’hélices trans-membranaires  Principe générale: hélices TM sont apolaire et de résidus. Distribution asymétrique des AAs de part et d’autre de la membrane.

53 Prédiction de structures secondaires

54 Méthodes de première génération: 50-60% de précision  Statistique: propension individuelle de chaque aa à former des structures secondaires. Chou & Fasman GOR (Garnier, Osguthorpe & Robson) Seconde génération: freinées ~ 60% de précision  Nearest neighbor: Propension de segment d’aa adjacents ⇒ considère l’environnement local des aa. Levin & Garnier Problème:  1) Information locale ~ 65% structures secondaires  2) Longueur des structures prédites ~ ½ structures réelles  3) Faible niveau de prédiction des structures  (struc. non-locales) Méthodes de première génération: 50-60% de précision  Statistique: propension individuelle de chaque aa à former des structures secondaires. Chou & Fasman GOR (Garnier, Osguthorpe & Robson) Seconde génération: freinées ~ 60% de précision  Nearest neighbor: Propension de segment d’aa adjacents ⇒ considère l’environnement local des aa. Levin & Garnier Problème:  1) Information locale ~ 65% structures secondaires  2) Longueur des structures prédites ~ ½ structures réelles  3) Faible niveau de prédiction des structures  (struc. non-locales)

55 Prédiction de structures secondaires Méthodes évolutives: > 70%Méthodes évolutives: > 70%  la différence ponctuelle des résidus extraite à partir d’une famille de prot. alignées est hautement indicatif de détails structuraux spécifiques. Le profil d’alignement de N résidus consécutif contient l’information non-locale puisque la sélection naturelle c’est produite sur des objets 3D.Le profil d’alignement de N résidus consécutif contient l’information non-locale puisque la sélection naturelle c’est produite sur des objets 3D. PredictProtein-PHD (72%)PredictProtein-PHD (72%)  Jpred (73-75%)Jpred (73-75%)  PSIpred (77%)PSIpred (77%)  Meta-ServerMeta-Server  Méthodes évolutives: > 70%Méthodes évolutives: > 70%  la différence ponctuelle des résidus extraite à partir d’une famille de prot. alignées est hautement indicatif de détails structuraux spécifiques. Le profil d’alignement de N résidus consécutif contient l’information non-locale puisque la sélection naturelle c’est produite sur des objets 3D.Le profil d’alignement de N résidus consécutif contient l’information non-locale puisque la sélection naturelle c’est produite sur des objets 3D. PredictProtein-PHD (72%)PredictProtein-PHD (72%)  Jpred (73-75%)Jpred (73-75%)  PSIpred (77%)PSIpred (77%)  Meta-ServerMeta-Server 

56 Prédiction d’accessibilité du solvant. Principe générale: AAs ont une certaine hydrophobicité face au solvant (Richards, Connolly). Principe générale: AAs ont une certaine hydrophobicité face au solvant (Richards, Connolly).

57 Prédiction d’accessibilité du solvant.

58 Concept: en connaissant les éléments de structures secondaires, on peut tenter de prédire la structure tertiaire en testant différents arrangements spatiales.  Un aa hydrophobe aura tendance à être caché à l’intérieur tandis qu’un aa hydrophile sera plutôt exposé.  L’accessibilité au solvant d’une prot. est conservée en tout point à l’intérieur d’une famille de séquence. La plupart des serveurs de prédiction de structures secondaires nous donnes cette prédiction. Concept: en connaissant les éléments de structures secondaires, on peut tenter de prédire la structure tertiaire en testant différents arrangements spatiales.  Un aa hydrophobe aura tendance à être caché à l’intérieur tandis qu’un aa hydrophile sera plutôt exposé.  L’accessibilité au solvant d’une prot. est conservée en tout point à l’intérieur d’une famille de séquence. La plupart des serveurs de prédiction de structures secondaires nous donnes cette prédiction.

59 Exemple… PredictProtein-PHD Soumettre à plusieurs serveurs en 1 seul étape

60 Exemple… PredictProtein-PHD

61

62

63 Selon PDB: HHHHHHHHHHHHHHHHHHH EEE H=Hélice, E= Feuillet, C= Boucle/tour

64 Exemple… PredictProtein-PHD ConsensusConsensus Accessibilité au solvant JPredJPred HHHHHHHHHHHHHHHHHHHHHEEE HHHHHHHHHHH Selon PDB:

65 Prédiction d’hélices transmembranaires La structure des prot. trans-membranaires est difficile à obtenir expérimentalement (X- ray, RMN).  Les méthodes de prédictions sont d’autant plus importantes. Simplifié par les contraintes membranaires:  revient à un problème 2D. La structure des prot. trans-membranaires est difficile à obtenir expérimentalement (X- ray, RMN).  Les méthodes de prédictions sont d’autant plus importantes. Simplifié par les contraintes membranaires:  revient à un problème 2D.

66 Prédiction d’hélices transmembranaires

67 Concept:  1) Hélices TM sont apolaire et typiquement de résidus de long.  2) Régions globulaires (RGs) entre hélices sont généralement plus court que 60 résidus.  3) Les TMH possèdent une distribution spécifiques des aa chargés positivement (positive-inside rule de R et K).  4) Les longues RGs (>60 résidus) diffèrent en composition des RGs sujettes à la règle inside/outside. Méthodes variées:  Échelle d’hydrophobicité, moment hydrophobe, distribution spécifiques des aa dans les TMH. Faible distinction entre prot. membranaires et prot. globulaires. Concept:  1) Hélices TM sont apolaire et typiquement de résidus de long.  2) Régions globulaires (RGs) entre hélices sont généralement plus court que 60 résidus.  3) Les TMH possèdent une distribution spécifiques des aa chargés positivement (positive-inside rule de R et K).  4) Les longues RGs (>60 résidus) diffèrent en composition des RGs sujettes à la règle inside/outside. Méthodes variées:  Échelle d’hydrophobicité, moment hydrophobe, distribution spécifiques des aa dans les TMH. Faible distinction entre prot. membranaires et prot. globulaires.

68 Prédiction d’hélices transmembranaires La précision est augmentée lorsqu’on utilise un modèle évolutif basé sur l’homologie de séquence de prot. membranaires apparentées.  TopPred  MEMSAT  TMHMM La précision est augmentée lorsqu’on utilise un modèle évolutif basé sur l’homologie de séquence de prot. membranaires apparentées.  TopPred  MEMSAT  TMHMM

69 Exemple: TMHMM

70 Extracellulaire (outside) Cytoplasmique (inside)

71 Un p’tit exemple de convergence Colicine A (1COL:A): Protéine de surface des cellules/membranes. Domaine membranaire de translocation des toxines. (E. Coli). C-Phycocianine (1CPC:A): Pigment de l’appareil photosynthétique.(Cyanob actérie). Rmsd = 3.2Å Z-Score = 5.5 Sequence identity = 13.9% Aligned/gap positions = 115/16 Colicine A (1COL:A): Protéine de surface des cellules/membranes. Domaine membranaire de translocation des toxines. (E. Coli). C-Phycocianine (1CPC:A): Pigment de l’appareil photosynthétique.(Cyanob actérie). Rmsd = 3.2Å Z-Score = 5.5 Sequence identity = 13.9% Aligned/gap positions = 115/16


Télécharger ppt "Bioinformatique ABI-1001 2ème Partie: La Biologie Structurale Cours #2 Domaines, classification et prédictions 2ème Partie: La Biologie Structurale Cours."

Présentations similaires


Annonces Google