La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

La banque UniprotKB et le logiciel Blast. UniProtKB Disponible depuis nimporte quel navigateur web.

Présentations similaires


Présentation au sujet: "La banque UniprotKB et le logiciel Blast. UniProtKB Disponible depuis nimporte quel navigateur web."— Transcription de la présentation:

1 La banque UniprotKB et le logiciel Blast

2 UniProtKB Disponible depuis nimporte quel navigateur web

3 Un exemple de recherche de protéine

4 Histoire dUniProtKB 1986 : SwissProt : UniProtKB Institut Européen de Bioinformatique Protein Information Ressource

5 Organisation de la banque de données Données entrées à la main Résultats vérifiés, issus darticles scientifiques, références systématiques protéines, +600/mois protéines Données entrées automatiquement, par analyse informatique de génomes Résultats parfois peu fiables (identification des séquences codantes automatiques et déductions des fonctions par comparaison aux protéines connues) protéines, +2M le mois dernier

6 Evolution du nombre de protéines de la banque Tr-EMBL

7 Comment identifier automatiquement une protéine ? 4 types de preuves : – au niveau protéique 0.05% – au niveau transcriptionnel 2% – déduction par homologie 23% – Prédiction par analyse de séquence 75%

8 Comment identifier automatiquement une protéine ? La prédiction par analyse de séquence Identification des CDS (CoDing Sequence) et non des ORF (Open Reading Frame) Trouver le cadre de lecture : zone pauvre en codons stop Identifier les séquences proches de séquences connues Chez les eucaryotes : le problème des introns/exons -> reconnaissance statistique

9 Quelques exemples dutilisation

10

11

12

13

14

15

16 Le logiciel BLAST Basic Alignment Search Tool

17

18

19

20 Principales utilisations de ces outils Cest avant tout une mine dinformations sur les protéines ! Pour lidentification dune nouvelle protéine : travail préliminaire de comparaison aux protéines connues Etude de mécanismes dévolution Travail statistique général sur les protéines

21 Statistiques générales Composition en acides aminés 5.1 Composition in percent for the complete database Ala (A) 8.66 Gln (Q) 3.99 Leu (L) 9.96 Ser (S) 6.55 Arg (R) 5.35 Glu (E) 6.22 Lys (K) 5.33 Thr (T) 5.55 Asn (N) 4.11 Gly (G) 7.08 Met (M)2.49 Trp (W) 1.28 Asp (D) 5.34 His (H) 2.19 Phe (F) 4.05 Tyr (Y) 3.08 Cys (C) 1.19 Ile (I) 6.10 Pro (P) 4.56 Val (V) 6.80 Asx (B) Glx (Z) 0 Xaa (X) 0.02 Taille des séquences

22 Conclusion


Télécharger ppt "La banque UniprotKB et le logiciel Blast. UniProtKB Disponible depuis nimporte quel navigateur web."

Présentations similaires


Annonces Google