Télécharger la présentation
La présentation est en train de télécharger. S'il vous plaît, attendez
1
La banque UniprotKB et le logiciel Blast
2
UniProtKB Disponible depuis n’importe quel navigateur web
3
Un exemple de recherche de protéine
4
+ Histoire d’UniProtKB 2002 : UniProtKB 1986 : SwissProt
Institut Européen de Bioinformatique Protein Information Ressource
5
Organisation de la banque de données
protéines Données entrées automatiquement, par analyse informatique de génomes Résultats parfois peu fiables (identification des séquences codantes automatiques et déductions des fonctions par comparaison aux protéines connues) protéines, +2M le mois dernier Données entrées à la main Résultats vérifiés, issus d’articles scientifiques, références systématiques. protéines, +600/mois
6
Evolution du nombre de protéines de la banque Tr-EMBL
7
Comment identifier automatiquement une protéine ?
4 types de preuves : au niveau protéique % au niveau transcriptionnel % déduction par homologie % Prédiction par analyse de séquence %
8
Comment identifier automatiquement une protéine ?
La prédiction par analyse de séquence Identification des CDS (CoDing Sequence) et non des ORF (Open Reading Frame) Trouver le cadre de lecture : zone pauvre en codons stop Identifier les séquences proches de séquences connues Chez les eucaryotes : le problème des introns/exons -> reconnaissance statistique
9
Quelques exemples d’utilisation
16
Le logiciel BLAST Basic Alignment Search Tool
20
Principales utilisations de ces outils
C’est avant tout une mine d’informations sur les protéines ! Pour l’identification d’une nouvelle protéine : travail préliminaire de comparaison aux protéines connues Etude de mécanismes d’évolution Travail statistique général sur les protéines
21
Statistiques générales
Composition en acides aminés 5.1 Composition in percent for the complete database Ala (A) Gln (Q) Leu (L) 9.96 Ser (S) Arg (R) Glu (E) 6.22 Lys (K) Thr (T) Asn (N) 4.11 Gly (G) Met (M) Trp (W) 1.28 Asp (D) His (H) Phe (F) 4.05 Tyr (Y) Cys (C) Ile (I) 6.10 Pro (P) Val (V) Asx (B) Glx (Z) Xaa (X) 0.02 Taille des séquences
22
Conclusion
Présentations similaires
© 2024 SlidePlayer.fr Inc.
All rights reserved.