Télécharger la présentation
La présentation est en train de télécharger. S'il vous plaît, attendez
Publié parMaugier Maire Modifié depuis plus de 9 années
1
serveurs spécialisés, programmes et BLAST …amélioré, Y-BLAST F-BLAST
Extension de BLAST serveurs spécialisés, programmes et BLAST …amélioré, Y-BLAST F-BLAST
2
Serveur Ensembl
4
Organisme particulier
TIGR
5
TIGR BLAST
6
ORTHOLOGUES
7
SERVEURS
8
SERVEURS
9
PROGRAMME (FASTA)
10
Variations autour de BLAST
WU BLAST algorithme dév. U. Washington MegaBLAST longues séq. DNA SSAHA Seq. Search & Alig. Hashing Algorthm (grande banque génomique découpée) BLAT BLAST-like alignment tool miroir de Blast qui construit des mots (11-mères) de la banque plutôt que de la requête
11
PSI = position specific iterated
-BLAST PSI = position specific iterated Fouiller plus loin dans une banque en utilisant une matrice construite spécifiquement pour la requête
12
1. Faire un blast de la requête
R,I,K C D,E,T K,R,T N,L,Y,G
13
2. Construire une matrice à partir des hits
A R N D C Q E G H I L K M F P S T W Y V 1 M 2 K 3 W 4 V 5 W 6 A 7 L 8 L 9 L 10 L 11 A 12 A 13 W 14 A 15 A 16 A ... 37 S 38 G 39 T 40 W 41 Y 42 A
14
score dépend de la position
A R N D C Q E G H I L K M F P S T W Y V 1 M 2 K 3 W 4 V 5 W 6 A 7 L 8 L 9 L 10 L 11 A 12 A 13 W 14 A 15 A 16 A ... 37 S 38 G 39 T 40 W 41 Y 42 A
15
Position Specific Scoring Matrix
► PSSM Position Specific Scoring Matrix 3. Re-BLAST de la banque avec PSSM comme matrice en utilisant une valeur pré-déterminée de E pour les HITS qui seront rapporté
17
on peut répéter cette opération jusqu’à l’obtention d’une convergence
18
résultats successifs # hits Itération # hits >seuil E 1 104 49
19
RBP4 vs b-Lactogl. Itération 1 RBP4 vs b-Lactogl. Itération 2
Score = 46.2 bits (108), Expect = 2e-04 Identities = 40/150 (26%), Positives = 70/150 (46%), Gaps = 37/150 (24%) Query: 27 VKENFDKARFSGTWYAMAKKDPEGLFLQDNIVAEFSVDETGQMSATAKGRVRLLNNWDVC 86 V+ENFD ++ G WY + +K P I A +S+ E G + K Sbjct: 33 VQENFDVKKYLGRWYEI-EKIPASFEKGNCIQANYSLMENGNIEVLNK ELS 82 Query: 87 ADMVGTF TDTEDPAKFKMKYWGVASFLQKGNDDHWIVDTDYDTYAVQYSCR 137 D GT PAK WI+ TDY+ YA+ YSC Sbjct: 83 PD--GTMNQVKGEAKQSNVSEPAKLEVQFFPLMP-----PAPYWILATDYENYALVYSCT 135 Query: LLNLDGTCADSYSFVFSRDPNGLPPE 163 L ++D R+P LPPE Sbjct: 136 TFFWLFHVD------FFWILGRNPY-LPPE 158 RBP4 vs b-Lactogl. Itération 1 Score = 140 bits (353), Expect = 1e-32 Identities = 45/176 (25%), Positives = 78/176 (43%), Gaps = 33/176 (18%) Query: 4 VWALLLLAAWAAAERDCRVSSF RVKENFDKARFSGTWYAMAKKDPEGLFLQD 55 V L+ LA A F V+ENFD ++ G WY + +K P Sbjct: 2 VTMLMFLATLAGLFTTAKGQNFHLGKCPSPPVQENFDVKKYLGRWYEI-EKIPASFEKGN 60 Query: 56 NIVAEFSVDETGQMSATAKGRVRLLNNWDVCADMV---GTFTDTEDPAKFKMKYWGVASF 112 I A +S+ E G + K D + V PAK Sbjct: 61 CIQANYSLMENGNIEVLNKEL-----SPDGTMNQVKGEAKQSNVSEPAKLEVQFFPL Query: 113 LQKGNDDHWIVDTDYDTYAVQYSCR----LLNLDGTCADSYSFVFSRDPNGLPPEA 164 +WI+ TDY+ YA+ YSC L ++D R+P LPPE Sbjct: MPPAPYWILATDYENYALVYSCTTFFWLFHVD------FFWILGRNPY-LPPET 159 RBP4 vs b-Lactogl. Itération 2
20
1ière 3ième Score = 46.2 bits (108), Expect = 2e-04
Identities = 40/150 (26%), Positives = 70/150 (46%), Gaps = 37/150 (24%) Query: 27 VKENFDKARFSGTWYAMAKKDPEGLFLQDNIVAEFSVDETGQMSATAKGRVRLLNNWDVC 86 V+ENFD ++ G WY + +K P I A +S+ E G + K Sbjct: 33 VQENFDVKKYLGRWYEI-EKIPASFEKGNCIQANYSLMENGNIEVLNK ELS 82 Query: 87 ADMVGTF TDTEDPAKFKMKYWGVASFLQKGNDDHWIVDTDYDTYAVQYSCR 137 D GT PAK WI+ TDY+ YA+ YSC Sbjct: 83 PD--GTMNQVKGEAKQSNVSEPAKLEVQFFPLMP-----PAPYWILATDYENYALVYSCT 135 Query: LLNLDGTCADSYSFVFSRDPNGLPPE 163 L ++D R+P LPPE Sbjct: 136 TFFWLFHVD------FFWILGRNPY-LPPE 158 1ière Score = 159 bits (404), Expect = 1e-38 Identities = 41/170 (24%), Positives = 69/170 (40%), Gaps = 19/170 (11%) Query: 3 WVWALLLLAAWAAAERD CRVSSFRVKENFDKARFSGTWYAMAKKDPEGLFLQ 54 V L+ LA A S V+ENFD ++ G WY + K Sbjct: 1 MVTMLMFLATLAGLFTTAKGQNFHLGKCPSPPVQENFDVKKYLGRWYEIEKIPASFE-KG 59 Query: 55 DNIVAEFSVDETGQMSATAKGRVRLLNNWDVCADMVGTFTDTEDPAKFKMKYWGVASFLQ 114 + I A +S+ E G + K V PAK Sbjct: 60 NCIQANYSLMENGNIEVLNKELSPDGTMNQVKGE--AKQSNVSEPAKLEVQFFPL Query: 115 KGNDDHWIVDTDYDTYAVQYSCRLLNLDGTCADSYSFVFSRDPNGLPPEA 164 +WI+ TDY+ YA+ YSC R+P LPPE Sbjct: 113 MPPAPYWILATDYENYALVYSCTTFFWL--FHVDFFWILGRNPY-LPPET 159 3ième
21
Univers des lipocalines
retinol-binding protein odorant-binding protein apolipoprotein D
22
Scoring matrices let you focus on the big (or small) picture
retinol-binding protein votre requête
23
Jeu de matrice standard
PAM250 PAM30 retinol-binding protein retinol-binding protein Blosum80 Blosum45
24
PSI-BLAST►PSSM retinol-binding protein retinol-binding protein
25
PSI-BLAST: évaluation de performance
Évaluation dans une banque restreinte où les protéines ont moins de 40% indentité.
26
PSI-BLAST: la corruption
PSI-BLAST est très utile pour trouver de relations ténues mais biologiquement significatives. On peut voir apparaître de faux positifs si on introduit des motifs dans le PSSM. Expl: un coiled coil va introduire des centaines de nouvelles protéines non reliées Une fois qu’un intrus est admis dans la PSSM, il n’y a aucun moyen de se débarasser de son poids statistique.
27
Les intrus (faux positifs)
Générés souvent par le hit d’une protéine à plusieurs domaines (le nouveau domaine est introduit dans la PSSM) Les éviter en haussant la valeur de E ou en faisant un examen visuel des nouveaux hits.
29
PHI = Pattern Hit Intiated BLAST
f-BLAST PHI = Pattern Hit Intiated BLAST Même page que PSI-BLAST Cherche le match avec une expression particulière qui constitue le patron (pattern). ??? Quelles protéines contiennent le patron donné et sont homologues dans le voisinage de ce patron.
30
Création d’un patron GXW[YF][EA][IVLM]
ecblc MRLLPLVAAA TAAFLVVACS SPTPPRGVTV VNNFDAKRYL GTWYEIARFD vc MRAIFLILCS V...LLNGCL G..MPESVKP VSDFELNNYL GKWYEVARLD hsrbp ~~~MKWVWAL LLLAAWAAAE RDCRVSSFRV KENFDKARFS GTWYAMAKKD GTWYEI K AV M Alignement RBP4 et 2 lipocal. bct récurrence GXW[YF][EA][IVLM] écriture du patron
33
Syntaxe pour PHI-BLAST
Convention PROSITE [ ] signifie que n’importe lequel de ces caractères est admissible e.g., [LFYT] signifie L ou F ou Y ou T x(5) signifie 5 positions où n’importe quel résidu est autorisé x(2,4) = 2 à 4 positions où n’importe quel résidu est autorisé
34
Semaine prochaine Examen en 2 parties
Présentations similaires
© 2024 SlidePlayer.fr Inc.
All rights reserved.