La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

serveurs spécialisés, programmes et BLAST …amélioré, Y-BLAST F-BLAST

Présentations similaires


Présentation au sujet: "serveurs spécialisés, programmes et BLAST …amélioré, Y-BLAST F-BLAST"— Transcription de la présentation:

1 serveurs spécialisés, programmes et BLAST …amélioré, Y-BLAST F-BLAST
Extension de BLAST serveurs spécialisés, programmes et BLAST …amélioré, Y-BLAST F-BLAST

2 Serveur Ensembl

3

4 Organisme particulier
TIGR

5 TIGR BLAST

6 ORTHOLOGUES

7 SERVEURS

8 SERVEURS

9 PROGRAMME (FASTA)

10 Variations autour de BLAST
WU BLAST algorithme dév. U. Washington MegaBLAST longues séq. DNA SSAHA Seq. Search & Alig. Hashing Algorthm (grande banque génomique découpée) BLAT BLAST-like alignment tool miroir de Blast qui construit des mots (11-mères) de la banque plutôt que de la requête

11 PSI = position specific iterated
-BLAST PSI = position specific iterated Fouiller plus loin dans une banque en utilisant une matrice construite spécifiquement pour la requête

12 1. Faire un blast de la requête
R,I,K C D,E,T K,R,T N,L,Y,G

13 2. Construire une matrice à partir des hits
A R N D C Q E G H I L K M F P S T W Y V 1 M 2 K 3 W 4 V 5 W 6 A 7 L 8 L 9 L 10 L 11 A 12 A 13 W 14 A 15 A 16 A ... 37 S 38 G 39 T 40 W 41 Y 42 A

14 score dépend de la position
A R N D C Q E G H I L K M F P S T W Y V 1 M 2 K 3 W 4 V 5 W 6 A 7 L 8 L 9 L 10 L 11 A 12 A 13 W 14 A 15 A 16 A ... 37 S 38 G 39 T 40 W 41 Y 42 A

15 Position Specific Scoring Matrix
► PSSM Position Specific Scoring Matrix 3. Re-BLAST de la banque avec PSSM comme matrice en utilisant une valeur pré-déterminée de E pour les HITS qui seront rapporté

16

17 on peut répéter cette opération jusqu’à l’obtention d’une convergence

18 résultats successifs # hits Itération # hits >seuil E 1 104 49

19 RBP4 vs b-Lactogl. Itération 1 RBP4 vs b-Lactogl. Itération 2
Score = 46.2 bits (108), Expect = 2e-04 Identities = 40/150 (26%), Positives = 70/150 (46%), Gaps = 37/150 (24%) Query: 27 VKENFDKARFSGTWYAMAKKDPEGLFLQDNIVAEFSVDETGQMSATAKGRVRLLNNWDVC 86 V+ENFD ++ G WY + +K P I A +S+ E G + K Sbjct: 33 VQENFDVKKYLGRWYEI-EKIPASFEKGNCIQANYSLMENGNIEVLNK ELS 82 Query: 87 ADMVGTF TDTEDPAKFKMKYWGVASFLQKGNDDHWIVDTDYDTYAVQYSCR 137 D GT PAK WI+ TDY+ YA+ YSC Sbjct: 83 PD--GTMNQVKGEAKQSNVSEPAKLEVQFFPLMP-----PAPYWILATDYENYALVYSCT 135 Query: LLNLDGTCADSYSFVFSRDPNGLPPE 163 L ++D R+P LPPE Sbjct: 136 TFFWLFHVD------FFWILGRNPY-LPPE 158 RBP4 vs b-Lactogl. Itération 1 Score = 140 bits (353), Expect = 1e-32 Identities = 45/176 (25%), Positives = 78/176 (43%), Gaps = 33/176 (18%) Query: 4 VWALLLLAAWAAAERDCRVSSF RVKENFDKARFSGTWYAMAKKDPEGLFLQD 55 V L+ LA A F V+ENFD ++ G WY + +K P Sbjct: 2 VTMLMFLATLAGLFTTAKGQNFHLGKCPSPPVQENFDVKKYLGRWYEI-EKIPASFEKGN 60 Query: 56 NIVAEFSVDETGQMSATAKGRVRLLNNWDVCADMV---GTFTDTEDPAKFKMKYWGVASF 112 I A +S+ E G + K D + V PAK Sbjct: 61 CIQANYSLMENGNIEVLNKEL-----SPDGTMNQVKGEAKQSNVSEPAKLEVQFFPL Query: 113 LQKGNDDHWIVDTDYDTYAVQYSCR----LLNLDGTCADSYSFVFSRDPNGLPPEA 164 +WI+ TDY+ YA+ YSC L ++D R+P LPPE Sbjct: MPPAPYWILATDYENYALVYSCTTFFWLFHVD------FFWILGRNPY-LPPET 159 RBP4 vs b-Lactogl. Itération 2

20 1ière 3ième Score = 46.2 bits (108), Expect = 2e-04
Identities = 40/150 (26%), Positives = 70/150 (46%), Gaps = 37/150 (24%) Query: 27 VKENFDKARFSGTWYAMAKKDPEGLFLQDNIVAEFSVDETGQMSATAKGRVRLLNNWDVC 86 V+ENFD ++ G WY + +K P I A +S+ E G + K Sbjct: 33 VQENFDVKKYLGRWYEI-EKIPASFEKGNCIQANYSLMENGNIEVLNK ELS 82 Query: 87 ADMVGTF TDTEDPAKFKMKYWGVASFLQKGNDDHWIVDTDYDTYAVQYSCR 137 D GT PAK WI+ TDY+ YA+ YSC Sbjct: 83 PD--GTMNQVKGEAKQSNVSEPAKLEVQFFPLMP-----PAPYWILATDYENYALVYSCT 135 Query: LLNLDGTCADSYSFVFSRDPNGLPPE 163 L ++D R+P LPPE Sbjct: 136 TFFWLFHVD------FFWILGRNPY-LPPE 158 1ière Score = 159 bits (404), Expect = 1e-38 Identities = 41/170 (24%), Positives = 69/170 (40%), Gaps = 19/170 (11%) Query: 3 WVWALLLLAAWAAAERD CRVSSFRVKENFDKARFSGTWYAMAKKDPEGLFLQ 54 V L+ LA A S V+ENFD ++ G WY + K Sbjct: 1 MVTMLMFLATLAGLFTTAKGQNFHLGKCPSPPVQENFDVKKYLGRWYEIEKIPASFE-KG 59 Query: 55 DNIVAEFSVDETGQMSATAKGRVRLLNNWDVCADMVGTFTDTEDPAKFKMKYWGVASFLQ 114 + I A +S+ E G + K V PAK Sbjct: 60 NCIQANYSLMENGNIEVLNKELSPDGTMNQVKGE--AKQSNVSEPAKLEVQFFPL Query: 115 KGNDDHWIVDTDYDTYAVQYSCRLLNLDGTCADSYSFVFSRDPNGLPPEA 164 +WI+ TDY+ YA+ YSC R+P LPPE Sbjct: 113 MPPAPYWILATDYENYALVYSCTTFFWL--FHVDFFWILGRNPY-LPPET 159 3ième

21 Univers des lipocalines
retinol-binding protein odorant-binding protein apolipoprotein D

22 Scoring matrices let you focus on the big (or small) picture
retinol-binding protein votre requête

23 Jeu de matrice standard
PAM250 PAM30 retinol-binding protein retinol-binding protein Blosum80 Blosum45

24 PSI-BLAST►PSSM retinol-binding protein retinol-binding protein

25 PSI-BLAST: évaluation de performance
Évaluation dans une banque restreinte où les protéines ont moins de 40% indentité.

26 PSI-BLAST: la corruption
PSI-BLAST est très utile pour trouver de relations ténues mais biologiquement significatives. On peut voir apparaître de faux positifs si on introduit des motifs dans le PSSM. Expl: un coiled coil va introduire des centaines de nouvelles protéines non reliées Une fois qu’un intrus est admis dans la PSSM, il n’y a aucun moyen de se débarasser de son poids statistique.

27 Les intrus (faux positifs)
Générés souvent par le hit d’une protéine à plusieurs domaines (le nouveau domaine est introduit dans la PSSM) Les éviter en haussant la valeur de E ou en faisant un examen visuel des nouveaux hits.

28

29 PHI = Pattern Hit Intiated BLAST
f-BLAST PHI = Pattern Hit Intiated BLAST Même page que PSI-BLAST Cherche le match avec une expression particulière qui constitue le patron (pattern). ??? Quelles protéines contiennent le patron donné et sont homologues dans le voisinage de ce patron.

30 Création d’un patron GXW[YF][EA][IVLM]
ecblc MRLLPLVAAA TAAFLVVACS SPTPPRGVTV VNNFDAKRYL GTWYEIARFD vc MRAIFLILCS V...LLNGCL G..MPESVKP VSDFELNNYL GKWYEVARLD hsrbp ~~~MKWVWAL LLLAAWAAAE RDCRVSSFRV KENFDKARFS GTWYAMAKKD GTWYEI K AV M Alignement RBP4 et 2 lipocal. bct récurrence GXW[YF][EA][IVLM] écriture du patron

31

32

33 Syntaxe pour PHI-BLAST
Convention PROSITE [ ] signifie que n’importe lequel de ces caractères est admissible e.g., [LFYT] signifie L ou F ou Y ou T x(5) signifie 5 positions où n’importe quel résidu est autorisé x(2,4) = 2 à 4 positions où n’importe quel résidu est autorisé

34 Semaine prochaine Examen en 2 parties


Télécharger ppt "serveurs spécialisés, programmes et BLAST …amélioré, Y-BLAST F-BLAST"

Présentations similaires


Annonces Google