La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Gscope Loutil bio-informatique pour la génomique structurale.

Présentations similaires


Présentation au sujet: "Gscope Loutil bio-informatique pour la génomique structurale."— Transcription de la présentation:

1 Gscope Loutil bio-informatique pour la génomique structurale

2 Gscope pour le biologiste Automatise la cascade des programmes –Crée et gère les données –Les visualise Recherche de cibles à l échelle génomique Annotation... Gscope est aussi une boîte à outils bio-informatique

3 - Alignments - Trees - Phylo profils - Hydrophobicity BlastP : - Best hits - Hits count tBlastN : - Presence/abs in other organisms - Two Gene Cluster - Detection of putative ORFs not created - Nuc sequence - Prot sequence - Intergenic regions - GC content & Codon Usage - ShineDalgarno DNA and/or Proteome ORFs determination (Glimmer,tRNAScan) Database searches BlastP on SwissProt, TrEmbl tBlastN on complete genomes MultiAlignment of Complete Sequences Ballast on BlastP output DbClustal Integrated analysis & Visualization tool - Two Gene Cluster Analysis - Wrong start codon detection - Phylogenetic analysis - Recombination - Gene losses - Functions - Annotation Database creation

4 Séquences ? un génome fraîchement séquencé (P.abyssi) tous les génomes petits existants (V.cholera…) un groupe fonctionnel (TFIIH) une famille de protéines (synthétases, NR, ERco) un...ome (ribosome, péroxisome) une séquence (la vôtre). …

5 Deux regards Structural … je veux des cristaux ! –ORF quality (overlap, validation du codon start, …) –organisation en domaines ( local vs global,... ) –productivité (codon usage vs coli or yeast, hydrophobicité) Phylogénomique … qui suis-je, doù je viens ? –annotation, recherche de fonction –bilan présence/absence dans autres organismes, transferts horizontaux, cluster maintenance –bilan de paralogie –bilan phylogénomique –etc.

6 Intègration et automatisation des outils existants Lecture de données –formats TFA, EMBL, GenBank, texte,… –liste de accession numbers Détermination des ORFs –Glimmer, tRNA_Scan –Création des séq nuc et prot Analyse ADN –composition, codon usage, –biais GC, ShineDalgarno BlastP, TBlastN, BlastX –SwissProt, TrEmbl, PDB – Human, CompleteGenomes –… Ballast, DbClustal, –LMS et alignements multiples –avec test de qualité – BestDefinition + Secator, Ordali –>> groupes, domaines Phylogénie

7 Visualisation

8 Coloration/Liste Séquence Orthologues –blast, alignements –présence/absence –paralogues Info structurale –PDB –codon adaptation index –hydrophobicité Phylogénie –folle –fonction

9 Ce quil faut pour démarrer... une liste de séquences –accession numbers –fichiers existants un fichier ADN (génome complet ou non) une suite de contigs un fichier GenBank avec ADN et protéome... Gscope lit, convertit, vérifie, recherche, range.

10 - Nuc sequence - Prot sequence - Intergenic regions - GC content & Codon Usage - ShineDalgarno BlastP : - Best hits - Hits count tBlastN : - Presence/abs in other organisms - Two Gene Cluster - Detection of putative ORFs not created - Alignments - Trees - Phylo profils - Hydrophobicity DNA and/or Proteome ORFs determination (Glimmer,tRNAScan) Database searches BlastP on SwissProt, TrEmbl tBlastN on complete genomes MultiAlignment of Complete Sequences Ballast on BlastP output DbClustal Integrated analysis & Visualization tool - Two Gene Cluster Analysis - Wrong start codon detection - Phylogenetic analysis - Recombination - Gene losses - Functions - Annotation Database creation ORF quality

11 ORF quality la séquence est-elle bien définie ? (existe, start, stop, frame-shift) protéome connu ou Glimmer, tRNAscan overlap, biais en composition beaucoup ou pas dorthologues (Blastp, Tblastn) validité du codon start (Secator, DbClustal)... mauvais splicing

12 Validité du codon start beaucoup d erreurs dans les banques overlap –peu probable –sauf overlap de un ( TAA ATG > TAATG ) alignements des codons start –DbClustal le permet (méthode globale) –pour les séquences du groupe Secator en particulier –s il y en a suffisamment … si en plus apparaît la séquence de Shine-Dalgarno ! Codon start 1/3

13 Codon start 2/3

14 Codon start 3/3

15 - Alignments - Trees - Phylo profils - Hydrophobicity BlastP : - Best hits - Hits count tBlastN : - Presence/abs in other organisms - Two Gene Cluster - Detection of putative ORFs not created - Nuc sequence - Prot sequence - Intergenic regions - GC content & Codon Usage - ShineDalgarno DNA and/or Proteome ORFs determination (Glimmer,tRNAScan) Database searches BlastP on SwissProt, TrEmbl tBlastN on complete genomes MultiAlignment of Complete Sequences Ballast on BlastP output DbClustal Integrated analysis & Visualization tool - Two Gene Cluster Analysis - Wrong start codon detection - Phylogenetic analysis - Recombination - Gene losses - Functions - Annotation Database creation Production

16 Codon adaptation index vs E.coli or S.cerevisiae Hydrophobicité, hélices transmembranaires Orthologues dans la PDB –existence –fragments Mise en évidence de domaines –par l alignement –si opposition local (blast) - global (DbClustal) –… à suivre

17

18 DNA and/or Proteome ORFs determination (Glimmer,tRNAScan) - Nuc sequence - Prot sequence - Intergenic regions - GC content & Codon Usage - ShineDalgarno Database searches BlastP on SwissProt, TrEmbl tBlastN on complete genomes MultiAlignment of Complete Sequences Ballast on BlastP output DbClustal BlastP : - Best hits - Hits count tBlastN : - Presence/abs in other organisms - Two Gene Cluster - Detection of putative ORFs not created Integrated analysis & Visualization tool - Two Gene Cluster Analysis - Wrong start codon detection - Phylogenetic analysis - Recombination - Gene losses - Functions - Annotation - Alignments - Trees - Phylo profils - Hydrophobicity Database creation Phylogenomic

19 Phylogénomique Bilan de présence/absence dans les génomes complets –TBlastN Phylo folle –Biais en GC –Arbre phylogénétique non conforme (pertes ou transferts)

20

21

22 Un exemple de protocole d analyse mis au point par Marc sur ERco pour mettre en évidence les domaines structuraux Faire un alignement avec toutes les séquences du blastp Définir les groupes avec Secator Choisir un représentant par groupe Puis –Rechercher les domaines existants (ProDom par exemple) –PDB –Prédictions de structures secondaires, profil hydrophobicité, … –Sites de coupures aux protéases (trypsine, …) –VRP –information bibliographique (fonction, mutants, …) à l aide de Gscope, qui l automatisera bientôt...

23 Perspectives Eucaryotes supérieurs –mauvais épissage –intégration des Est –étude promoteurs Informations sur les domaines et motifs –Ballast –Correlator –Domainol –data mining Utilisation –protocole automatique de recherche de cibles (Shankar) –RELACS (RELational Alignement of Complete Sequences) De mieux en mieux Web … mais ça marche déjà !!!

24

25


Télécharger ppt "Gscope Loutil bio-informatique pour la génomique structurale."

Présentations similaires


Annonces Google