Nouveaux services et projet d’évolution de la plate-forme Esther KABORÉ Emmanuelle MORIN Anne-Sophie VALIN
Services adaptés Blast contre banque personnelle génération de fichiers aux formats souhaités Antigenic recherche de motifs antigéniques dans les protéines possibilité d’amélioration du résultat
Génération d’amorces Mise en évidence de marqueurs CAPS digestion virtuelle avec restrict alignement avec affichage des coupures uniques, validation avec l’alignement Amorces microsatellites cartographie de génome enchaînement Sputnik et Primer3 génération d’un fichier résultat compatible avec Excel®
Amorces dégénérées 1 ère étape: alignement – séquence consensus séquence consensus avec menu déroulant 2 ème étape: sélection des blocs significatifs détermination des AA ambigus choix de la séquence de référence
Étape de sélection
Amorces dégénérées suite 3 ème étape : validation des blocs et de l’espèce de référence 4 ème étape : dégénération des blocs à partir extrémité 3’ code génétique dégénéré jusqu’à 64x Ex : GAY coût = 2x table d’usage des codons de l’espèce de référence pour la suite
Affichage des amorces dégénérées ordre décroissant de dégénérescence maximum 64x
Pouvez-vous m’aider ? FAQ sur genouest.org poser une question consulter les questions déjà posées Esther : Anne-Sophie : Emmanuelle :
Projet d’évolution rénovation du site web accent sur l’ergonomie, la convivialité appel d’offre courant octobre 2004 mise en ligne 1er semestre 2005
Esther KABORÉ Base de données Base de données spécialisées BASE
L ’ acc è s aux donn é es g é nomiques dans OUEST-genopole ® Construction de bases de donn é es sp é cialis é es BASE:Un serveur de donn é es pour les donn é es du transcriptome
De nombreuses banques publiques disponibles localement NomDate dernière maj Fréq. Maj majeures GenBank 14410/20046/ année EMBL 8009/20043/ année GenPept 14411/20046 / année PIR-Protein /20043/ année NRL_3D /2001Non définie SWISS-PROT 45 10/20043/ année SP-TREMBL 2810/20043 / année Pfam 1611/2004Non définie Imgt /20041 / semaine
Les garanties de la plate-forme Le suivi des nouvelles sources de données disponibles; Des banques à jour; Des banques disponibles localement pour du calcul intensif spécialisé et/ou sécurisé; Un environnement complet d’utilisation.
Banques de génomes complets G é nomes Eucaryotes: Homo sapiens, Mus musculus, Ratus Norvegicus, Oryza sativa, Plasmodium falciparum, Caenorhabditis elegans, Saccharomyces serevisiae, Drosophila melagongaster, Encephalitozoon cuniculi, … G é nomes Bact é riens: Escherichia coli, Prochloroccocus marinus, Salmonella typhi, Staphylococcus aureus, vibrio cholerae, Neisseria meningitidis Yersinia pestis, …
Quels services/besoins sur les banques de génomes complets ? Services proposés actuellement : Blast Recherche de motifs (STAN) Generic Genome Browser ( bin/GGB/gbrowse) bin/GGB/gbrowse Autres besoins ?
Construction de bases de données spécialisées Définir les données spécifiques au sujet d’étude d’un labo; Regrouper des données non redondantes sur ce sujet; Les consulter facilement via une base de données; Vérifier et mettre à jour régulièrement ces données; Rajouter des fonctionnalités dédiées à cet ensemble de données
Développement de bases de données spécialisées St Pole Brest Rennes Nantes Angers LERIA Base de données spécialisée des huitres: 20 espèces Environ 7000 séquences Base de données spécialisée des algues Base de données spécialisée des semences en phase de germination (Pisum sativum, Arabidopsis thaliana, Medicago truncatula) Base de données spécialisée du xenope: Xenopus laevis ( séquences) Xenopus tropicalis ( séquences) Base de données spécialisée du chou fleur BRETAGNE BIOTECHNOLOGIE VEGETALE (BBV) Base de données spécialisée du rosier (5000 séquences d’EST)
Platform: Linux Operating System MySQL Database Apache Webserver PHP, C++ Server computer(s) Interface: Entirely Web-based Personal User Accounts & Workspace User-level sharing of files, projects, and data Link to other databases (NCBI, UniGene, etc) Plug-in architecture for analysis modules BASE: un serveur de données pour le transcriptome
BASE Server Users Many users can simultaneously access BASE over a web interface Collaborators BASE runs as a server Installed locally in a lab or institute BASE : le serveur
Transformation Plots,Histograms, and Tables Experiment Explorer Data Export Plug-In Architecture Quantitated Data Matrix Image(s) Sample Annotation Biomaterial Reporter Annotation Array Well Annotation Hybridization Filter Analysis Annotation Type ExtractsArray Design Experiment Administrator Users Definitions Array LIMS Labeled Extracts Workflow
“Plug-Ins”: Architecture for easy addition of your own transformation and analysis modules to BASE Proof-of-concept – BASE 1.0 included 2 plug-ins: Normalization (LOWESS, mean/median intensity) Multi-Dimensional Scaling (MDS) Import/Export: Import any data format using “Import Wizard” Export data in standard formats (ie Eisen cluster, MAGE-ML, J-Express, Expression Profiler, tab delimited, etc) L’analyse de données dans BASE
iptome
Anne-Sophie VALIN Recherche de motifs Découverte de motifs
Recherche et découverte de motifs Recherche de motifs : on connaît le motif on cherche ses occurrences Découverte de motif : on ne connaît pas le motif on cherche à mettre en évidence des motifs intéressants
Plate-forme de découverte de motif
Plate-forme de recherche de motif
Les outils de recherche de motif Grappe 3.0 Projet Adage (LORIA) Gregory Kucherov, Paul Zimmermann, Eric Queffelec, Sébastien Briais STAN 1.0 Projet Symbiose Jacques Nicolas, Patrick Durand, Grégory Ranchy, Anne-Sophie Valin WAPAM (disponible en décembre) Projet Symbiose Mathieu Giraud, Dominique Lavenier
Grappe 3.0
Exemple de recherche ATTT#?ACCA[CA]
Résultats
Mise à profit des données disponibles en local STAN (Motif nucléique et protéique) Génomes (version 1.0 : Athaliana, celegans,drosophile,encephalitozoon) WAPAM (Motif protéique) Génomes Banques de données
STAN (Suffix Tree ANalyser) Format du motif: Succession de bases ABCD avec A, B, C et D différentes bases. Disjonction de mots [A|C] avec A et C deux ensemble de bases Disjonction de bases [ABC] avec A, B et C différentes bases GAP de taille fixe x(num) avec num la taille du gap. GAP de taille variable x(num1,num2), avec la taille du gap comprise entre num1 et num2 Succession de bases avec erreur de substitution pattern:num Élément SVG X:[num] ou X:[min,max] suivi de X dans le motif ou de ~X pour le palindrome de X
Exemple CTAGATTTTAA:2-X:[7]-x(4)-~X:5-ACGATTT:1
Interface Graphique
Mise à profit des données disponibles en local STAN (Motif nucléique et protéique) Génomes (version 1.0 : Athaliana, celegans,drosophile,encephalitozoon) WAPAM (Motif protéique) Génomes Banques de données
WAPAM Format du motif: PROSITE Motifs avec erreurs
WAPAM
Interface graphique
Questions ?