Historique Juillet 2000 : Dépôt d'un dossier Génopole Ouest auprès du Ministère Mars 2001 : expertise sur site par des experts internationaux Juillet 2001 : Génopole Ouest est officiellement retenue comme une génopole test Janvier 2002 : labellisation Ouest-genopole Septembre 2002 : recrutement de E.Kaboré et E. Morin Juillet 2003 : recrutement de A.-S. Vallin
Le rôle Séquençage Génotypage Biopuces Exploration fonctionnelle Bio-Informatique Recherche Service Protéomique
Les acteurs LERIA U533 Organisme porteur: IRISA / INRIA - Rennes Roscoff Brest Rennes Nantes Angers LERIA U533
Les interactions Autres Plate-formes Plate-forme Bio-Informatique Outils Production Analyse Exploitation Données brutes Stockage Archivage élaborées Gestion Domaine de Recherche bioinfo Méthodes Prototypes Veille outils problèmes
Accueil du site News Menu Accès site principal Utilisez ce modèle pour créer des pages Web intranet au sujet de votre groupe de travail ou projet. Vous pouvez ajouter vos propres informations au contenu du modèle et même modifier la structure du site Web en ajoutant ou supprimant des diapositives. Les contrôles de navigation se trouvent sur le masque des diapositives. Pour les modifier, pointez dans le menu Affichage sur Masque, puis cliquez sur Masque des diapositives. Pour ajouter ou supprimer des liens hypertexte sur du texte ou des objets, ou modifier des liens hypertexte, sélectionnez le texte ou l'objet voulu, puis cliquez dans le menu Insertion sur Lien hypertexte. Une fois vos modifications terminées, supprimez ces commentaires pour diminuer la taille de vos fichiers HTML finaux. Pour plus d'informations, interrogez l'aide intuitive sur : Masque des diapositives Liens hypertexte
Pourquoi ? «Vitrine» de la plate-forme valorisation des applications issues de la recherche en bio-informatique accès à des outils spécifiques Mission de service Information / animation Propositions de formation
Pour qui ? Les biologistes de OUEST_genopole® Ouverture nationale prévue pour les outils exclusifs » Evolution du site grâce: aux échanges lors de rencontres aux collaborations avec les biologistes veille : apparition de nouveaux outils à la FAQ du site web
Plan du site Accueil présentation outils Accès aux outils locaux Accès à des outils externes
Les outils disponibles
Outils locaux Wisconsin package standard Blast Multiple rare FastMe rare Plate-forme de découverte de motifs exclusif GenoFrag exclusif
GenoFrag
Plan du site Accueil présentation outils FAQ banques Poser une question Consulter les questions déjà posées banques Description des banques présentes sur le serveur Procédure de rapatriement Accès outils liés outils Accès aux outils locaux Accès à des outils externes
La foire aux questions
Plan du site Accueil présentation emplois outils FAQ banques Dépôt demande OUEST-genopole & autres formations Inscription information Accueil présentation emplois outils Accès aux outils locaux Accès à des outils externes FAQ Poser une question Consulter les questions déjà posées banques Description des banques présentes sur le serveur Procédure de rapatriement Accès outils liés
Formations & emplois
Liens externes Accueil Séminaires Plate-forme Bio-informatique outils OUEST_genopole® et Plate-forme Bio-informatique site principal Accès à des outils externes outils
Projets Analyse du génome chromosome par chromosome Aide à l’annotation des séquences bactériennes; Blast contre les génomes bactériens; Analyse syntaxique de génomes. 3 programmes : Plus d’infos sur : http://www.genostar.org Blast utile pour GenoFrag
De nombreuses banques publiques avec un suivi des versions, et des mises à jour intermédiaires Available databases: GenBank Release 139.0 (12/2003) EMBL Release 77 (12/2003) GenPept Release 139.0 (01/2004) PIR-Protein Release 78 (11/2003) NRL_3D Release 28.0 (01/2001) SWISS-PROT Release 42.0 (10/2003) SP-TREMBL Release 25 (11/2003) PROSITE Release 17.18 (08/2002) Pfam Release 10.0 (08/2003) Restriction Enzymes (REBASE) (06/2002) Imgt Release 200343-6 (11/2003) Imgt HLA Release 2.2 (07/2003) GoldenH Release 34 (10/2003) GoldenM Release mmFeb2003 (07/2003) Sbase Release 9 (08/2003)
Rsync possibilité pour chaque labo d ’avoir une copie locale des banques disponibles sur la plate-forme. Une fiche indiquant la procédure à suivre est disponible sur le site de la plate-forme oasis[10:51]%rsync idefix.univ-rennes1.fr:: Welcome to the Ouest-genopole database rsync service test module used for testing rsyncd (some files...) gcgdata bases au format gcg genbank genbank courant (ATTENTION A LA TAILLE > 80 Goctets) pfam pfam nr NR swissprot swissprot human_gen genome humain genomes une collection de genomes
Tous les génomes eucaryotes
Nombreux génomes bactériens
Des génomes d’archae
Construction de bases de données spécialisées Objectifs: Définir les données spécifiques au sujet d’étude d’un laboratoire; Regrouper des données non redondantes sur ce sujet; Les consulter facilement via une base de données; Vérifier et mettre à jour régulièrement ces données; Rajouter des fonctionnalités dédiées à cet ensemble de données
Construction de bases de données spécialisées, exemple : la base de données spécialisée des huîtres
Comment ? Recherche et chargement des données Via un script exécuté par cron Utilise principalement l’outil Entrez du NCBI Banques sources: GenBank, EMBL, DDBJ, DBEst, Unigene, GenPept, Swiss-Prot, PIR, PRF, PDB, etc… Validation des données chargées par l’utilisateur
Visualisation des données La structuration des données est un paramètre défini par l’utilisateur.
Zoom sur une séquence
Séquence au format d’origine
Blast Blasts des séquences de la base de données spécialisée contre des banques publiques
Blast contre la base spécialisée le résultat est envoyé par mail
Recherche de séquences par mot clé, par numéro d ’accession ou par identifiant genbank Autant de numéro d ’accession ou d ’identifiants genbank que vous le souhaitez, séparés par des espaces Vous pouvez spécifier jusqu’à trois mots clés qui seront recherchés conjointement dans la ligne de définition, les noms de fonction, de gène, de produits de gène, de protéine, ou de type de cellule
Résultat d’une recherche chaque ligne du résumé des résultats renvoie à une description plus détaillée mot clé (‘ ribosomal ’ et ‘ mitochondri ’ )
Les outils de découverte de motifs Recherche de motifs : on connaît le motif on cherche ses occurrences Découverte de motif : on ne connaît pas le motif on cherche à mettre en évidence des motifs intéressants
Les outils de découverte de motifs A partir du site Web de la plateforme…
Les outils de découverte de motifs A partir du site Web de la plateforme…
Les outils de découverte de motifs A partir du site Web de la plateforme…
Les outils de découverte de motifs La page d ’accueil
Différents outils de découverte de motifs Les outils de découverte de motifs Contenu de la page d ’accueil ... Différents outils de découverte de motifs
Classe de l ’algorithme Les outils de découverte de motifs Contenu de la page d ’accueil ... La classe d’un algorithme est reliée à la complexité : des motifs qu’il peut découvrir du calcul nécessaire Classe de l ’algorithme
Classe de l ’algorithme Les outils de découverte de motifs Contenu de la page d ’accueil ... Complexité la plus faible : classe A un motif équivaut à un mot Complexité la plus grande : classe I un motif PROSITE Classe de l ’algorithme
Avec * : gap de longueur inconnue Les outils de découverte de motifs Exemple de motifs : classe A -> T-C-T-T-G-A classe I -> D-T-x(2,5)-*-L-[KEH] Avec * : gap de longueur inconnue
Un outil de recherche de motifs parmi des séquences éloignées Les outils de découverte de motifs Contenu de la page d ’accueil ... MoDEL : Un outil de recherche de motifs parmi des séquences éloignées
Les outils de découverte de motifs Exemple de recherche avec MoDEL Taille du motif recherché Ensemble des séquences
Mise en évidence d’un motif commun à toutes les séquences Les outils de découverte de motifs Exemple de recherche avec MoDEL Mise en évidence d’un motif commun à toutes les séquences
Les outils de découverte de motifs Contenu de la page d ’accueil ... Pratt : Un outil de recherche de motifs sophistiqué Deux niveaux d ’utilisation
Un outil de recherche de motifs sophistiqué Les outils de découverte de motifs Contenu de la page d ’accueil ... Pratt : Un outil de recherche de motifs sophistiqué Standard Expert
Les outils de découverte de motifs Exemple de recherche avec Pratt On cherche tous les motifs de taille maximale 20 communs à cet ensemble de séquences
Liste des motifs trouvés Les outils de découverte de motifs Exemple de recherche avec Pratt Liste des motifs trouvés
Les outils de découverte de motifs Ce qu’on peut faire après une recherche avec Pratt Si on clique ici ...
A une couleur correspond un motif Les outils de découverte de motifs Ce qu’on peut faire après une recherche avec Pratt A une couleur correspond un motif On peut visualiser graphiquement les occurrences des motifs sur les différentes séquences
Si on clique sur un motif... Les outils de découverte de motifs Ce qu’on peut faire après une recherche avec Pratt Si on clique sur un motif...
On peut rechercher ce motif dans une banque connue Les outils de découverte de motifs Ce qu’on peut faire après une recherche avec Pratt On peut rechercher ce motif dans une banque connue
Entrées swissprot qui matchent avec le motif trouvé par Pratt Les outils de découverte de motifs Ce qu’on peut faire après une recherche avec Pratt Entrées swissprot qui matchent avec le motif trouvé par Pratt
Différents outils originaux Les outils de découverte de motifs Contenu de la page d ’accueil ... Différents outils originaux
Les outils de découverte de motifs Contenu de la page d ’accueil ... STAN ou Suffix Tree Analyser Un outil de recherche de motifs sur les génomes
Les outils de découverte de motifs STAN permet de rechercher des motifs complexes constitués de : Chaîne exacte : ATATCGCGCG Disjonction ou exclusion : [AT] ou {C} Gap : x(2) x(2,50) Variable de chaîne : X:[size=10] , X Toutes chaînes de taille 10, suivie de cette même chaîne
Les outils de découverte de motifs STAN autorise des recherches avec erreurs : ATATCGCGCG : 2 tolère 2 erreurs de substitution sur la chaîne ATATCGCGCG (VA-[LI]-IN):1 tolère 1 erreur sur l ’ensemble du motif insertion(ATATCG,1,3) tolère 1 à 3 insertion de base dans la chaîne ATATCG deletion(ATATCG,1,3) tolère 1 à 3 deletion de base dans la chaîne ATATCG
Les outils de découverte de motifs Exemple de recherche avec STAN On recherche Sur le chromosome
Résultats de la recherche Les outils de découverte de motifs Exemple de recherche avec STAN Résultats de la recherche
Les solutions sur la 1ere phase de lecture Les outils de découverte de motifs Exemple de recherche avec STAN Les solutions sur la 1ere phase de lecture
Occurrences du motif sur la 1ere phase de lecture Les outils de découverte de motifs Exemple de recherche avec STAN Occurrences du motif sur la 1ere phase de lecture
Nombre d ’erreur de substitution par rapport au motif recherché Les outils de découverte de motifs Exemple de recherche avec STAN Occurrences du motif sur la 1ere phase de lecture admettant 1 erreur de substitution Nombre d ’erreur de substitution par rapport au motif recherché
Les outils de découverte de motifs Contenu de la page d ’accueil ... Des liens sur d’autres outils de découverte de motifs disponibles sur le Web
GenoFrag Un logiciel de recherche d’amorces optimisées pour l’amplification de chromosome bactérien par PCR longue portée Sélection d’amorces : 7 filtres pour la recherche d’amorces optimisées pour la LR-PCR Ségmentation : Assemblage des paires d’amorces pour un recouvrement optimal du chromosome ( Etape d’optimisation combinatoire )
A partir du site Web de la plateforme… GenoFrag A partir du site Web de la plateforme…
A partir du site Web de la plateforme… GenoFrag A partir du site Web de la plateforme…
GenoFrag Page d’accueil
GenoFrag : les programmes fragmentation: paramètres et formats d’entrée et de sortie Sélection des amorces: paramètres et formats d’entrée et de sortie
Paramétrage de la sélection taille des amorces … Sélection d’amorces Télécharger le génome Page d’aide Paramétrage de la sélection taille des amorces …
Sélection d’amorces liste d’amorces résultat
Sélection d’amorces résultat raffinement
Raffinement le formulaire fichier d’amorces résultat filtre = blastn contre génome proche choix du génome
fragmentation si liste d’amorces OK Raffinement résultat fragmentation si liste d’amorces OK
Fragmentation le formulaire fichier d’amorces après raffinement ou pas paramétrage de la fragmentation taille du génome, algorithme … fonctionnement du programme
caractéristiques des amplicons Fragmentation résultat caractéristiques des amplicons liste des amplicons
Les ressources matérielles SunFire 6800 SunFire 12000 Cluster PC 40 procs + 10 Nantes Angers Rennes Roscoff Brest SunFire 4800 12 procs Cluster Compaq 36 procs Pôle de calcul intensif de l'Ouest Pôle de calcul pour la Mer
Serveur de sauvegardes Ressources Stockage réseau (4 To) Cluster Sun Fire 12000 partagé Sun Fire 6800 Serveur de sauvegardes
Evolutions Restructuration du service : QFS : réseau privé Gb/s entre les serveurs de calcul et le stockage NFS : serveur dédié Serveur d’accueil Migration des services web sur le cluster