Télécharger la présentation
La présentation est en train de télécharger. S'il vous plaît, attendez
Publié parGodard Chatelain Modifié depuis plus de 9 années
1
Historique Juillet 2000 : Dépôt d'un dossier Génopole Ouest auprès du Ministère Mars 2001 : expertise sur site par des experts internationaux Juillet 2001 : Génopole Ouest est officiellement retenue comme une génopole test Janvier 2002 : labellisation Ouest-genopole Septembre 2002 : recrutement de E.Kaboré et E. Morin Juillet 2003 : recrutement de A.-S. Vallin
2
Le rôle Séquençage Génotypage Biopuces Exploration fonctionnelle
Bio-Informatique Recherche Service Protéomique
3
Les acteurs LERIA U533 Organisme porteur: IRISA / INRIA - Rennes
Roscoff Brest Rennes Nantes Angers LERIA U533
4
Les interactions Autres Plate-formes Plate-forme Bio-Informatique
Outils Production Analyse Exploitation Données brutes Stockage Archivage élaborées Gestion Domaine de Recherche bioinfo Méthodes Prototypes Veille outils problèmes
5
Accueil du site News Menu Accès site principal
Utilisez ce modèle pour créer des pages Web intranet au sujet de votre groupe de travail ou projet. Vous pouvez ajouter vos propres informations au contenu du modèle et même modifier la structure du site Web en ajoutant ou supprimant des diapositives. Les contrôles de navigation se trouvent sur le masque des diapositives. Pour les modifier, pointez dans le menu Affichage sur Masque, puis cliquez sur Masque des diapositives. Pour ajouter ou supprimer des liens hypertexte sur du texte ou des objets, ou modifier des liens hypertexte, sélectionnez le texte ou l'objet voulu, puis cliquez dans le menu Insertion sur Lien hypertexte. Une fois vos modifications terminées, supprimez ces commentaires pour diminuer la taille de vos fichiers HTML finaux. Pour plus d'informations, interrogez l'aide intuitive sur : Masque des diapositives Liens hypertexte
6
Pourquoi ? «Vitrine» de la plate-forme
valorisation des applications issues de la recherche en bio-informatique accès à des outils spécifiques Mission de service Information / animation Propositions de formation
7
Pour qui ? Les biologistes de OUEST_genopole®
Ouverture nationale prévue pour les outils exclusifs » Evolution du site grâce: aux échanges lors de rencontres aux collaborations avec les biologistes veille : apparition de nouveaux outils à la FAQ du site web
8
Plan du site Accueil présentation outils Accès aux outils locaux
Accès à des outils externes
9
Les outils disponibles
10
Outils locaux Wisconsin package standard Blast Multiple rare
FastMe rare Plate-forme de découverte de motifs exclusif GenoFrag exclusif
11
GenoFrag
12
Plan du site Accueil présentation outils FAQ banques
Poser une question Consulter les questions déjà posées banques Description des banques présentes sur le serveur Procédure de rapatriement Accès outils liés outils Accès aux outils locaux Accès à des outils externes
13
La foire aux questions
14
Plan du site Accueil présentation emplois outils FAQ banques
Dépôt demande OUEST-genopole & autres formations Inscription information Accueil présentation emplois outils Accès aux outils locaux Accès à des outils externes FAQ Poser une question Consulter les questions déjà posées banques Description des banques présentes sur le serveur Procédure de rapatriement Accès outils liés
15
Formations & emplois
16
Liens externes Accueil Séminaires Plate-forme Bio-informatique outils
OUEST_genopole® et Plate-forme Bio-informatique site principal Accès à des outils externes outils
17
Projets Analyse du génome chromosome par chromosome
Aide à l’annotation des séquences bactériennes; Blast contre les génomes bactériens; Analyse syntaxique de génomes. 3 programmes : Plus d’infos sur : Blast utile pour GenoFrag
18
De nombreuses banques publiques avec un suivi des versions, et des mises à jour intermédiaires
Available databases: GenBank Release (12/2003) EMBL Release (12/2003) GenPept Release (01/2004) PIR-Protein Release (11/2003) NRL_3D Release (01/2001) SWISS-PROT Release (10/2003) SP-TREMBL Release (11/2003) PROSITE Release (08/2002) Pfam Release (08/2003) Restriction Enzymes (REBASE) (06/2002) Imgt Release (11/2003) Imgt HLA Release (07/2003) GoldenH Release (10/2003) GoldenM Release mmFeb2003 (07/2003) Sbase Release (08/2003)
19
Rsync possibilité pour chaque labo d ’avoir une copie locale des banques disponibles sur la plate-forme. Une fiche indiquant la procédure à suivre est disponible sur le site de la plate-forme oasis[10:51]%rsync idefix.univ-rennes1.fr:: Welcome to the Ouest-genopole database rsync service test module used for testing rsyncd (some files...) gcgdata bases au format gcg genbank genbank courant (ATTENTION A LA TAILLE > 80 Goctets) pfam pfam nr NR swissprot swissprot human_gen genome humain genomes une collection de genomes
20
Tous les génomes eucaryotes
21
Nombreux génomes bactériens
22
Des génomes d’archae
23
Construction de bases de données spécialisées
Objectifs: Définir les données spécifiques au sujet d’étude d’un laboratoire; Regrouper des données non redondantes sur ce sujet; Les consulter facilement via une base de données; Vérifier et mettre à jour régulièrement ces données; Rajouter des fonctionnalités dédiées à cet ensemble de données
24
Construction de bases de données spécialisées, exemple : la base de données spécialisée des huîtres
25
Comment ? Recherche et chargement des données
Via un script exécuté par cron Utilise principalement l’outil Entrez du NCBI Banques sources: GenBank, EMBL, DDBJ, DBEst, Unigene, GenPept, Swiss-Prot, PIR, PRF, PDB, etc… Validation des données chargées par l’utilisateur
26
Visualisation des données
La structuration des données est un paramètre défini par l’utilisateur.
27
Zoom sur une séquence
28
Séquence au format d’origine
29
Blast Blasts des séquences de la base de données spécialisée
contre des banques publiques
30
Blast contre la base spécialisée
le résultat est envoyé par mail
31
Recherche de séquences
par mot clé, par numéro d ’accession ou par identifiant genbank Autant de numéro d ’accession ou d ’identifiants genbank que vous le souhaitez, séparés par des espaces Vous pouvez spécifier jusqu’à trois mots clés qui seront recherchés conjointement dans la ligne de définition, les noms de fonction, de gène, de produits de gène, de protéine, ou de type de cellule
32
Résultat d’une recherche
chaque ligne du résumé des résultats renvoie à une description plus détaillée mot clé (‘ ribosomal ’ et ‘ mitochondri ’ )
33
Les outils de découverte de motifs
Recherche de motifs : on connaît le motif on cherche ses occurrences Découverte de motif : on ne connaît pas le motif on cherche à mettre en évidence des motifs intéressants
34
Les outils de découverte de motifs
A partir du site Web de la plateforme…
35
Les outils de découverte de motifs
A partir du site Web de la plateforme…
36
Les outils de découverte de motifs
A partir du site Web de la plateforme…
37
Les outils de découverte de motifs
La page d ’accueil
38
Différents outils de découverte de motifs
Les outils de découverte de motifs Contenu de la page d ’accueil ... Différents outils de découverte de motifs
39
Classe de l ’algorithme
Les outils de découverte de motifs Contenu de la page d ’accueil ... La classe d’un algorithme est reliée à la complexité : des motifs qu’il peut découvrir du calcul nécessaire Classe de l ’algorithme
40
Classe de l ’algorithme
Les outils de découverte de motifs Contenu de la page d ’accueil ... Complexité la plus faible : classe A un motif équivaut à un mot Complexité la plus grande : classe I un motif PROSITE Classe de l ’algorithme
41
Avec * : gap de longueur inconnue
Les outils de découverte de motifs Exemple de motifs : classe A -> T-C-T-T-G-A classe I -> D-T-x(2,5)-*-L-[KEH] Avec * : gap de longueur inconnue
42
Un outil de recherche de motifs parmi des séquences éloignées
Les outils de découverte de motifs Contenu de la page d ’accueil ... MoDEL : Un outil de recherche de motifs parmi des séquences éloignées
43
Les outils de découverte de motifs
Exemple de recherche avec MoDEL Taille du motif recherché Ensemble des séquences
44
Mise en évidence d’un motif commun à toutes les séquences
Les outils de découverte de motifs Exemple de recherche avec MoDEL Mise en évidence d’un motif commun à toutes les séquences
45
Les outils de découverte de motifs
Contenu de la page d ’accueil ... Pratt : Un outil de recherche de motifs sophistiqué Deux niveaux d ’utilisation
46
Un outil de recherche de motifs sophistiqué
Les outils de découverte de motifs Contenu de la page d ’accueil ... Pratt : Un outil de recherche de motifs sophistiqué Standard Expert
47
Les outils de découverte de motifs
Exemple de recherche avec Pratt On cherche tous les motifs de taille maximale 20 communs à cet ensemble de séquences
48
Liste des motifs trouvés
Les outils de découverte de motifs Exemple de recherche avec Pratt Liste des motifs trouvés
49
Les outils de découverte de motifs
Ce qu’on peut faire après une recherche avec Pratt Si on clique ici ...
50
A une couleur correspond un motif
Les outils de découverte de motifs Ce qu’on peut faire après une recherche avec Pratt A une couleur correspond un motif On peut visualiser graphiquement les occurrences des motifs sur les différentes séquences
51
Si on clique sur un motif...
Les outils de découverte de motifs Ce qu’on peut faire après une recherche avec Pratt Si on clique sur un motif...
52
On peut rechercher ce motif dans une banque connue
Les outils de découverte de motifs Ce qu’on peut faire après une recherche avec Pratt On peut rechercher ce motif dans une banque connue
53
Entrées swissprot qui matchent avec le motif trouvé par Pratt
Les outils de découverte de motifs Ce qu’on peut faire après une recherche avec Pratt Entrées swissprot qui matchent avec le motif trouvé par Pratt
54
Différents outils originaux
Les outils de découverte de motifs Contenu de la page d ’accueil ... Différents outils originaux
55
Les outils de découverte de motifs
Contenu de la page d ’accueil ... STAN ou Suffix Tree Analyser Un outil de recherche de motifs sur les génomes
56
Les outils de découverte de motifs
STAN permet de rechercher des motifs complexes constitués de : Chaîne exacte : ATATCGCGCG Disjonction ou exclusion : [AT] ou {C} Gap : x(2) x(2,50) Variable de chaîne : X:[size=10] , X Toutes chaînes de taille 10, suivie de cette même chaîne
57
Les outils de découverte de motifs
STAN autorise des recherches avec erreurs : ATATCGCGCG : 2 tolère 2 erreurs de substitution sur la chaîne ATATCGCGCG (VA-[LI]-IN):1 tolère 1 erreur sur l ’ensemble du motif insertion(ATATCG,1,3) tolère 1 à 3 insertion de base dans la chaîne ATATCG deletion(ATATCG,1,3) tolère 1 à 3 deletion de base dans la chaîne ATATCG
58
Les outils de découverte de motifs
Exemple de recherche avec STAN On recherche Sur le chromosome
59
Résultats de la recherche
Les outils de découverte de motifs Exemple de recherche avec STAN Résultats de la recherche
60
Les solutions sur la 1ere phase de lecture
Les outils de découverte de motifs Exemple de recherche avec STAN Les solutions sur la 1ere phase de lecture
61
Occurrences du motif sur la 1ere phase de lecture
Les outils de découverte de motifs Exemple de recherche avec STAN Occurrences du motif sur la 1ere phase de lecture
62
Nombre d ’erreur de substitution par rapport au motif recherché
Les outils de découverte de motifs Exemple de recherche avec STAN Occurrences du motif sur la 1ere phase de lecture admettant 1 erreur de substitution Nombre d ’erreur de substitution par rapport au motif recherché
63
Les outils de découverte de motifs
Contenu de la page d ’accueil ... Des liens sur d’autres outils de découverte de motifs disponibles sur le Web
64
GenoFrag Un logiciel de recherche d’amorces optimisées pour l’amplification de chromosome bactérien par PCR longue portée Sélection d’amorces : 7 filtres pour la recherche d’amorces optimisées pour la LR-PCR Ségmentation : Assemblage des paires d’amorces pour un recouvrement optimal du chromosome ( Etape d’optimisation combinatoire )
65
A partir du site Web de la plateforme…
GenoFrag A partir du site Web de la plateforme…
66
A partir du site Web de la plateforme…
GenoFrag A partir du site Web de la plateforme…
67
GenoFrag Page d’accueil
68
GenoFrag : les programmes
fragmentation: paramètres et formats d’entrée et de sortie Sélection des amorces: paramètres et formats d’entrée et de sortie
69
Paramétrage de la sélection taille des amorces …
Sélection d’amorces Télécharger le génome Page d’aide Paramétrage de la sélection taille des amorces …
70
Sélection d’amorces liste d’amorces résultat
71
Sélection d’amorces résultat raffinement
72
Raffinement le formulaire fichier d’amorces résultat
filtre = blastn contre génome proche choix du génome
73
fragmentation si liste d’amorces OK
Raffinement résultat fragmentation si liste d’amorces OK
74
Fragmentation le formulaire fichier d’amorces après raffinement ou pas
paramétrage de la fragmentation taille du génome, algorithme … fonctionnement du programme
75
caractéristiques des amplicons
Fragmentation résultat caractéristiques des amplicons liste des amplicons
76
Les ressources matérielles
SunFire 6800 SunFire 12000 Cluster PC 40 procs + 10 Nantes Angers Rennes Roscoff Brest SunFire 4800 12 procs Cluster Compaq 36 procs Pôle de calcul intensif de l'Ouest Pôle de calcul pour la Mer
77
Serveur de sauvegardes
Ressources Stockage réseau (4 To) Cluster Sun Fire 12000 partagé Sun Fire 6800 Serveur de sauvegardes
78
Evolutions Restructuration du service :
QFS : réseau privé Gb/s entre les serveurs de calcul et le stockage NFS : serveur dédié Serveur d’accueil Migration des services web sur le cluster
Présentations similaires
© 2024 SlidePlayer.fr Inc.
All rights reserved.