Les bases de données biologiques au LBBE

Slides:



Advertisements
Présentations similaires
Développement de la carte génétique du chêne
Advertisements

Applications de GdX Coordinateur thématique : Christophe Cérin
MODE de VIE : MOdélisation et DEtection de Végétaux en Interaction avec leur Environnement Action de Recherche Coopérative ( )
Mardi 12 décembre h30 (50 min) La phylogénie, ses concepts et ses applications à la génomiqueLa phylogénie, ses concepts et ses applications à la.
DE ZÉRO à PAUP : Délimitation du groupe d'intérêt ("ingroup")
I. Recherche du gène correspondant aux séquences initiales.
Les données et les banques de données
Pons Nicolas, Jean-Michel Batto, S.Dusko Ehrlich, Pierre Renault
Prédiction de sites dinteraction des protéines par analyse darbres phylogénétiques Stéfan Engelen Génomique Analytique, INSERM U511 Université Pierre et.
Colloque Traitement et Analyse de séquences : compte-rendu
Rappel des objectifs du WP10
PhyloJava : une application de phylogénie sur la grille DATAGRID
Grille Régionale Rhône-Alpes Institut des Grilles du CNRS Yonny CARDENAS CC-IN2P3 Réunion du groupe de travail grilles Projet CIRA Grenoble, le 2 Juin.
TP2, Apparition de nouveaux gènes : les familles multigéniques
Initiation à la bioinformatique
Framework Avancement au Plan Principales avancées pour les parties Ligand, Sites Actifs et Docking Processus dinstallation de.
Un nouveau regard sur les données moléculaires
Recherche de similarité de séquences à grande échelle S. Penel, P. Calvat, Y. Cardenas LBBE, CCIN2P3 Calculs BLAST intensifs sur la plateforme TIDRA -
Bioinformatique =?? génomique protéomique
Le centre de calcul de l'IN2P3 : une architecture pour le calcul intensif et le stockage de masse Pascal Calvat.
Caractérisation structurale d ’un régulateur transcriptionnel du « Quorum Sensing » chez Brucella abortus.
Yoann Beausse Journée Bioinformatique des Génopoles
« Génome, adaptation et environnement »
JX10RemoteHome. Introduction Gestion de dispositifs X10 en local et distance Programme de simulation de présence Gestion de contrôle des présence en cas.
Caricature IDF Dis, M'sieur le Moniteur de Biologie marine c'est quoi t'est-ce donc la classification phylogénétique ? Non ! Claude Duboc Professeur de.
<? Le PHP appliqué à la BioInformatique ?>
Diversification du Vivant
Modélisation moléculaire
UBLO Comparaison de génomes bactériens : questions méthodologiques autour de la définition du squelette et des boucles
Alphy XIV – GTGC Rencontres Alignements et Phylogénie &
Département Génétique et Génomique Evolutives
Axe Transversal Interactions Durables (ID)
BAOBABBAOBAB 19+1 personnes « sur site » 1 thèse en co-tutelle avec autre équipe LBBE 2 thèses en co-tutelle avec équipe du LBBE hors site 3 thèses en.
The origin and evolution of synapses
Développement et évolution
Introduction à la bioinformatique
Plan Buts principaux Intérêt et pertinence du projet Rappel concernant la phylogénie Travail accompli jusquà maintenant Travail restant à accomplir Difficultés.
Prédiction d’interactions protéine-protéine
Bases de données en biologie (suite)
La banque UniprotKB et le logiciel Blast
Etienne Danchin & Amandine Campan Présentation interne, pôle Santé des Plantes, Sophia - Antipolis Mercredi 21 avril 2010 Grille PACA ProActive : retour.
La génétique et la biométrie
Test -révision thèmeIA chap2-chap3
Les ouvertures au CC Pascal Calvat. Plan 2 Présentation des ouvertures Les besoins des utilisateurs Les solutions apportées par le CCIN2P3 Les ouvertures.
Formation Bio-informatique IRD
Recherche exacte de motifs
Analyses phylogénétiques
Familles de gènes Nadia El-Mabrouk.
Historique Juillet 2000 : Dépôt d'un dossier Génopole Ouest auprès du Ministère Mars 2001 : expertise sur site par des experts internationaux Juillet 2001.
Visualisation d’un entrepôt de données Pré soutenance technique
Banques de données en bio-informatique
Centre Régional Languedoc-Roussillon
TEXT MINING Fouille de textes
Intégration des données sur le transcriptome
Introduction à la Bio-Informatique
GenoToul2007 Présentation Bilan 2007 Perspectives Plateforme bioinformatique C. Gaspin, C. Klopp, D. Laborie, J.-M. Larré, C. Noirot.
Banques de données de séquences biologiques
Institut Universitaire de Technologie de Clermont-Ferrand
Un segment peut contenir plusieurs gènes les gènes sont nombreux et/ou en interaction leurs effets sont inégaux et instables les mutations se fixent séquentiellement.
L’analyse d’ADN et la génomique
Sylvain Foisy, Ph. D. Bio-informaticien Conseil Diploide.net Sources de données en bio-informatique.
On s‘intéressera à 3 gènes paralogues humains : HTR2A, HTR2B et HTR2C du récepteur de la sérotonine humaine (Swissprot : 5HT2A_HUMAN, 5HT2B_HUMAN, 5HT2C_HUMAN).
Introduction à la Bio-Informatique
Mais d’abord rappelez-vous!!
Les banques de séquences nucléiques
CHMI 4206 Bioinformatique appliquée
Mercredi 1er juin 2016 La biologie au centre de calcul Pascal Calvat Centre de calcul.
Mercredi 1er juin 2016 La biologie au centre de calcul Pascal Calvat Centre de calcul.
Calcul Intensif en Génomique Comparative Laurent Duret Laboratoire de Biométrie et Biologie Evolutive.
Analyse de séquences nucléotidiques séance n°2 Bio-Informatique.
Transcription de la présentation:

Les bases de données biologiques au LBBE Le système ACNUC Bases de données  généralistes  Bases de données développées au labo Accès aux bases de données Journées du laboratoire 1-2 Juin 2005 Simon Penel

Le système ACNUC Système de requête sur les séquences biologiques Développé au laboratoire (M. Gouy) Génération d’index à partir des annotations de séquences Permet de retrouver les séquences à partir de mot clefs, de la bibliographie, de la taxonomie, de la date, du type de séquence, du type de molécule Séquences « mères » et « filles » Permet d’extraire les séquences sous différents formats, de récupérer les annotations Accès ACNUC local : API en C Accès ACNUC à distance, mode client serveur (sockets) , API en C

Bases de données généralistes structurées sous ACNUC maintenues au laboratoire Mise à jour automatique: GenBank Séquences nucléiques - 2 milions de CDS (NCBI) EMBL Séquence nucléiques - 2 milions de CDS Uniprot (anciennement SwissProt + TrEMBL + PIR) - 2milions de protéines et aussi.... Ensembl Génomes complets métazoaires Genome Reviews Génomes complets bactériens (EBI) Complete Protéomes (EBI) HAMAP Génomes microbiens(SIB)

Bases de données de familles de gènes développées au labo et/ou en collaboration protéines ET/OU séquences nucléiques Familles de gènes/protéines Alignement Arbre phylogénétique (avec évènement de spéciation et duplication) Applications: Evolution moléculaire Prédiction de fonction de gène Phylogénie des espèces Cartographie comparée Génétique des populations Utilisation des ressources du centre de calcul de l’IN2P3 (P. Calvat) parallèlisation des calculs (BLAST, CLUSTALW) : gain 20 x à 50 x

Bases de données de familles de gènes générales Familles de gènes homologues Hobacgen Bactéries & levures (G. Perrière) Hogenom Hovergen Vertébrés 250 000 séquences (L. Duret) HoGenom Génomes complets 650 000 séquences (L. Duret, S. Penel) Projet Européen Temblor/Integr8 (EBI) Homolens Génomes complets de Ensembl 250 000 séquences

Bases de données plus spécialisées Collaborations au sein du LBBE ou avec labos extérieurs Hoppsigen A. Khelifi (LBBE) Familles de retroélements, retropseudogènes RTKdb J. Grassot (LBBE/ Centre de Génétique Moléculaire et Cellulaire) Familles de Récepteurs Tyrosine Kinase Nurebase (LBBE/ENS-Lyon) Familles de Récepteurs Nucléaires Polymorphix E. Bazin ( Laboratoire « Génome Populations Interactions Adaptation ») Familles de séquences polymorphes TaxoBacGen G. Devulder (LBBE) Taxonomie des génomes bactériens EMGLib G.Perrière (LBBE) Génomes bactéries et levures, annotations corrigées GemCore V. Navratil, (LBBE, INRA) SNiPs, cartographie comparée Futur : Familles de gènes homologues de plantes Fusion Hogenom + Homolens Hovergen: Vertébrés  Métazoaires ( x 2) Tout Uniprot ( 2 millions de séquences, x10)

Accès au banques query, query_win en local à partir de pbil, biomserv, pbil2 (M. Gouy) Requêtes sur les banques Visualisation, extraction de données query_win en mode client-serveur sur Mac et PC (S. Delmotte, M. Gouy) seqinR en mode client-serveur (D. Charif, S. Delmotte, J. Lobry) Serveur Web du PBIL (S. Penel, G. Perrière) Recherche avec BLAST FamFetch (banques de familles): application Java (G. Perrière) Recherche et visualisation des familles Recherche de motifs dans les arbres (J.F. Dufayard)

Accès au banques query, query_win à partir de pbil, biomserv, pbil2

Serveur Web du PBIL Accès au banques

Conclusions De nombreuses banques De nombreux outils Grosses capacités de calcul (IN2P3) Compétences en modélisation, conception, mise en place et maintenance des banques Favoriser l’utilisation des banques le développement de nouvelles banques associées à différentes thématiques au sein du laboratoire