La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Réunion GDR Arsenic du 30/03/2005 - Institut Pasteur Activités et projets de léquipe Atelier de Génomique Comparative Rôle de lAtelier de Génomique Comparative.

Présentations similaires


Présentation au sujet: "Réunion GDR Arsenic du 30/03/2005 - Institut Pasteur Activités et projets de léquipe Atelier de Génomique Comparative Rôle de lAtelier de Génomique Comparative."— Transcription de la présentation:

1 Réunion GDR Arsenic du 30/03/ Institut Pasteur Activités et projets de léquipe Atelier de Génomique Comparative Rôle de lAtelier de Génomique Comparative au sein du GDR Arsenic Resp. Claudine Médigue Laurent Labarre Thèses : Géraldine Pascal David Vallenet Stéphane Cruveiller Post-doctorants : Stéphanie Bocs (Etudiant Chinois en thèse courant 2005) Zoé Rouy Ingénieurs : Aurélie Lajus Stagiaire : Catherine Devaud

2 Thématiques de léquipe AGC (Ré)-Annotation de génomes bactériens Applications biologiques Génomique comparative : régions conservées et/ou spécifiques, fusions de gènes, voies métaboliques. Composition en codons et en acides aminés des séquences bactériennes. Méthodes (Langage C, Perl ) et Stratégies danalyse (Java) Développements méthodologiques : Interfaces graphiques Serveurs Web (Langages PHP, HTML) Base multigénomes PkGDB (Prokaryotic Genome DataBase) Développements de bases de données Bases thématiques pour des projets de (ré)-annotation Bases de connaissances (plateforme de génomique exploratoire Genostar)

3 SGBD relationnel (MySQL) SGBD relationnel (MySQL) PkGDB : Procaryotic Genome DataBase Objectif : données dannotation propres, cohérentes, à la source des méthodologies de génomique comparative Résultats danalyses : Résultats danalyses : Intrinsèques : gènes, signaux, répétitions,… Génomes nouveaux (projets dannotation) Génomes nouveaux (projets dannotation) Extrinsèques : Blast, InterPro, COG, synténies … Génomes complets (Refseq NCBI) Génomes complets (Refseq NCBI) Ré-annotation syntaxique Intégration dans PkGDB Gestion des frameshifts Homogénéité des données Complétion /correction des données

4 AMIMat : analyse de lusage des codons des génomes bactériens Objectif : caractériser des groupes de gènes homogènes dans lusage des codons au sein dun génome bactérien. Modèle objet AROM (java) PkGDB Modèle relationnel Class III (397) Class I (1791) Class II (1551) Class IV (256) AFC Clustering

5 AMIGene : prédiction de gènes codants bactériens Objectif : Détecter les gènes de composition atypique et les petits gènes startstop Patterns starts/stops + RBS (RBS-Finder) P(X/X 1...X k ) Matrice(s) de transitions w phase 1 phase 2 phase Heuristique de sélection des CDSs les plus probables Chevauchements Inclusions, … Class III (397) Class I (1791) Class II (1551) Class IV (256) GeneMark Bocs et al. (2003) AMIGene: Annotation of MIcrobial Genes. Nucleic Acids Research, 31,

6 MICheck : ré-annotation (syntaxique) de génomes bactériens Objectif : Vérifier rapidement si les annotations répertoriées dans les banques de séquences pour un génome donné sont complètes. Fichier EMBL ou GenBank Séq. nucl Annotations + Modèle(s) de gènes CDS prédites Calcul de la probabilité moyenne de codage Gènes annotés COMPARAISON Position des codons stop CDS communes CDS UNIQUES Banques CDS UNIQUES AMIGene Cruveiller et al. (2005) MICheck : A Web tool to fast check annotations of bacterial genomes. Nucleic Acid Research (en révision)

7 Syntonizer : Groupes de synténies dans les génomes bactériens Objectif : Détecter des groupes de gènes localement conserver dans les génomes bactériens. Labarre et al. Syntonizer: an interactive Web tool for identifying bacterial synteny group using multiple correspondences. (soumis BMC Bioinf.). Rearrangement FusionDuplicationInsertionInversion A B Synteny Group #2 Synteny Group #1

8 MaGe : plateforme dannotation de génomes bactériens PkGDB AcinetoDB Yersinia Scope HaloplanktisDB Bacillus Scope ColiScope FrankiaDB Databases for re-annotation and annotation projects MySQL DB Blast tRNAscan-SE InterProScan PRIAM COGnitor TMHMM Automatic functional assignment combining multiple evidence and synteny results «Auto- FAssign» GRAPHICAL ANNOTATION INTERFACE (Web server connected to the data base) Validation and completion of the automatic annotation (Re) Annotation using synteny results User friendly and adaptable annotator editor Vallenet et al. MaGe - a microbial genome annotation system supported by synteny results. (en préparation)

9 _name Bacterial annotation projects in progress : project _name = AcinetoScope (Acinetobacter sp. ADP1) Login name and password are required. Available re-annotation and annotation projects : = YersiniaScope (Yersinia species) = BacillusScope (Bacillus species) Connection à MaGe

10 Projet MicroScope (ACI IMPBio 2004) Bases de données thématiques pour lannotation/ré-annotation de génomes bactériens Aujourdhui : 12 projets en cours + 2 en préparation Formation et suivit des utilisateurs (outils dannotation et interface MaGe) Optimisation de larchitecture des bases et des ressources machines (Equipe informatique de Claude Scarpelli) Gestion efficace des mises à jour des données (avancée du Finishing/update des banques de séquence) Développement et maintenance des bases thématiques Analyse complète dun génome nouvellement séquencé Recherche de synténies avec lensemble des procaryotes complets Mise à la disposition des données via linterface MaGe Métabolisme bactérien: Connection à KEGG + construction de la base BioCyc (P. Karp)

11 Bactéries de lenvironnement et symbiotes de plantes BD Bactérie(s) Séquençage Collaborateurs AcinetoScope Acinetobacter ADP1 Environnement (sol) P. Marlière (Evologic) & N. Orlston (Yale U., USA) Genoscope PsychroScope Pseudomonas haloplanktis Genoscope Environnement (antartique) A. Danchin (IP, Paris) FrankiaScope CloacaScope ArseniScope BradyrhizoScope AnnamoScope Kuenenia stuttgartiensis Environnement (métabolise lN) Genoscope Frankia alni Symbiote de plantes P. Normand (Lyon) Genoscope M Jetten (Univ. Nijmegen, Holl.) Métagénomes Microflore de la station dépuration des eaux dEvry D. Le Paslier & A. Sghir (Genoscope, Evry) Genoscope Cenibacterium arsenoxidans Environnement (Métabolise larsenic) P. Bertin (ULP, Strasbourg) Consortium GDR Arsenic Genoscope Bradyrhizobium sp. ORS278 Symbiote de plantes E. Giraud (LSTM, Montpellier) Genoscope Frankia sp. CcI3 Frankia sp. EAN1 DOE JGI D. Benson (Univ. Connecticut, USA) Thiomonas spp.

12 Taille génome : pb%GC = 54.3 % Les gènes de RNA 45 tRNA au total, tous les acides aminés sont représentés 2 clusters de rRNA : 16S 23S 5S, au début du génome Caractéristiques générales du génome de C. arsenoxidans 3376 CDSs annotées Les gènes de protéines : - fonctions «connues» : 2127 / 63 % - conserved hypothetical : 607 / 18 % - hypothetical protein : 642 / 19 % 36.8% «definitive assignment» 26.2% «putative assignment» Parmi les similarités « significatives » : - Resistance : 40 / 1.2% (Arsenic, Cobalt-zinc-cadmium, Copper, multidrug,…) - Regulators : 136 / 4 % - Transports: 191 / 5.7 % - DNA replication, recombinaison, modification and repair : 89 / 2.4 % - Related to phage,transposase: 51 / 1.5 % - Reductases: 93 / 2.8 %

13 Groupes de synténies entre C. arsenoxydans et quelques génomes

14 Synténies et voies métaboliques leuC leuD leuB asd CENAR1163 truA trpF trpB trpA accD folC

15 Synténie S. oneidensis et C. arsenoxydans

16 Synténies et voies métaboliques leuC leuD leuB asd CENAR1163 truA trpF trpB trpA accD folC

17 Enzymes encoded by genes in the MaGe region Additional enzymes in E. coli Connectivité à la base métabolique KEGG Enzymes encoded by genes elsewhere in the C. arsenoxydans genome

18 Editeur dannotation de MaGe (partiel)

19 Lien MaGe - Bases de données BioCyc (P. Karp)

20 Voie de biosynthèse de la Leucine chez C. arsenoxydans

21 Show Pathway Report Show Pathway Hole Report Reconstitution des voies métaboliques chez C. arsenoxydans

22 Résistance à larsenic … Arsenite oxydase aoxCBA ABC transporters (pts) 2-component reg. syst atoC Acetoacetate metabolism lipoprotein Arsenical resistance arsR-like arsC-like arsC Arsenate reductase arsB Arsenical pump

23 Rôle de lAGC dans le cadre du GDR arsenic Construction de la base thématique ArseniScope: Génomes de C. arsenoxydans et de Thiomonas spp. Intégration à MaGe dautres génomes très proches en cours de séquençage ? Calculs des synténies et régions uniques Mise en place des bases BioCyc Assitance à lannotation experte des génomes Organisation dune formation à MaGe Support continu aux annotateurs Métagénomique (arsenic) Modification de MaGe pour la gestion et lannotation de métagénome Création de catalogues de gènes et de familles de protéine Bases de données multigénomes Construction de bases GenoList (Antoine D., I. Moszer) Interface dinterrogation et de navigation dans les bases thématiques multigénomes (PkGDB)


Télécharger ppt "Réunion GDR Arsenic du 30/03/2005 - Institut Pasteur Activités et projets de léquipe Atelier de Génomique Comparative Rôle de lAtelier de Génomique Comparative."

Présentations similaires


Annonces Google