Création d’une base de données pour l’intégration de données génétiques et l’aide à la sélection de gènes candidats Franck De-graeve Master ASE.

Slides:



Advertisements
Présentations similaires
AthleteMonitoring.com © 2003, 2012, Advanced Fitness Designs, Inc. Tous droits réservés. Reproduction interdite.
Advertisements

Les technologies décisionnelles et le portail
CRÉER UNE APPLICATION INTERNET RELIEE A UNE BASE DE DONNEES
Parcs hétérogènes, configurations logicielles hétérogènes et mouvantes JeDDLaJ une solution à faible coût humain Frédéric Bloise, Gérard Milhaud Ecole.
Automatisation des processus dans IIJCan par François HARVEY (Programmeur-analyste)
05/07/07ESUP-Days IV Bravin - Jouin - Monclin Celcat à lUniversité de Reims Champagne - Ardenne.
Une solution personnalisable et extensible
Nairobi, Kenya, Septembre 2010
INTRODUCTION INTRODUCTION ERGONOMIE Tri par cartes Formulaires Interface Installation Lanceur Documentation TECHNOLOGIES XML + XSL CSS Formulaires génériques.
A L I M E N T A T I O N A G R I C U L T U R E E N V I R O N N E M E N T PhpMyGI une interface générique mysql Interface générique ? Pourquoi une interface.
TRANSFER Alger – Serveur Web Nicolas Larrousse Septembre Petit historique du Worl Wide Web Notion dHypertexte Extension à internet par Tim Berners.
Diffusion Nationale TOULOUSE -Mars 2006 Structure et Services « STS » Les échanges.
Conception d’une application de gestion de fiches études
Présentation du journal Scolaweb et de l’administration du site.
E.mail : Web : Qui est Player Math ? C’est une association du type loi 1901 crée en Mai L’équipe.
Le portail des sports des associations de la ville de Nice
API Présentation Comment ajouter des pages. Vous voici dans notre site « laboratoire » pour la démonstration RAJOUTER UNE PAGE.
2006/2007Denis Cabasson – Programmation Web Cours de programmation web ENSAE
Formation Centra - GDE.
GED Masters: Gestion Électronique de Documents
Loïc Thibaut, 05/2002 STATBASE un outil générique pour la gestion de statistiques de pêche dorigines multiples THIBAUT Loïc, CHAVANCE Pierre, DAMIANO Alain.
Sommaire Objectif de Peakup Principes de fonctionnement
Stage de Maîtrise GMI – IUP STIC
BERNARDIN Benoît Lycée Louis Pergaud
Développement d’un réseau social professionnel
Quelles questions se pose un administrateur lorsquil doit installer des nouvelles machines Projet Déploiement RIS W2k LPMI 2003 Gross Sébastien ???
Projet Génie Logiciel & UML, Bases de Données & Interfaces
Module 2 : Préparation de l'analyse des performances du serveur
Introduction : Présentation de Linux Choix d’une distribution
Le portail web netUniversité
SITRANS – Système d’information Transcriptome pour la plate-forme de la Genopole Rhône-Alpes Daniel CRISAN
Nouveaux Composants pour Joomla Auteurs El Khalil El MOUNTASSIR Yassine BENCHEKROUN 08 Janvier 2008 I.U.P. G.M.I. d'Avignon Tuteur Michel BENOIT.
Sandrine BUENDIA Guillaume GALLET.
Solvent eXtraction Database - INTERNET -
PHP & My SQL.
09/11/2006 CMS Content Management System Système de Gestion de Contenu.
Soutenance ProJet Individuel
Lyda tourisme Process en PHP. Objectif Il s’agit de construire un segment de process dans un système d’information touristique.
PHP & MySQL Master1 ICD Claire Jacquot Emilie Hot le 24/10/2006.
Mise en place d’un Intranet
Application de gestion des retards
G.KEMBELLEC - UP81 Master 2 THYP Cas pratique d’utilisation De SimpleXML Un lecteur de RSS Novembre 2009.
Diplôme Nationale d'Ingénieur en Informatique
PLAN 1. Introduction 1.1. Sites de presse actuels 1.2. Objectif de notre site 2. Description du modèle 3. Outils utilisés 3.1. SVG 3.2. PHP et MySQL 4.
G.KEMBELLEC - UP81 Master 2 THYP Cas pratique d’utilisation De simpleXML Un lecteur de RSS Novembre 2009.
INDATA Ingénierie Les secteurs d’activités d’INDATA :
Architecture logicielle
Centralisation des sites web d’ELTA & Mise en place d’un serveur NAS
 Les bases de données MySQL
Cours n°4M1.ist-ie (S. Sidhom) UE 203 Promo. M1 IST-IE 2006/07 Conception d’un système d'information sur Internet Architecture trois-tiers : technologies.
Plan de la présentation
Analyse Orientée Objet Cahier de Laboratoire. Sujet : Il s'agit de concevoir un outil de gestion pour une PME qui commercialise des stations météorologiques.
Formation décisionnelle
Base de données biogéographiques sur Internet
Séance /10/ Projet de site dynamique avec Dreamweaver : MyCMS
Le logiciel de gestion documentaire du SCD : Ex Libris
Les Interactions Plantes / Pathogènes
Développement et maintenance sur le projet RefPack
Les systèmes de gestion de contenu
LES BASES DE DONNEES PRÉSENTÉ PAR CATHY ET THIBAULT.
Description générale: Le front office regroupe différents mini- jeux et les alimente en contenu. Nous fournissons ainsi une enveloppe de jeux paramétrable.
Gestion des documents internes avec SQL Server 2005 Date de publication : janvier 2006.
Vous voici dans notre site « laboratoire » pour la démonstration AJOUTER UNE PAGE Cliquez sur ENTREZ ICI pour accéder à la partie administration.
Julien Lamure - Réunion des CI du 15/11/2006 Quelques utilitaires de création de comptes pour Windows 2003 server - GUNT - Gestion - PowerAD - Magret -
SOMMAIRE  Intro et cahier des charges 2 Présentation Projets Étude et recherche Développement Doc. et manuels Conclusion J.
Scénario Les scénarios permettent de modifier la position, taille … des calques au cours du temps. Son fonctionnement est très proche de celui de Macromedia.
…que Dedicated Micros a lancé un nouvel enregistreur vidéo numérique hybride Saviez-vous?
Système local d’accounting de l’IPHC 31/05/2011 Eric Kieffer.
KOSMOS 1 Outils transversaux Module 7 1.L’annuaire 2.La recherche d’informations 3.La réservation de ressources.
La plateforme numérique Séminaire des référents « Continuum -3/+3 » de l’académie de Toulouse 11 mai /05/2016Plateforme numérique1.
Transcription de la présentation:

Création d’une base de données pour l’intégration de données génétiques et l’aide à la sélection de gènes candidats Franck De-graeve Master ASE IIDC : Frédéric Durak UMR 8090 : Philippe Froguel

Plan Présentation et stratégie de recherche du laboratoire Objectifs L’Interface Les analyses Les résultats Conclusions et perspectives

Le laboratoire Recherche des gènes de prédisposition au diabète de type II et à l’obésité. Équipe de 40 personnes dont l’équipe bioinfo-biostatistique composée de 6 personnes Génomique et physiologie moléculaire des maladies métaboliques UMR 8090 Philippe Froguel

Sélection de gènes d’intérêts Principe de gène candidat

Intégrations des données Rs245895 Rs245548 Rs224887 Rs278415 Rs365874 Rs1558474 Rs448 Plg Plscr2 Ins Pon1 Popdc3 Prlr Proc INS GO:0016338 GO:0007299 GO:0000501 GO:0016340 GO:0001953 Gas2 Scd1 1557459_at 1557820_at 1568619_s_at 200043_at 200694_s_at AF058956 AI180687 AF031939 Y17345 AI845103 1183164 1183165 1183166 1183167 1183170 1183171 SGDB 200 listes 430 000 identifiants 8000 gènes intégrés/ 40000 gènes humains

Plan Présentation et stratégie de recherche du laboratoire Objectifs L’Interface Les analyses Les résultats Conclusions et perspectives

Objectifs Sélection des gènes candidats qui s'appuie sur une base de données Intégration de sources de données très hétérogènes Faciliter la navigation parmi les résultats

L’architecture Apache -> serveur WEB Php et Mysql -> affichage des pages dynamiques Perl et Mysql -> traitement et intégration des données Perl -> filtre et analyse des résultats R -> statistique, graphique

Plan Présentation et stratégie de recherche du laboratoire Objectifs L’Interface Les analyses Les résultats Conclusions et perspectives

Page d’accueil

Ajout de données

Base de données

Plan Présentation et stratégie de recherche du laboratoire Objectifs L’Interface Les analyses Les résultats Conclusions et perspectives

Les analyses

Récupération de la séquence Unification des types de données hétérogènes en séquence Le choix de la base de données publique dépend de la saisie de l’utilisateur Récupération au format standard (fasta): >em|U03177|FL03177 Insulin AGATACAAGGAAGTTAGAGGCTAAAACAGGATATCTGTGGTTAAGCACCTGTGAGGCCAAGAACAGTTAAACCCCGGATATAGCTGAAACAGCAGAAGTTTCGCCAGCAGTCTCCAGGCTCCCCA

Position de la séquence sur les chromosomes Recherche de la position sur le génome grâce au logiciel BLAT Adaptation du programme pour un fonctionnement en local Modification de l’étape d’alignement pour une accélération du processus de 20 à 30 fois. Récupération des gènes correspondant à cette position

Comparaison de séquence contre une banque de données Comparaison grâce au logiciel BLAST Utilisation des bases locales Synthèse des résultats de BLAT et de BLAST dans un fichier

Les processus Temps d’exécution de 1 à 2 jours Stockage des opérations dans un fichier Système multi-utilisateurs gérés grâce au PID

Plan Présentation et stratégie de recherche du laboratoire Objectifs L’Interface Les analyses Les résultats Conclusions et perspectives

Les résultats

Intégrations des données Rs245895 Rs245548 Rs224887 Rs278415 Rs365874 Rs1558474 Rs448 Rs245895 Rs245548 Rs224887 Rs278415 Rs365874 Rs1558474 Rs448 Rs245895 Rs245548 Rs224887 Rs278415 Rs365874 Rs1558474 Rs448 Rs245895 Rs245548 Rs224887 Rs278415 Rs365874 Rs1558474 Rs448 Rs245895 Rs245548 Rs224887 Rs278415 Rs365874 Rs1558474 Rs448 Rs245895 Rs245548 Rs224887 Rs278415 Rs365874 Rs1558474 Rs448 GO:0016338 GO:0007299 GO:0000501 GO:0016340 GO:0001953 GO:0016338 GO:0007299 GO:0000501 GO:0016340 GO:0001953 GO:0016338 GO:0007299 GO:0000501 GO:0016340 GO:0001953 GO:0016338 GO:0007299 GO:0000501 GO:0016340 GO:0001953 1557459_at 1557820_at 1568619_s_at 200043_at 200694_s_at 1557459_at 1557820_at 1568619_s_at 200043_at 200694_s_at 1557459_at 1557820_at 1568619_s_at 200043_at 200694_s_at 1557459_at 1557820_at 1568619_s_at 200043_at 200694_s_at 1557459_at 1557820_at 1568619_s_at 200043_at 200694_s_at AF058956 AI180687 AF031939 Y17345 AI845103 AF058956 AI180687 AF031939 Y17345 AI845103 AF058956 AI180687 AF031939 Y17345 AI845103 200 listes 430 000 identifiants 1183164 1183165 1183166 1183167 1183170 1183171 1183164 1183165 1183166 1183167 1183170 1183171 Plg Plscr2 Ins Pon1 Popdc3 Prlr Proc Plg Plscr2 Ins Pon1 Popdc3 Prlr Proc Plg Plscr2 Ins Pon1 Popdc3 Prlr Proc Gas2 Scd1 Ins Pon1 Prlr Proc SGDB INS 8000 gènes intégrés/ 40000 gènes humains

Le comptage de bloc (1) Comptage par nom de gène ? Comptage par position Identifiant A Identifiant B Identifiant AB (gène X)

Le comptage de bloc (2)

Le comptage de bloc (3)

Le format de l’UCSC Choix des données par groupes ou individuellement Choix des couleurs de piste

Le format de l’UCSC (2) Récupération du fichier http://genome.ucsc.edu/cgi-bin/hgGateway Position -> chr11:2,131,213-2,145,372 Visualisation des blocs

GMOD (1) Permet de "naviguer" le long du génome Prend en charge le format GFF, stockage dans une base SQL Jeux de données présent pour effectuer des tests Grande souplesse de configuration Données de l’homme disponibles sur le site de l’UCSC

GMOD (2)

Plan Présentation et stratégie de recherche du laboratoire Objectifs L’Interface Les analyses Les résultats Conclusions et perspectives

Conclusions (1) Problème de temps de réponse - Optimisation de programmes - Système de cache sur disque - Base de données au lieu de fichier (GMOD) Problème de configuration système - Installation de packages - Problème de droits - Mysql en service

Conclusions (2) Travail en interaction avec - Biologiste (utilisateurs) - Équipe bio-informatique - Administrateur système Utilisation d’un large panel de technologies - DB (Mysql) - Web (apache, php) - Programmation (perl) - Système (gestion des packages)

Perspectives Ajout de nouvelles stratégies pour l’identification basée sur des tables de correspondance Pondération sur les scores Enrichissement quotidien de la base de données par les utilisateurs

Perspectives Développement dans le cadre du projet ANR Gènes sélectionnés par cet outil seront étudiés par des études génétiques Mise en ligne sur Internet avec une publication dans un journal de biologie Internet Local Données partielles publiées complètes confidentielles

Remerciements Sophie Gallina Christophe Wachter David Le Guilcher Stefan Gaget Jean-Claude Chèvre Ainsi que toute l’équipe du laboratoire