Formation RNG - 24-28 octobre 2005 Aide à linterprétation des données Virginie Defamie.

Slides:



Advertisements
Présentations similaires
LE SYSTÈME IMMUNITAIRE
Advertisements

6 sujets témoins (4 , 2 , BMI = 22 ± 1)
Regroupement (clustering)
Efficient Simplification of Point-Sampled Surfaces
Regroupement (clustering)
Informatique en Biologie Institut Pasteur S P I N Search in Protein Interaction Network Elisabeth Rémy Karine Robbe Mathieu Barthélémy Tuteur :
Évaluation de la qualité d'une clusterisation
Pons Nicolas, Jean-Michel Batto, S.Dusko Ehrlich, Pierre Renault
OBJECTIFS FouDanGA : Fouille de données pour lannotation de génomes dactinomycètes CONTEXTE Laccumulation des séquences.
Relations pharmaco(toxico)cinétique/pharmaco (toxico)dynamie
Génération interactive dimages projectives : Application à la Radiothérapie Pierre BLUNIER Du 01/12/2002 au 28/03/2003 Centre Léon Bérard.
Piecewise Affine Registration of Biological Images
Initiation à la bioinformatique
La voie Notch dans la différenciation intestinale
Control of Hoxd Genes’ Collinearity during Early Limb Development
Modalités de contrôle post-transcriptionnel cytoplasmique
L’éducation confrontée aux questions de santé : le Cancer
Le diagnostic moléculaire des
Concepts avancés en mathématiques et informatique appliquées
Bioinformatique =?? génomique protéomique
University of Applied Sciences Solothurn Northwest Switzerland
Pourquoi les réseaux de neurones de type « perceptron multicouche » conviennent-ils à l’apprentissage Stéphane Canu, INSA de Rouen , PSI André Elisseeff,
« Génome, adaptation et environnement »
Principe des puces à ADN
La segmentation
RECONNAISSANCE DE FORMES
Identifier les composants structurels et fonctionnels encodés dans le génome humain.
Etablissement d’une carte génomique pour l’espèce canine
UBLO Comparaison de génomes bactériens : questions méthodologiques autour de la définition du squelette et des boucles
BioInformatique des micropuces
Bi 231: Ingénierie des Protéines
Outils Bioinformatiques pour l‘Analyse du Microenvironnement Tumoral
Projet Génie Logiciel & UML, Bases de Données & Interfaces
Algorithme Génétique et Gestion de Projet
Introduction à la bioinformatique
La syndactylie chez la Holstein allemande
NORMALISATION DES LANGAGES DE PROGRAMMATION des Automates Programmables Industriels CEI Jean-Jacques DUMÉRY -1-
L’approche MAD* Par Sabrina Dubé-Morneau
Recherche heuristique dans les bases de données L’algorithme BLAST
Vers une génération automatique du mapping de sources biomédicales
NORMALISATION DES LANGAGES DE PROGRAMMATION des Automates Programmables Industriels CEI
Induction de l’expression de la frataxine avec des protéines TALEs ciblant son promoteur Dr. Jacques P. Tremblay Université Laval Québec., Canada.
Historique 1953 Découverte de la structure de l’ADN
Co-expression = fonction (Eisen et al., PNAS 1998)
U TILISER LA G ÉOGRAPHIE POUR R ENFORCER LE P ROCESSUS DE P RISE DE D ÉCISION James STEWART MEASURE Evaluation 15 février 2011 Suivi et Evaluation des.
Rates of medication errors among depressed and burnt out residents: prospective cohort study. BMJ mars 2008, Fahrenkopf et Sectish et al.
Introduction à la Pathologie Moléculaire du Gène
Les cartes conceptuelles
A Drosophila model for LRRK2-linked parkinsonism
DIFFERENTIAL REGULATION OF HOX GENES IN ENDOMETRIOSIS
Olivier Leclair, Université Laval Un algorithme de fouille dans une représentation des données par objets: une application médicale SIMON, Arnaud.
Étude de la corrélation entre la densité de marquage des cibles et la puissance du scanner lors d’une expérience de puce à ADN Axel POULET.
Banques de données en bio-informatique
Recherche Bibliographique Master 1 Sciences de la Vie
INF3500 : Conception et implémentation de systèmes numériques Pierre Langlois Flot de conception de.
Création d’une base de données pour l’intégration de données génétiques et l’aide à la sélection de gènes candidats Franck De-graeve Master ASE.
Knowledge discovery in Databases (KDD)
8 Avril, 2005 Zhu, Xiao Agglomération (Clustering) hiérarchique – Application dans l’analyse de l’expression génique.
Héritier Fabienne Pirard Nathalie Belvoix Véronique
AMDEC AMDEC : Analyse des modes de défaillances, de leurs effets et leurs criticités Origine: 1950 : USA (FMECA) 1970 : Europe.
On s‘intéressera à 3 gènes paralogues humains : HTR2A, HTR2B et HTR2C du récepteur de la sérotonine humaine (Swissprot : 5HT2A_HUMAN, 5HT2B_HUMAN, 5HT2C_HUMAN).
REGULATION DE L’EXPRESSION DES GENES
Introduction à la Bio-Informatique
Mais d’abord rappelez-vous!!
TD-2 régulation de l’expression génique
Les banques de séquences nucléiques
CHMI 4206 Bioinformatique appliquée
CHMI 4206 Bioinformatique appliquée
Reconnaissance d’objets 3D –point de vue complètement différent –pas d’invariant 3D Difficultés :
Jean Gaudart1 Détection de clusters spatiaux d'évènements Jean Gaudart Labo. Biostatistiques Faculté de Médecine de Marseille.
Transcription de la présentation:

Formation RNG octobre 2005 Aide à linterprétation des données Virginie Defamie

Formation RNG octobre Quantification des intensités de fluorescence - Normalisation des données - Tests statistiques Liste de gènes significativement modulés gènes 200 gènes modulés dizaine connus reste Comment utiliser sa liste de gènes modulés?

Formation RNG octobre 2005 Informations sur les gènes OMIM (Online Mendelian Inheritance in Man) DAVID (Database for Annotation, Visualisation and Integarted Discovery) Permet dobtenir des infos sur les gènes, les classer par fonction et les inclure dans des voies de signalisation via un lien vers KEGG. KEGG: Kyoto Encyclopedia of Genes and Genomes Schémas des voies de signalisation impliquées dans divers processus cellulaires et maladies humaines.

Formation RNG octobre 2005 Informations sur les gènes Entrez Gene sur NCBI Permet dobtenir des infos sur les gènes, leur différents symboles, position chromosomique, accès à la littérature, lien vers KEGG

Formation RNG octobre 2005 Le clustering Définition Organiser les gènes, dont les profils dexpression sont identiques, en groupes (clusters) But Révéler la fonction putative de certains gènes encore non caractérisée gènes co-exprimés peuvent être reliés fonctionnellement Identifier les gènes co-régulés Identifier rapidement un groupe de gènes régulés selon une pathologie ou un traitement

Formation RNG octobre 2005 Le clustering Clustering hiérarchique : analyse non supervisée Techniques de clusterisation: daprès la Manchester Metropolitan University 1 détermination des distances entre les gènes (méthode euclidienne) 2 liaison des gènes les plus proches (arbre hiérarchique)

Formation RNG octobre 2005 Le clustering Clustering hiérarchique : analyse non supervisée

Formation RNG octobre 2005 Le clustering Le k means clustering : analyse supervisée Permet le classement des gènes dans un nombre fixe de classe (k) défini par lutilisateur. Les gènes sont classés en clusters et dans chaque cluster la distance moyenne entre les gènes est la plus petite possible. Les gènes sont déplacés de clusters en clusters jusquà que tout changement naméliore plus le système. Le logiciel minimise la variabilité au sein des clusters et maximise la variabilité entre clusters. SOM (self organizing map) : analyse supervisée Principe similaire au k means mais calculs par rapport au centroids. Le centroid de chaque cluster est redéfini jusquà ce que les clusters restent dans des localisations stables.

Formation RNG octobre 2005 Le clustering Set de 50 microarray homme. min max Identification de gènes tissu ou cellule spécifiques. Cluster 1 Cluster 2 Cluster 3 Cluster 4 Leuco.Ker. Nas.ep.Liver Chaque ligne correspond au niveau dexpression dun gène dans les différents types cellulaires. Niveau dexpression :

Formation RNG octobre 2005 Le clustering MeV: MultiExperiment Viewer Logiciels disponibles sur le web Genesis J-express

Formation RNG octobre 2005 EASE (Expression Analysis Systematic Explorer) EASE disponible sur le web: Permet de définir des familles fonctionnelles à partir dune liste de gènes dintérêt. EASE utilise les bases de données DAVID, KEGG, Entrez Gene…

Formation RNG octobre 2005 EASE (Expression Analysis Systematic Explorer) Liste gène modulés sous format.txt

Formation RNG octobre 2005 EASE (Expression Analysis Systematic Explorer) Liste gène présents sur la puce sous format.txt

Formation RNG octobre 2005 EASE (Expression Analysis Systematic Explorer)

Formation RNG octobre 2005 EASE (Expression Analysis Systematic Explorer) Étude des gènes modulés lors de la régénération hépatique chez la souris. Cinétique de régénération 0, 2, 16 et 40 heures post hépatectomie.

Formation RNG octobre 2005 EASE (Expression Analysis Systematic Explorer) Identification des thèmes biologiques les plus important grâce à EASE en donnant un score statistique EASE ou FISHER. Conclusion: réorganisation du cytosquelette surexpression des protéines impliquées dans la synthèse dADN au profit des protéines de fonctionnement hépatique

Formation RNG octobre 2005 PAM (Prediction Analysis of Microarrays) 1 Installation de R (cours Pascal Barbry) 3 Exécution du programme sur Excel 2 PAM Objectifs: identifier un set de gènes modulés en fonction des condition asthme vs témoin diagnostic prédictif de nouveaux patients rhinite ou asthme? Exemple biologique

Formation RNG octobre 2005 PAM (Prediction Analysis of Microarrays)

Formation RNG octobre 2005 PAM (Prediction Analysis of Microarrays)

Formation RNG octobre 2005 PAM (Prediction Analysis of Microarrays) % erreur dans la prédiction Trouver le juste milieu entre un nombre de gènes prédictifs satisfaisant et % derreur le plus petit possible

Formation RNG octobre 2005 PAM (Prediction Analysis of Microarrays) Entrée des données dont le diagnostique des patients est inconnu (Rhinite ou asthme?)

Formation RNG octobre 2005 PAM (Prediction Analysis of Microarrays)

Formation RNG octobre 2005 Genomatix Logiciel payant disponible sur

Formation RNG octobre 2005 Genomatix 1.Créer des liens entre les gènes de la liste de gènes modulés 2.Voies de signalisation et voies métaboliques 3.Étude des facteurs de transcription et de leurs cibles

Formation RNG octobre 2005 Genomatix Analyse des promoteurs Identifier les gènes co-réguler

Formation RNG octobre 2005 Conclusion Il existe plusieurs façons daborder ses données selon la question biologique posée. Analyse gène par gène Analyse globale (gènes corégulés…) Dégager un set de gènes prédictifs dune pathologie