Formation RNG octobre 2005 Aide à linterprétation des données Virginie Defamie
Formation RNG octobre Quantification des intensités de fluorescence - Normalisation des données - Tests statistiques Liste de gènes significativement modulés gènes 200 gènes modulés dizaine connus reste Comment utiliser sa liste de gènes modulés?
Formation RNG octobre 2005 Informations sur les gènes OMIM (Online Mendelian Inheritance in Man) DAVID (Database for Annotation, Visualisation and Integarted Discovery) Permet dobtenir des infos sur les gènes, les classer par fonction et les inclure dans des voies de signalisation via un lien vers KEGG. KEGG: Kyoto Encyclopedia of Genes and Genomes Schémas des voies de signalisation impliquées dans divers processus cellulaires et maladies humaines.
Formation RNG octobre 2005 Informations sur les gènes Entrez Gene sur NCBI Permet dobtenir des infos sur les gènes, leur différents symboles, position chromosomique, accès à la littérature, lien vers KEGG
Formation RNG octobre 2005 Le clustering Définition Organiser les gènes, dont les profils dexpression sont identiques, en groupes (clusters) But Révéler la fonction putative de certains gènes encore non caractérisée gènes co-exprimés peuvent être reliés fonctionnellement Identifier les gènes co-régulés Identifier rapidement un groupe de gènes régulés selon une pathologie ou un traitement
Formation RNG octobre 2005 Le clustering Clustering hiérarchique : analyse non supervisée Techniques de clusterisation: daprès la Manchester Metropolitan University 1 détermination des distances entre les gènes (méthode euclidienne) 2 liaison des gènes les plus proches (arbre hiérarchique)
Formation RNG octobre 2005 Le clustering Clustering hiérarchique : analyse non supervisée
Formation RNG octobre 2005 Le clustering Le k means clustering : analyse supervisée Permet le classement des gènes dans un nombre fixe de classe (k) défini par lutilisateur. Les gènes sont classés en clusters et dans chaque cluster la distance moyenne entre les gènes est la plus petite possible. Les gènes sont déplacés de clusters en clusters jusquà que tout changement naméliore plus le système. Le logiciel minimise la variabilité au sein des clusters et maximise la variabilité entre clusters. SOM (self organizing map) : analyse supervisée Principe similaire au k means mais calculs par rapport au centroids. Le centroid de chaque cluster est redéfini jusquà ce que les clusters restent dans des localisations stables.
Formation RNG octobre 2005 Le clustering Set de 50 microarray homme. min max Identification de gènes tissu ou cellule spécifiques. Cluster 1 Cluster 2 Cluster 3 Cluster 4 Leuco.Ker. Nas.ep.Liver Chaque ligne correspond au niveau dexpression dun gène dans les différents types cellulaires. Niveau dexpression :
Formation RNG octobre 2005 Le clustering MeV: MultiExperiment Viewer Logiciels disponibles sur le web Genesis J-express
Formation RNG octobre 2005 EASE (Expression Analysis Systematic Explorer) EASE disponible sur le web: Permet de définir des familles fonctionnelles à partir dune liste de gènes dintérêt. EASE utilise les bases de données DAVID, KEGG, Entrez Gene…
Formation RNG octobre 2005 EASE (Expression Analysis Systematic Explorer) Liste gène modulés sous format.txt
Formation RNG octobre 2005 EASE (Expression Analysis Systematic Explorer) Liste gène présents sur la puce sous format.txt
Formation RNG octobre 2005 EASE (Expression Analysis Systematic Explorer)
Formation RNG octobre 2005 EASE (Expression Analysis Systematic Explorer) Étude des gènes modulés lors de la régénération hépatique chez la souris. Cinétique de régénération 0, 2, 16 et 40 heures post hépatectomie.
Formation RNG octobre 2005 EASE (Expression Analysis Systematic Explorer) Identification des thèmes biologiques les plus important grâce à EASE en donnant un score statistique EASE ou FISHER. Conclusion: réorganisation du cytosquelette surexpression des protéines impliquées dans la synthèse dADN au profit des protéines de fonctionnement hépatique
Formation RNG octobre 2005 PAM (Prediction Analysis of Microarrays) 1 Installation de R (cours Pascal Barbry) 3 Exécution du programme sur Excel 2 PAM Objectifs: identifier un set de gènes modulés en fonction des condition asthme vs témoin diagnostic prédictif de nouveaux patients rhinite ou asthme? Exemple biologique
Formation RNG octobre 2005 PAM (Prediction Analysis of Microarrays)
Formation RNG octobre 2005 PAM (Prediction Analysis of Microarrays)
Formation RNG octobre 2005 PAM (Prediction Analysis of Microarrays) % erreur dans la prédiction Trouver le juste milieu entre un nombre de gènes prédictifs satisfaisant et % derreur le plus petit possible
Formation RNG octobre 2005 PAM (Prediction Analysis of Microarrays) Entrée des données dont le diagnostique des patients est inconnu (Rhinite ou asthme?)
Formation RNG octobre 2005 PAM (Prediction Analysis of Microarrays)
Formation RNG octobre 2005 Genomatix Logiciel payant disponible sur
Formation RNG octobre 2005 Genomatix 1.Créer des liens entre les gènes de la liste de gènes modulés 2.Voies de signalisation et voies métaboliques 3.Étude des facteurs de transcription et de leurs cibles
Formation RNG octobre 2005 Genomatix Analyse des promoteurs Identifier les gènes co-réguler
Formation RNG octobre 2005 Conclusion Il existe plusieurs façons daborder ses données selon la question biologique posée. Analyse gène par gène Analyse globale (gènes corégulés…) Dégager un set de gènes prédictifs dune pathologie