8 Avril, 2005 Zhu, Xiao Agglomération (Clustering) hiérarchique – Application dans l’analyse de l’expression génique.

Slides:



Advertisements
Présentations similaires
Regroupement (clustering)
Advertisements

Efficient Simplification of Point-Sampled Surfaces
Regroupement (clustering)
D B C A commande optimale (critère quadratique) et filtrage de kalman
Piecewise Affine Registration of Biological Images
Différenciation des cellules intestinales impliquées dans la sécrétion
Control of Hoxd Genes’ Collinearity during Early Limb Development
Control of Hoxd genes’ Collinearity during Early Limb Development
Modalités de contrôle post-transcriptionnel cytoplasmique
Présenté par : MOHSEN BEN HASSINE
Traitement Co-Séquentiel: Appariment et Fusion de Plusieurs Listes
Classification automatique de documents
Formation RNG octobre 2005 Aide à linterprétation des données Virginie Defamie.
Eileeen Foy, Kui Li, Chunfu Wang, Rhea Sumpter Jr
Quelle heure est-il? Il est
Groupe 1: Classes de même intervalle
Champs de Markov cachés pour la classification de gènes..
Alignement de séquences multiples
Construction de modèles visuels
RECONNAISSANCE DE FORMES
Présenté par Mathieu Almeida, Amine Ghozlane
UBLO Comparaison de génomes bactériens : questions méthodologiques autour de la définition du squelette et des boucles
BioInformatique des micropuces
The origin and evolution of synapses
1 Evaluation des Operations Relationnelles Chapitre 14, Section 14.4.
Apprentissage semi-supervisé
Planification de flux et Aménagement
Segmentation (1ère partie)
Co-expression = fonction (Eisen et al., PNAS 1998)
Apprentissage (III) Mirta B. Gordon Laboratoire Leibniz-IMAG Grenoble Dynamique des systèmes complexes et applications aux SHS : modèles, concepts méthodes.
FORMER LES ÉDUCATRICES DE CRÈCHES AU BRÉSIL Un partenariat entre : deux associations: le GREF et l’AMAS Deux collectivités: la Région Centre et la Préfecture.
Introduction Matériels et méthodes Résultats
Xavier Camard - Réunion PHENIX-France
Familles de gènes Nadia El-Mabrouk.
Les approches qualitatives et quantitatives pour la recherche comparative Anthony Sealey Université de Toronto This material is distributed under an Attribution-NonCommercial-ShareAlike.
Analyser les données: Calculation de la moyenne, la médiane et le mode
A Drosophila model for LRRK2-linked parkinsonism
Les subtélomères des chromosomes des hémiascomycètes Nantes, octobre 2006 Cécile Fairhead Génétique Moléculaire des Levures Institut Pasteur, Paris.
Karima Tabari1, Mounir Boukadoum1, Sylvain Chartier2,3, Hakim Lounis1
INF3500 : Conception et implémentation de systèmes numériques Pierre Langlois Performance de circuits.
1/17FDC janvier 2006 Alice MARASCU Florent MASSEGLIA Projet AxIS INRIA Sophia Antipolis Classification de flots de séquences basée sur une approche.
Alignement de séquences biologiques
Jean-Louis Roujean et al. CNRM/GMME, Météo-France
Mise en correspondance de deux maillages bruités
RETRO v2 « Analyse Fonctionnelle » Octobre 2007 JYR.
Arbre = réseau connexe non cyclique
Présenté par Mathieu Almeida, Amine Ghozlane
Knowledge discovery in Databases (KDD)
Découverte de connaissances
L'évaluation bibliométrique des départements des universités du G13
HISTORIQUE Les origines des techniques du positionnement multidimensionnel remontent aux travaux de Richardson (1938) qui cherchait à comprendre.
Cartographie génomes entiers
Negation ne… pas ne… pas du tout ne… jamais ne…plus ne…guère ne…rien
Abstract: In 1978, it was well established that mammals have got two types of globins that would unite to give birth to hemoglobin (2 molecules of A type.
CSI2510 Structures de données et algorithmes Analyse des algorithmes
Chaines de décroissance radioactive et Equilibre
1.
COURS DU PROFESSEUR TANGOUR BAHOUEDDINE
Segmentation (2 ième partie) Références: Sonka et al: sections 6.2.6, 10.2 (10.6) Autres: chap Forsyth chap. 4 Ballard & Brown (pour GHT) Dernière.
Reconnaissance d’objets 3D –point de vue complètement différent –pas d’invariant 3D Difficultés :
Techniques de Clustering appliquées aux risques projet Clusters de risques / groupes de personnes Risques négatifs / risques positifs.
Visual Information Solutions Multithreading. Visual Information Solutions Qu’est-ce que le multithreading ? Un thread est une partie des instructions.
Jean Gaudart1 Détection de clusters spatiaux d'évènements Jean Gaudart Labo. Biostatistiques Faculté de Médecine de Marseille.
December 11,
Retrouve le nom de l’objet
République Algérienne Démocratique et Populaire Ministère de l'Enseignement Supérieur et de la Recherche Scientifique Université Saad.
The consequences of the.
Royaume de Maroc Université Hassan Premier Settat Faculté des Sciences et Techniques de Settat LA CLASSIFICATION K-MEANS SOUS R /MATLAB Master :Automatique.
Transcription de la présentation:

8 Avril, 2005 Zhu, Xiao Agglomération (Clustering) hiérarchique – Application dans l’analyse de l’expression génique

Information via Microarray Comment interpréter un profil d’expression? Question: Quels sont les gènes de fonctions similaires?

Le Clustering Hiérarchique 1.Établir N clusters pour les N éléments 2.(a) Retrouver deux éléments de similarité maximale (moindre distance) et (b) fusionner ces deux élément pour former un seul cluster 3.Calculer la distance entre le nouveau cluster et le reste Simple Linkage : Complete Linkage : Average Linkage : 4.Répéter 2-3 jusqu’à ce que tous les éléments sont joints sous un seul cluster Regroupement hiérarchique des éléments similaires

Le Clustering Hiérarchique 1.Établir N clusters pour les N éléments Exemple de villes Italiennes BAFIMINARMTO BA FI MI NA RM TO

Le Clustering Hiérarchique 2.(a) Retrouver deux éléments de similarité maximale (b) Fusionner Exemple de villes Italiennes BAFIMINARMTO BA FI MI NA RM TO

Le Clustering Hiérarchique 3.Calculer la distance entre le nouveau cluster, ici MI/TO, et le reste Exemple de villes Italiennes BAFIMI/TONARM BA FI MI/TO NA RM D(MI/TO,NA) = min ((MI,NA), (TO,NA)) = min (754, 869) D(MI/TO,RM) = min ((MI,RM), (TO,RM)) = min (564, 669)

Le Clustering Hiérarchique Après 4 itérations Exemple de villes Italiennes BA/FI/NA/RMMI/TO BA/FI/NA/RM0295 MI/TO-0 BA NA RM FI MI TO

Retour sur le microarray Eisen et al. (1998) PNAS 95: Expression de 8600 gènes humains pour l’étude de croissance cellulaire Question: Quelles sont les gènes de fonctions similaires (Eisen et al.) –Construire une matrice de similarité (distance) –Chercher et fusionner une paire de gènes les plus similaires –Mettre à jour la table de PD (average linkage) –Répéter n-1 fois 0 24hrs

Microarray Eisen et al. (1998) PNAS 95: Construire une matrice de similarité (matrice de distances) contenant tout les gènes –Score de similarité pour les N échatillons avec Z i = intensité (en log) du gène Z sous condition i 0 i

Microarray Eisen et al. (1998) PNAS 95: Dendrogramme regroupant tous les gènes sous forme d’arbre Les gènes clustérisé plus tôt dans l’algorithme sont placés plus proches Regroupement des gènes ayant un profil d’expression similaire sous différentes conditions Corrélation entre la régulation et la fonction Yeast Analysis Control

Performance Eisen et al. (1998) PNAS 95: Mémoire –PD: O(n 2 /2) = O(n 2 ) Calculs –Recherche de minimum: O(n 2 +∑(n-i)) = O(n 2 ) –Calcul de distances: O(n 2 +∑(n-i)) = O(n 2 ) –Total: O(n 2 )

Lecture Supplémentaire Comprehensive Identification of Cell Cycle–regulated Genes of the Yeast Saccharomyces cerevisiae by Microarray Hybridization Paul T. Spellman, Gavin Sherlock, Michael Q. Zhang, Vishwanath R. Iyer, Kirk Anders, Michael B. Eisen, Patrick O. Brown, David Botstein, and Bruce Futcher Mol Biol Cell December; 9(12): 3273–3297. The Transcriptional Program in the Response of Human Fibroblasts to Serum Vishwanath R. Iyer, Michael B. Eisen, Douglas T. Ross, Greg Schuler, Troy Moore, Jeffrey C. F. Lee, Jeffrey M. Trent, Louis M. Staudt, James Hudson Jr., Mark S. Boguski, Deval Lashkari, Dari Shalon, David Botstein, Patrick O. Brown * Science, Vol 283, Issue 5398, 83-87, 1 January 1999