La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Les biopuces et le grand séquençage: des outils pour comprendre le vivant à léchelle génomique Philippe Kastner ESBS – septembre 2009 Partie 3: applications.

Présentations similaires


Présentation au sujet: "Les biopuces et le grand séquençage: des outils pour comprendre le vivant à léchelle génomique Philippe Kastner ESBS – septembre 2009 Partie 3: applications."— Transcription de la présentation:

1 Les biopuces et le grand séquençage: des outils pour comprendre le vivant à léchelle génomique Philippe Kastner ESBS – septembre 2009 Partie 3: applications

2 Utilisation des biopuces pour létude du transcriptome 1.Conception dune expérience de microarray 2.Méthodes danalyse 3.Exemples dapplication

3 Comment concevoir une expérience de microarrays ? But: déterminer les variations biologiques entre différents échantillons. Mais il faut distinguer celles-ci des variations liées à la technologie, ou à celles liées à la variabililé intrinsèque des échantillons

4 Thomas Hudson, Montreal Genome Center

5 Intensité croissante

6 6 échantillons: A1, A2, A3, B1, B2, B3 Microarray comprenant gènes échelle dexpression: Mesures pour un gène X A1A2A3B1B2B Test t: p = 0,01 Pour combien de gènes une telle valeur peut-elle être obtenue par hasard ? (« false discovery rate », ou FDR) Différences dexpression réelles ou artéfactuelle ?

7 ComparaisonNombre de gènes différentiels (Changement > 2x, p <0,01) (A1, A2, A3) vs (B1, B2, B3)300 (A1, B2, A3) vs (B1, A2, B3)150 (A1, B2, B3) vs (B1, A2, A3)200 (A1, A2, B1) vs (B2, B3, A3)100 Estimation du nombre de gènes différentiels « réels » La moitié des gènes différentiels est artéfactuelle ! Solutions: multiplier les réplicats augmenter la stringence des critères de sélection.

8 Number of replicatesType of sample Cell lines Mouse cells Mouse organs Human cells Human tumors Interested byBig changes >30 Small changes >60 variabilité Combien de réplicats sont-ils nécessaires pour une expérience réussie ?

9 Deux grands types de méthodes de « clustering » A.Méthodes hiérarchique: génération dun dendogramme (arbre) qui relie tous les gènes ou échantillons entre eux. B. Méthodes par partitionnement, qui divise les gènes en K classes ayant des profils similaires (K défini par lutilisateur) - K-means - Self-organizing maps (SOM) - analyse par composantes principales (PCA)

10 Regroupement en fonction de profils dexpression similaires 1. Gènes Évolution temporelle de lexpression des gènes dans des fibroblastes humains stimulés par du sérum (Pat Brown, 1997) Visualisation dune chorégraphie de lexpression génique dans le temps. 700 gènes (Première expérience publiée de microarrays)

11 Different cell lines to be compared Genes belonging to one cluster Fold Changes Regroupement en fonction de profils dexpression similaires 2. échantillons

12 –N expériences – chaque gène est considéré comme un vecteur dans un espace de dimension N (coordonnées = valeurs dexpression dans chaque expérience) – Partitionnement des gènes en K classes optimisées selon des critères de proximité des gènes dans lespace vectoriel Méthodes par partitionnement (K-means, Fuzzy C-means, Self organizing maps)

13 Analyse par partitionnement de données correspondant à 5 types de leucémies T (20 groupes) Visualisation et sélection des classses de gènes intéressantes

14 Ikaros TelJak2 Tal-Lmo1 bcat Analyse par partitionnement de données correspondant à 5 types de leucémies T (20 groupes)

15 B-catenin ICN1 Ikaros TelJak2 Tal-Lmo1 Visualisation des clusters FCM (4208 genes)

16 Applications des microarrays 1. Expression différentielle Question: pourquoi B est-il différent de A ? (KO vs WT; effet dun traitement; sain vs malade, etc …) Comparaison de A et B200 gènes différentiels !! Et ensuite ??? ….Extraction dun sens biologique -Analyse biographique - Annotation fonctionnelle des gènes (gene ontology: codification des annotations) Identification de gènes candidats ou voies moléculaires

17 Exemple 1: Lymphomes thymiques chez des souris mutantes pour le gène Ikaros Recherche de la voie moléculaire impliquée dans le développement de ces tumeurs par une analyse du transcriptome.

18 6 Ik L/L tumors 4 Tel-Jak2 tumors 5 non tumoral thymocytes Genes specifically deregulated in Ik L/L tumors ? Conception expérimentale

19 Hes1 Notch1 Deltex 1 pT Notch upregulation is associated with tumors lacking Ikaros Ik L/L tumors Ik L/L tumor TelJak2 tumors Notch pathway signature Expérience fondatrice dun projet concernant le rôle dIkaros dans la régulation de la voie Notch.

20 Applications des microarrays 2. Transcriptome comme mesure phénotypique dun système biologique Concept: Profil apparenté de lexpression des gènes implique une similitude détat biologique Application principale: classification des tumeurs

21 2285 échantillons de tumeurs de 20 types de cancer différents 2198 probe sets Meta-analysis of 2285 tumors, from 20 different cancer types Projet « carte didentité des tumeurs » de la Ligue contre le Cancer

22 Example 2 : Cancer Expression Analysis Large Diffuse B-Cell Lymphomas (LDBCL) No reliable indicators to subtype them Analysis of >100 LDBCL samples, as well as normal subsets of B lymphocytes Hybridise to 18K human lymphoma slide Alizadeh et al., Nature 2000 Distinct types of diffuse large B-cell lymphoma identified by gene expression profiling.

23

24 Identification de deux groupes de tumeurs distincts

25 Mortality and LDBCL Pronostic différent pour les deux groupes de tumeurs

26 Signature transcriptomique Ensemble de gènes caractéristiques dun état biologique donné -type cellulaire (ex: signature des pDCs) - stimulation dune voie moléculaire (ex: Notch)

27 Exemple 3: analyse de la signature de cellules dendritiques plasmacytoïdes Liu et al, Nature Immunol, 2004

28 Comment les pDCs se développent-elles ? Controverses dans la littérature: Les pDCs sont-elles apparentées aux cellules myéloïdes (macrophages, monocytes) ou lymphoïdes (lymphocytes) ? Les pDCs sont-elles apparentées aux autres types de cellules dendritiques « conventionnelles », impliquées dans la présentation des antigènes ?

29 Une vue génomique des cellules dendritiques 1.Assemblage de profils dexpression génique pour la plupart des types cellulaires immunitaires (macrophages, neutrophiles, lymphocytes B, T, NK, pDCs, cDCs) = « compendium » 2. Pour lhomme et la souris 3.Clustering pour visualiser les distances entre lignage 4.Identification de programmes dexpression géniques conservés Robbins et al, 2008 (Genome Biology)

30 Hierarchical clustering Principal component analysis (PCA) (Projection on first 2 dimensions) 1. SOURIS Similitude des profils transcriptomiques des DC

31 2. HOMME Publicly available datasets on Affymetrix U133 v2 Similitude des profils transcriptomiques des DC

32 Pan-DC genes pDC specific genes (500 genes) Conventional DC genes Signature des DC de souris (Fuzzy C-means clustering)

33 Signatures des DC humaines pDC genes Pan DC genes Conventional DC genes

34 B cellsT cellspDCscDCs Ebf1Camk4Epha2Arhgap22 Cd N04RikPacsin1Btbd4 Klhl14Trat1Zfp521Slamf8 Bank1CxCr6Sh3bgr l03Rik Pax5Tnfrsf25Tex2Nav1 Blr1Ccdc64Runx2Ct2a Ralgps2Plcg1Atp13a2Avpi1 CD79bLatMaged1Spint1 Gènes les plus fortement associés à des types de cellules spécifiques Rouge: connu pour être spécifique de ces lignages

35 Conclusion des études transcriptomiques Proximité des programmes géniques des pDC et cDC: les DC constituent-elles une branche développementale séparée du système hématopoîétique ? Signatures conservées entre lhomme et la souris Les gènes spécifiques des DCs sont largement inconnus

36 Exemple 4: Absence de cellules dendritiques plasmacytoïdes (pDC) chez les mutants IkL/L

37 Les pDC sont-elles bloquées dans leur différenciation dans la moelle osseuse ? Présence dune population exprimant un marqueur des pDC, 120G8, mais pas B220

38 Analyse du transcriptome (Affymetrix: gènes) Comparaison à divers types cellulaires hématopoïétiques La population 120G8+ mutante appartient-elle au lignage des pDC ?

39 Surexpression de la plupart des gènes dérégulés (scatter plot)

40 Les pDC IkL/L possèdent la signature pDC Dérégulation (surexpression) dun grand nombre de gènes Sous-signature commune avec les DC conventionnelles Visualisation des gènes spécifiques des populations WT et mutantes Clustering hiérarchique)

41 Applications des microarrays 3. Data mining Recherche dinformations « cachées » dans les données de transcriptome Confrontation des données: - à dautres sets de données transcriptomiques - aux données de séquence et dorganisation des génomes - aux données de fonctions des gènes

42 Nature Genetics 22, 281 (1999) Question: En confrontant les séquences des promoteurs de gènes co-régulés, peut- on découvrir de nouvelles séquences régulatrices ? Données: de transcriptome du cycle cellulaire de levure (2 cycles) 1.partition en 30 classes de gènes (K-means) 2. pour chaque classe: Enrichissement par rapport à une fonction ? Présence de motifs spécifiques dans les promoteurs (1kb en amont du site dinitiation)? méthode: déplacement dune fenêtre de 10pb à travers la séquence, recherche de séquences homologues dans les autres gènes du cluster calcul dun score (MAP score). Si MAP score >10, = significatif Exemple 5: Profils dexpression et recherche de motifs régulateurs

43 18 motifs dans 12 clusters Motifs spécifiques dun cluster donné Éléments régulateurs connus et inconnus Identification de nouveaux sites régulateurs

44 Gènes co-exprimésMotif régulateur commun ? Présence dun ou plusieurs motifs donné Gènes corégulés ?

45 General scheme (1) clustering-based approaches for finding motifs from gene expression and sequence data classify

46 General scheme (2) sequence(/knowledge)-based approaches for finding motifs from gene expression and sequence data

47 Données: levures cultivées dans différentes conditions Etude des promoteurs des groupes 1 et 4: enrichissement de deux motifs régulateurs, PAC et RRPE, souvent présents de façon conjointe.

48 Question: la présence de lun ou des deux motifs PAC et/ou RRPE permet-elle de prédire la régulation du gène correspondant? Très bonne corrélation des profils dexpression qui contiennent la suite RRPE, PAC

49 Idée: gènes aux fonctions similaires sont régulés de façon similaire Compendium : base de données de profils dexpression (levures cultivées dans différentes conditions, souches mutantes, etc …) Gène à la fonction inconnue: - profil dexpression similaire à ??? - Souche mutante pour ce gène: profil similaire à ??? Exemple 6: découverte de fonction de gènes

50 Exemple: découverte de la fonction du gène YER044C Gènes Souches mutantes Forte association avec des gènes impliqués dans la synthèse de lergostérol Validation fonctionelle

51 Question: la comparaison des profils dexpression géniques et des localisations chromosomiques permet-elle didentifier des région de gènes corégulés ? Données: cycle cellulaire de la levure 1. Pour tous les couples de gènes, calcul des corrélation des profils dexpression (valeurs entre -1 et 1) 2. Représentation par ordre sur les chromosomes Exemple 7: recherche de gènes voisins co-régulés

52 Exemple de résultats

53 Question: lexpression des gènes humains varie-t-elle en fonction de domaines chromosomiques ? 1.Mesure du niveau dexpression de tous les gènes humains dans 12 tissus (SAGE) 2. Représentation du niveau dexpression en fonction de la position géographique sur les chromosomes Exemple 8: influence de la localisation chromosomique sur le niveau dexpression génique

54 Exemple: chromosome 11 tissus Intégration du niveau dexpression sur une fenêtre de 39 gènes Positions sur le chromosome Identification de domaines dexpression génique élevée (RIDGE) influence de lenvironnement chromosomique large sur la façon dont un gène est exprimé

55 Variations importantes des niveaux dexpression entre chromosomes

56 Corrélation entre densité génique et niveaux dexpression

57 Biopuces Analyse sans à priori des systèmes biologique: outils puissant générer des hypothèses Analyse globale, permettant de révéler des propriétés nouvelles, non visibles par des études restreintes.


Télécharger ppt "Les biopuces et le grand séquençage: des outils pour comprendre le vivant à léchelle génomique Philippe Kastner ESBS – septembre 2009 Partie 3: applications."

Présentations similaires


Annonces Google