La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Transcriptome Introduction aux biopuces et à lanalyse du transcriptome Emmanuel Prestat.

Présentations similaires


Présentation au sujet: "Transcriptome Introduction aux biopuces et à lanalyse du transcriptome Emmanuel Prestat."— Transcription de la présentation:

1 Transcriptome Introduction aux biopuces et à lanalyse du transcriptome Emmanuel Prestat

2 Transcriptome Les différentes puces Mesures dexpression Etude du nombre de copies Analyse de polymorphisme Puces à tissus, à cellules, à immunoprécipition

3 Transcriptome Mesures dexpression Biopuces les plus utilisées à ce jour (premières auxquelles on pense, quand on parle de puces à ADN) Principe : –les sondes, petits fragments dADN (20 à 50 nt) complémentaires à chaque gène ciblé, sont déposées sur une lame de verre, type lame de microscope ; –Les cibles, ARNm ou ADNc issus dARNm, sont marquées (radioactivité ou fluorescence) puis hybridées avec la lame sur laquelle les sondes sont déposées

4 Transcriptome Transcription

5 Transcriptome La technologie des puces bifluorescentes

6 Transcriptome Dépôt des sondes (« spotting »)

7 Transcriptome Dépôt des sondes (« spotting »)

8 Transcriptome Puces à oligo : pas de « spotting » ! Procédé Affymetrix (et NimbleGene…)

9 Transcriptome Particularités des puces Affymetrix La fabrication in situ des sondes Leur ultra-haute densité : jusquà 1,3 millions dobjets Leur design : –Objets carrés –Pas despace entre eux –Concept de probeset –Concept de PM et MM

10 Transcriptome Puces Affymetrix

11 Transcriptome Préparation des échantillons (cibles) Extraction dARN Kit Amplification PCR Marquage –Radioactivité (S 35, P 32 ) –Fluorescence (Cy3 - vert, Cy5 - rouge) En général réalisé en même temps que lamplification: utilisation dune amorce de PCR marquée Digestion (λ-exonucléase) ADN simple brin

12 Transcriptome Lhybridation Séchage des cibles et reprise dans un tampon dhybridation Volume dhybridation : 3 à 50 μl (entre lame et lamelle) attention à lévaporation ! à répartir sur lensemble de la surface de la puce Température dhybridation 45 65°C –+ la température, + le signal dhybridation –+ la température, + lhybridation aspécifique Temps dhybridation 1h 12h dans une chambre dhybridation

13 Transcriptome Le lavage Après hybridation, lavage de la lame, pour éviter –Ladsorption de fluorescence sur le support –Les hybridations aspécifiques Conditions de lavage : –Dans des solutions de plus en plus stringentes Evaluation de la qualité du lavage (et de lhybridation) –Témoins positifs et négatifs –Répartition aléatoire sur la lame vérification : pas deffet de localisation, de bord

14 Transcriptome Acquisition des images Extraction des données Excitation Amplification du signal (PMT) Émission Laser 1Laser 2 Fluorescence verte Fluorescence rouge (Ech 1) (Ech 2)

15 Transcriptome Acquisition des images Etat excité Etat stable Spectre dexcitation & Spectre démission

16 Transcriptome Choix des fluorochromes Fluorescence verte Fluorescence rouge

17 Transcriptome « Vrais » images et images d« interprétation »

18 Transcriptome Pas si simple…

19 Transcriptome Pas si simple… Queues de comètesBavures Mauvais blocage du processus pendant la phase dhybridation Sondes/Cibles Spotting ? Lavage ?

20 Transcriptome Pas si simple… …etc

21 Transcriptome Différences avec les puces radioactives Marquage radioactif (!) Une seule condition expérimentale Le support est une membrane Maximum : 2400 dépôts par membrane (on les appelle parfois les macroarrays)

22 Transcriptome Extraction des données à partir de limage 1.Adressage – Localisation 2.Segmentation 3.Extraction de linformation (pour chaque spot) - signal dintérêt - bruit local (autour de chaque spot) - morphologie (surface, périmètre…)

23 Transcriptome Méthodes de segmentation Cercles fixes

24 Transcriptome Méthodes de segmentation Cercles fixes / rotation & distorsions ! Cercles fixes / variabilité du spot GenePix Pro 4.0

25 Transcriptome Méthodes de segmentation Cercles adaptables : modifier position du cercle modifier la taille du cerle

26 Transcriptome Méthodes de segmentation Dérivée seconde Détection de contours

27 Transcriptome Méthodes de segmentation Détection de contours vs cercles fixes

28 Transcriptome Méthodes de segmentation Adams R et Bishof Détection de régions (graines ou agrégation de pixels)

29 Transcriptome Méthodes de segmentation Détection de régions : seuillage (ou histogrammes) Détection de régions (Watershed Function) Morphologie mathématique

30 Transcriptome Mesure du bruit de fond

31 Transcriptome Quelques chiffres Diamètre des spots : µm Capacité totale : spots / lame ; 2-10 ng ac.nucl./spot Distance entre les spots : 100 µm – 600 µm Durée de conservation : 9 mois Conditions optimum de conservation : 2 – 8 °C Durée totale de préparation : 3 jours Préparation dun échantillon : 2 jours Hybridation : 16 heures Lavage : 1 heure Scan : minutes

32 Transcriptome Normalisation de biopuces : pourquoi ? «Traitement visant à ajuster les données selon les effets des variations dues à la technologie plutôt quà des différences biologiques » Yang et al. 2002

33 Transcriptome Normalisation de biopuces : pourquoi ?

34 Transcriptome Normalisation de biopuces : pourquoi ? Effet microplaque (ou aiguille)

35 Transcriptome Normalisation de biopuces : pourquoi ?

36 Transcriptome Normalisation de biopuces : pourquoi ? Après normalisation qui tient compte de la variabilité due aux différentes aiguilles du « spotter ». Rmq : la normalisation inter-lames observe le même principe

37 Transcriptome Analyse de données Identification de gènes DE –Fold change –Tests statistiques Identification de gènes DE (plus de 2 conditions) Répétitions (quel type, combien ?)

38 Transcriptome Fold change Avantage : sens pour un biologiste Fold Change =expression value sample 1/ expression value sample 2 Décision : –Quel seuil ? –Même pour tous les gènes Inconvénients –Seulement les valeurs moy, sans tenir compte de la variabilité sont considérées –Les gènes ayant une expression très variable, ont plus de chance de dépasser le seuil aléatoirement

39 Transcriptome Tests à un facteur

40 Transcriptome Tests à un facteur Paramétriques –Condition de normalité Transormation Log => Transformer les données !

41 Transcriptome Tests à un facteur Tests non paramétriques –Ne supposent pas la normalité –Ne supposent pas lhomoscédasticité –Lutilisation des rangs à la place des valeurs dintensité : Diminue leffet des outliers Ne sont pas affectés par la log-transformation –Pas recommandés si les échantillons ont peu de répétitions

42 Transcriptome Volcano plot Combine les p-values et fold changes Quest-ce qui est biologiquement important ? –La significativité des différences –Leur valeur Quels seuils ? –Combien veut-on identifier de gènes ? –Où sont les contrôles ? Le t-test modéré fait quelque-chose de similaire

43 Transcriptome Quel seuil de p-value choisir ? Dépend du type derreur –Type 1 Faux positifs => identifie des gènes différentiellement exprimés alors quils ne le sont pas –Type 2 Faux négatifs => ne détecte pas certains gènes pourtant différentiellement exprimés dans la réalité

44 Transcriptome Correction des tests multiples Le problème… –Ho = lexpression moyenne du gène X est la même pour toutes les populations comparées –Identification des gènes DE : autant de tests à faire que de gènes considérés –Nombre moyen de faux positifs : G. Exemple –G = gènes – = 0.05 => G. = 1250 faux positifs…

45 Transcriptome Correction des tests multiples Méthodes de correction des p-values –Correction FWER (Family-Wise Error Rate) FWER = proba- dobtenir au moins 1 faux positif Méthodes utilisées : –Bonferroni –Bonferroni step-down (Holm) –Westfall and Young permutation –Correction FDR (False Discovery Rate) FDR = taux attendu de faux positifs Méthode utilisée –Benjamini et Hochberg

46 Transcriptome Lequel utiliser ? FWER: ne tolère pas de faux positifs (Ho est difficilement rejeté) => procédure très conservative FDR : moins conservatif, on estime le pourcentage de FP parmi les gènes « appelés » Aucun : le pourcentage de FP est estimé sur lensemble des gènes testés

47 Transcriptome Tests bi-facteurs ANOVA –Comme un t-test avec + de deux conditions –Mesure les effets de différents facteurs ainsi que leurs interactions –ANOVA 2 Test deux facteurs 3 tests –Temps –Traitement –Interaction entre les 2 (additif ? Multiplicatif ?)

48 Transcriptome Importance des répétitions

49 Transcriptome Classification But : Regrouper une collection dobjets de façon à ce que les objets dune partition soient plus liés entre eux quavec les objets dune autre partition Analyse discriminante (classification supervisée) : les classes sont définies Classification (non-supervisée) : on ne connaît pas les classes

50 Transcriptome Classification Exemples : –Traitement/contrôle, malade/normal, thérapie efficace/sans succès,… –Si on a des informations sur la façon de classer les échantillons, elles devraient être intégrées dans la méthode

51 Transcriptome Les données Genes (thousands) Experimental conditions (from tens up to no more than a few houndreds) AB C Expression profile of a gene across the experimental conditions Expression profile of all the genes for a experimental condition (array) Different classes of experimental conditions, e.g. Cancer types, tissues, drug treatments, time survival, etc. La plupart des gènes sont non-informatifs pour le trait étudier Le nombre de variables est plus important (plusieurs ordres de magnitude) que le nombre dexpériences Caractéristiques

52 Transcriptome Classification : corrélations et distances Corrélations : –Pearson : corrélation entre les valeurs –Sperman : corrélation de rangs (réduit leffet des variations extrèmes) => Prend en compte les tendances Spearman confidence (mesure de similarité) = 1 - p- value Distance euclidienne => différences entre coordonnées Distance de manhattan (somme des différences absolues pour toutes les coordonnées du vecteur) => plus robuste

53 Transcriptome Classification hiérarchique Arbre des gènes Arbre des conditions Exemple : UPGMA Alizadeh et al., Nature 2000

54 Transcriptome Classification non- hiérarchique K-means : minimisation de la variance intra-classe (le nombre de classes est une instance) ACP : rotation de la base maximisant les variances SOM (Self Organising Maps)

55 Transcriptome Classification supervisée = « class prediction » Quelques méthodes: –Bayes –Analyse discriminante linéaire –Les k plus proches voisins (k-NN) –Les arbres de classification (CART)

56 Transcriptome Autre type de puce analysant le transcriptome Puces à exons : Analyse de lépissage

57 Transcriptome Principe du CGH

58 Transcriptome Analyse des puces CGH

59 Transcriptome Objectifs de létude statistiques

60 Transcriptome Analyse de polymorphisme Les Single Nucleotide Polymorphims (S.N.P) désignent des variations d'une seule paire de base du génome, entre individus d'une même espèce (e.g. 1/1000 paire de bases dans le génome humain). On parlera de formes alléliques synonymes dans le cas où plusieurs formes d'un SNP mènent à la même séquence polypeptidique, et de formes non-synonymes dans le cas où les séquences produites diffèrent. Les SNP qui se retrouvent dans des régions non-codantes peuvent avoir des conséquences sur l'épissage, les facteurs de transcription, ou sur les séquences d'ARN non-codant

61 Transcriptome Une séquence d'ADN contenant un site SNP. Les allèles A et G sont illustrés. Une région chromosomique où seuls les SNP sont montrés. Trois haplotypes sont illustrés. Les deux SNP colorés suffisent à identifier (marquer) chacun des haplotypes. Par exemple, si les deux sites SNP marqueurs du chromosome portent les allèles A et T, on peut déduire qu'il s'agit du premier haplotype. Les SNP

62 Transcriptome Puces SNP Exemple : Affymetrix Genome-Wide Human SNP Array million markers for genetic variation single nucleotide polymorphisms (SNPs) 946,000 probes for the detection of copy number variation

63 Transcriptome ChIP-on-Chip (étude des points de contacts entre une protéine et tout le génome)

64 Transcriptome64 Problématique biologique du TP Buchnera est une bactérie symbiotique intracellulaire associée à la majorité des pucerons. Lassociation est très ancienne (250 Ma). Les partenaires sont devenus dépendants. Buchnera possède un génome de taille très réduite (400 à 600 kb), très riche en bases A et T et incluant de nombreuses mutations délétères (adaptatives ?). -> Bon modèle détude à un niveau théorique (simple) -> très difficile à manipuler expérimentalement (incultivable) Le génome de Buchnera est « dégénéré » -> Comment Buchnera régule-t-elle lexpression des ces gènes ? -> Comment Buchnera sadapte-t-elle aux variations des besoins nutritionnels de lhôte ?

65 Transcriptome65 La puce Buchnera aiguille 1 aiguille 2 aiguille 3 aiguille 4 == bloc (12 x 16) Contrôles (+ et -) Doublets de spots Oligo 5 Oligo 3 3 ème oligo Superposition des 2 images (R et G)

66 Transcriptome66 Approche comparative (non cinétique) –Expérience Naas (16 lames) : Milieu équilibréMilieu déséquilibréen AA riche en saccharoseAB pauvre en sacharoseCD 2 répétitions indépendantes de 8 lames : A/B, B/C, C/D, D/A, A/C, B/D, D/B, C/A AB CD -> Les données ont été acquises par N. Reymond (expérience naas.tri analysée en TP) Plan expérimental du TP


Télécharger ppt "Transcriptome Introduction aux biopuces et à lanalyse du transcriptome Emmanuel Prestat."

Présentations similaires


Annonces Google