La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Mesure des niveaux d'expression des gènes chez les bactéries par la technique des biopuces Analyse du transcriptome de la bactérie Buchnera aphidicola.

Présentations similaires


Présentation au sujet: "Mesure des niveaux d'expression des gènes chez les bactéries par la technique des biopuces Analyse du transcriptome de la bactérie Buchnera aphidicola."— Transcription de la présentation:

1 Mesure des niveaux d'expression des gènes chez les bactéries par la technique des biopuces Analyse du transcriptome de la bactérie Buchnera aphidicola en condition de stress trophique de son hôte, le puceron Acyrthosiphon pisum Laboratoire BF2I, UMR INRA/INSA de Lyon 203 Bât. Louis Pasteur, Villeurbanne, France. BSMC, Biologie Cellulaire et Modélisation Cellulaire DTAMB Université Claude Bernard Lyon 1 Hubert Charles & Fédérica Calevro

2 22/6/052 Inférer (ou valider) un modèle de réseau de régulation… à partir de données dexpressions de puces à ADN Temps (min)

3 22/6/053 HYBRIDATION LECTURE DE LEMPREINTE DEPOT DES SONDES EXTRACTION DES DONNEES ET ANALYSE Extraction des ARNm Marquage des cibles A B D C Robot de dépôt Matériel biologique Cy5 Cy3 (1) (2) Choix des sondes Interprétation des résultats 85,685,6 13,113,1 1,31,3 Scanner Choix du plan de dépôt Introduction : la technique des puces à ADN

4 22/6/054 De limage de la puce… aux résultats interprétés 1. Nature des données dexpression 2. Problématique biologique 3. Mesure des données dexpression 31. Acquisition de limage 32. Acquisition des données issues de limage 33. Filtration des données 34. Analyse qualité 35. Normalisation 36. Gestion des données de puces 4. Plans expérimentaux 41. Plan de la puce 42. Analyses comparatives (statiques) 43. Analyses dynamiques 5. Conclusions

5 22/6/ Nature des données dexpression n Grands volumes de données (pb logiciel, pb algorithmique) n Dissymétrie du tableau de données (gènes x conditions) n Les données sont relatives (pas de niveau 0, pas de mesure absolue) n Distribution non-normale des données -> Transformation log 2 n Non-indépendance des données n Des connaissances associées très hétérogènes (annotation par exemple)

6 22/6/ Problématique biologique : la symbiose chez le puceron Acyrthosiphon pisum n Buchnera est une bactérie symbiotique intracellulaire associée à la majorité des pucerons dimportance économique. Lassociation est très ancienne (250 Ma). Les partenaires sont devenus dépendants. n Buchnera complémente lalimentation de son hôte (acides aminés et vitamines) n Buchnera possède un génome de taille très réduite (400 à 600 kb), très riche en bases A et T et incluant de nombreuses mutations délétères (adaptatives ?). -> Bon modèle détude à un niveau théorique (simple) -> très difficile à manipuler expérimentalement (incultivable) n Le génome de Buchnera est « dégénéré » -> Comment Buchnera régule-t-elle lexpression des ces gènes ? -> Comment Buchnera sadapte-t- elle aux variations des besoins nutritionnels de lhôte ?

7 22/6/ Problématique biologique : stress nutritionnel chez le puceron –Expérience 1 (8 lames) : Milieu completMilieu Tyr 0 /Phe 0 AB 4 lames : A-Cy3 / B-Cy5 4 lames : A-Cy5 / B-Cy3 Expérience en flip-flop Analyse statistique : test de t-modifié (SAM), approche bayésienne

8 22/6/058 –Expérience 2 (16 lames) : aa équilibréaa déséquilibré 0.5 M saccharoseAB 1 M saccharoseCD 2 répétitions indépendantes de 8 lames : A/B, B/C, C/D, D/A, A/C, B/D, D/B, C/A AB CD 2. Problématique biologique : stress nutritionnel chez le puceron Analyse statistique : modèles danalyse de la variance

9 22/6/ Mesure des niveaux dexpression n 31. Acquisition de limage n 32. Acquisition des données issues de limage n 33. Filtration des données : analyse qualité n 34. Normalisation n 35. Analyse statistique et interprétation des résultats -> Ces différentes phases ne sont pas distinctes

10 22/6/ Limage brute bloc (12 x 16) aiguille 1 aiguille 2 aiguille 3 aiguille 4 == Contrôles (+ et -) Doublets de spots Oligo 5 Oligo 3 3 ème oligo Superposition des 2 images (R et G)

11 22/6/ Acquisition des données issues de limage n Acquisition de limage : réglage des PMT –limite de la saturation (2 16 ) –valeurs de PMT identiques (proches) pour toutes les lames dun même jeu de données n Quelle mesure du signal ? –Volume du spot (peu utilisé) –Moyenne (médiane) des pixels du spot n Faut-il retrancher un bruit de fond local ? –Estimation du bruit de fond sur les contours des spots (biais destimation) –Estimation sur la base de témoins négatifs répartis sur toute la surface de la puce

12 22/6/ Filtration des données durant lacquisistion (logiciel GenePix) n Filtration des données (ajout de « flags ») –Flag « absent » des spots vides (- 50) –Flag « not found » des spots non détectés (- 75) –Flag « bad » des mauvais spots (- 100) : Spots sous les taches et rayures (manuel), diamètres extrêmes, spots saturés (F635%sat, script Genepix), spots éloignés du nuage (moyenne / médiane), spots à forts CV F et CV B… –Flag « good » des bons spots (+ 100) %B635+1SD > 55 et %B532+1SD > 55 (script GenePix) –Flags (- 40) des valeurs corrigées négatives

13 22/6/ Analyse qualité n Analyse de la variabilité (critères de qualité) – Variabilité inter sondes identiques – Variabilité intra-groupe de spottage – Variabilité intra-gène – Variabilité géographique – Variabilité inter lames -> Utilisation de CV -> Lanalyse de la variabilité permettra de décider de larrêt ou de la poursuite de la filtration puis du choix de la technique de normalisation

14 22/6/ Analyse qualité : représentations graphiques Graphe RG Bruit de fond MA plotDistribution de F532

15 22/6/ Normalisation des données n Il nexiste pas de mesure absolue de fluorescence n Les fluorochromes ont des propriétés différentes (linéarité du signal, quenching, sensibilité, stabilité…) n Les PMT fournissent des valeurs relatives n Les réactions de marquage ont des rendement différents n... -> Il est nécessaire deffectuer une normalisation des données (la plus simple possible)

16 22/6/ Normalisation : différents modèles n Soit I g lintensité du signal de fluorescence et x g labondance de l ARNm correspondant : Effet de bruit de fond : n Effet de saturation (non linéarité de la détection) : n Erreurs additives et multiplicatives :

17 22/6/0517 Cui et al Effet de saturation Effet des erreurs additives (faibles intensités) Effet des erreurs multiplicatives (fortes intensités) Différence de bruit de fond entre vert et rouge M=log 2 (R/G) A=(RG) 1/2 35. Normalisation : différents modèles

18 22/6/ Normalisation des données : trois cas de figures (1) Le nombre de gènes est très grand. (H) : La plupart des gènes analysés ne varient pas, ou se répartissent équitablement du coté des sur- et des sous-exprimés. -> Normalisation sur tous les points (2) Le nombre de gènes est moyen et H nest plus applicable. On dispose d un échantillons de gènes invariants (contrôles, gènes de ménage) ou on calcule cet échantillon (Tseng et al., 2001). -> Normalisation sur léchantillon de gènes invariants (3) le nombre de gènes est faible. Il faut disposer dun jeu de contrôles répartis sur toute la gamme des intensités. -> Normalisation sur les contrôles

19 22/6/ Normalisation globale n Normalisation « par la moyenne ou par la médiane » –On calcule le rapport des moyennes (ou des médianes) pour les deux couleurs et on le rapporte à 1. –La transformation : –Le modèle sous-jacent : -> Applicable si : (1) pas de bruit de fond, (2) linéarité du graphe MA, (3) pas deffet aiguille, (4) pas deffet géographique

20 22/6/ Normalisation globale n Normalisation « par régression linéaire » –Le modèle sous-jacent : –La transformation est la suivante : -> Applicable si : (1) pas de bruit de fond, (2) linéarité du graphe MA, (3) pas deffet aiguille, (4) pas deffet géographique

21 22/6/ Normalisation globale n Normalisation « par régression linéaire locale» (fonction loess) –Le modèle et la transformation sont les mêmes que précédemment, mais appliqués sur une classe dintensité. -> Applicable si : (1) pas de bruit de fond, (2) linéarité du graphe MA, (3) pas deffet aiguille, (4) pas deffet géographique

22 22/6/ Normalisation locale (spatiale) n Toutes ces méthodes peuvent sappliquer de façon à normaliser par groupe daiguille ou par bloc (effet géographique) -> Applicable si : (1) pas de bruit de fond, (2) linéarité du graphe MA, (3) pas deffet aiguille, (4) pas deffet géographique -> coût sur H ou sur le nombre de témoins très importants

23 22/6/ Normalisation des données Buchnera n La normalisation est basée sur un jeu de gènes invariants déterminé a posteriori n Normalisation « PrintTip loess »

24 22/6/ Un système dinformations pour la gestion des données de puces (SI-TRANS)

25 22/6/ Plans expérimentaux n 41. Plan de la puce –Les sondes doivent être spécifiques –Les sondes doivent montrer des rendements homogènes –Les sondes doivent être choisies dans des régions propices –Les sondes devraient être réparties aléatoirement sur la lame –Le nombre de répétitions doit être fixe pour toutes les sondes (calcul de moyennes) –La puce doit comporter des témoins négatifs répartis sur toute la surface –La puce doit comporter des témoins positifs répartis sur toute la gamme dintensité si lhypothèse de non variation de la majorité des gènes ne peut pas être faite.

26 22/6/ Plans expérimentaux

27 22/6/ Comparaison de 2 conditions : Tests de t modifiés (SAM) ou inférence bayesienne - Comparaison de différentes conditions dans un plan factoriel : Modèles dANOVA - Comparaison de conditions multiples : Analyse discriminante, interclasse, non-supervisée AB CD ABCD R 4. Plans expérimentaux : analyse statique Plan en bouclePlan en référence

28 22/6/ Analyse à différents temps Profil dexpression temporel : classification supervisée ou non, corrélation de profils Cycle cellulaire, Cycle circadien : classification, transformée de fourrier, PLS… t1t2t3t4 R = t1 ou asynchrone ou externe 4. Plans expérimentaux : analyse dynamique Plan en référence - Peng X et al. (2005) Identification of cell cycle-regulated genes in fission yeast. Mol Biol Cell. ;16(3): Remondini et al. (2005) Targeting c-Myc-activated genes with a correlation method: Detection of global changes in large gene expression network dynamics. Proc Natl Acad Sci U S A. 10;102(19): Luan Y & Li H (2004) Model-based methods for identifying periodically expressed genes based on time course microarray gene expression data. Bioinformatics. 12;20(3):332-9.

29 22/6/ Plans expérimentaux : analyse dynamique Plan en boucles répétées - Analyse à différents temps avec une covariable qualitative : Effet dune drogue au cours du temps : analyse statique à chaque temps, sélection des gènes significatif pour 50% des temps, puis analyse des profils par classification t2 control traitement t3 control traitement t4 control traitement t5 control traitement t1 control traitement - Lin et al. (2004) Discovery of estrogen receptor alpha target genes and response elements in breast tumor cells.Genome Biol. 2004;5(9):R6.

30 22/6/ Conclusion n Le plan dexpérience est primordial pour réaliser les analyses statistiques et ou la modélisation n Toujours utiliser des plans en flip-flop n Le modélisateur doit être partie prenante dans la préparation des données (qualité, filtration, normalisation)

31 22/6/ Conclusions inhibited by sucrose stress at 50% aa inhibited by sucrose stress at 25% aa Activated by sucrose stress at 50% aa Activated by sucrose stress at 25% aa Sucrose effect yjjT rplS rpsL rpsF trpB flgB flgC yhbZ yleA atpH ftsY rpmG ytfN carB yba2 mesJ ydiC rplF yheM mutL iscU mopA argH yibN lig fabB dcd fabG fmt murB dnaG nth dnaJ guaC lipB yciL rpmB fldA hscA ygbB yqhA fliJ cvpA aceE murG grpE1 yfgB phrB pnp infB

32 22/6/ Conclusions n Recherche des gènes impliqués dans la réponse à un stress trophique chez Buchnera n Recherche des voies métaboliques dans lesquelles ils sont impliqués n Analyse des séquences régulatrices des gènes coexprimés –Détection déléments régulateurs n Analyse génomique et analyse de la corrélation entre le niveau dexpression et lorganisation du génome de Buchnera –Détection de mécanismes de régulation


Télécharger ppt "Mesure des niveaux d'expression des gènes chez les bactéries par la technique des biopuces Analyse du transcriptome de la bactérie Buchnera aphidicola."

Présentations similaires


Annonces Google