Principe des puces à ADN La lame… Les échantillons… Cellules témoin Cellules avec drogue Extraction d’ARN Revêtement de la lame ARN Reverse Transcription (10µg ARN total) ARN Cy3 Cy5 en présence de fluorophores ADNc ~Cy3 ADNc ~Cy5 Dépôt ADNs Hybridation Overnight amplifiés par PCR Lecture de la lame (Packard ScanArray Express)
Introduction • Quantification des données : QuantArray • Uniformisation des données : script Perl • Validation des données : macro Excel • Travail sur les données : programmes SAM et XL STAT
1 Quantification des puces (QuantArray)
2 Quantification des puces (QuantArray) Pour ouvrir les images, sélectionner le Cy3 puis le Cy5 DANS CET ORDRE Ch 1 = Cy5 Ch 2 = Cy3
3 Quantification des puces (QuantArray) fichier texte (séparateur tabulation) … intensités Ch 1 et 2 (Cy5 et Cy3) - bruit de fond Ch 1 et 2 (Cy5 et Cy3)
Biopuce actuelle Caractéristiques: •dépôts en quadruplet •contrôles déposés
Contrôles exogènes Rapports des contrôles (Cy3 : Cy5 de la lame non swapée) -FaNaC (1:1) -DmDNaC (1:5) -DgNaC (5:1) -Gamma tub (1:2) -RNase NE (2:1) -MDH (0:0)
1 Uniformisation des données (Perl) Intensité « normalisée » de chaque spot : In= intensité «spé» du spot – médiane MDH
2 Uniformisation des données (Perl) Cellules témoin Cellules avec drogue Lame 1 Cy3 Cy5 Lame 2 (swap) Cy5 Cy3 Condition témoin = Cy3n lame 1 * Cy5n lame 2 Condition exp. = Cy5n lame 1 * Cy3n lame 2
3 Uniformisation des données (Perl) Pour le Script Perl : - quantifs de QuantArray sous forme texte séparateur tabulation (lame2134.txt) - liste des lames sous forme texte séparateur tabulation (liste2134.txt)
Copier les données dans la base (quantifs QuantArray et listes) 4 Uniformisation des données (Perl) Exécuter cmd Copier les données dans la base (quantifs QuantArray et listes)
Lancer le script Perl pour normaliser nos données 5 Uniformisation des données (Perl) Exécuter telnet 195.220.189.168 Lancer le script Perl pour normaliser nos données
Copier les données normalisées dans l’ordinateur 6 Uniformisation des données (Perl) Exécuter cmd Copier les données normalisées dans l’ordinateur
Sortie d’un fichier à ouvrir sous Excel (lame2134_lame2135) 7 Uniformisation des données (Perl) Sortie d’un fichier à ouvrir sous Excel (lame2134_lame2135) Médiane MDH Cy51n * Cy3sn Cy31n * Cy5sn Position spot Cy51 Cy3s Cy31 Cy5s Condition 1 Condition 2
1 Validation des données (Macro1) Superposition des fréquences des conditions témoin (1) et expérimentale (2). Nombre de spots Intensité
2 Validation des données (Macro1) Répartition des rapports (Cond1/Cond2) centrée sur 1 Log2 (Cond1/Cond2) Intensité ( Cond12+Cond22)
3 Validation des données (Macro2) Comparaison des intensités des contrôles (rapports définis) Intensité condition 1 DmDNaC 5/1 Gamma tub 2/1 FaNaC 1/1 RNase 1/2 DgNaC 1/5 MDH 0/0 Intensité condition 2
4 Validation des données (Macro2) Correspondance des rapports théoriques / expérimentaux des contrôles Rapport expérimental Y= 0.98 x + 0.1 Rapport théorique
5 Validation des données (Macro) Attention aux points et aux virgules ! 1 Cliquer sur le 1er validation des données (macro1) 2 Copier la liste des gènes (liste genes pour macro.xls)de la colonne AT à BA 3 Cliquer sur le 2ème validation des contrôles (macro2) exemple
Résultats • Détermination des gènes dont la transcription est significativement modulée (programme SAM). http://www-stat.stanford.edu/~tibs/SAM/ • Classer les gènes et les expériences (programme XL STAT) http://www.xlstat.com/xlstatf52.exe
SAM • One Class : trouver les gènes significatifs -Pas de blancs (NA) • Two Class : 2 jeux de données (groupe ctrl et groupe traité, avec échantillons de différents patients dans chaque groupe). -Pas de blancs (NA) -Rapports (cond 1/cond 2) en log 2 -Sans virgule exemple
XL STAT • Projection des données dans un sous espace de dimension réduite (Analyse en composante principale ou ACP). • Organisation des données (classification ascendante hiérarchique ou CAH). • Classification des données (K means). -Pas de blancs (remplacés par la moyenne de toutes les expériences) -Données en log 2 exemple
XL STAT XL STAT classification ascendante hiérarchique ou CAH
XL STAT K means (nuées dynamiques) Permet de classer les gènes ou les expériences dans un nombre de classes défini