Introduction aux puces à ADN Campus des Cézeaux AUBIERE

Slides:



Advertisements
Présentations similaires
Bratec Martin ..
Advertisements

NOTIFICATION ÉLECTRONIQUE
Fragilité : une notion fragile ?
SEMINAIRE DU 10 AVRIL 2010 programmation du futur Hôtel de Ville
Phono-sémantique différentielle des monosyllabes italiens
MAGGIO 1967 BOLOGNA - CERVIA ANOMALIES DU SOMMEIL CHEZ L'HOMME
droit + pub = ? vincent gautrais professeur agrégé – avocat
Transcription de la présentation:

Introduction aux puces à ADN Campus des Cézeaux 63177 AUBIERE Vincent BARRA ISIMA / LIMOS UMR CNRS 6158 Campus des Cézeaux 63177 AUBIERE www.isima.fr/vbarra

Introduction Introduction (1/3) Biologie Nanotechnologie Puces à ADN Chimie Traitement d’images Bioinformatique Mesure du niveau d’expression de plusieurs milliers de gènes simultanément Applications détermination des familles de gènes co-régulés, recherche de systèmes de régulation, … Domaines Pharmacologie médecine environnement… Les puces à ADN sont au carrefour de nombreux domaines comme la chimie des acides nucléiques, la biologie moléculaire, l’informatique, le traitement d’images ou encore les nanotechnologies. Le but (clic) est de d'observer simultanément l'expression de plusieurs milliers de gènes chez un individu ou dans un tissu donné, par exemple selon plusieurs expériences. L'analyse biologique des premières biopuces repose sur l'étude des ARN messagers d'une cellule ou d’un organisme. Si de nouvelles applications pour les puces à ADN ont également été développées (biopuces pour le diagnostic, pour la génomique comparative, pour l’identification de régions d’ADN régulatrices après ImmunoPrécipitation de la Chromatine (ChIPchips)), nous ne nous intéressons ici qu’aux biopuces transcriptome L’analyse du transcriptome permet ainsi de mesurer schématiquement l'efficacité de la transcription du gène en protéine dans des conditions données. Ces puces permettent de donner des éléments de réponse à des problèmes biologiques variés, allant (clic) de la recherche de gènes corégulés au cours du développement ou en réponse à des perturbations environnementales, à l’identification des liens entre des variations d'expression et d'autres données biologiques en passant par la recherche automatique de systèmes de régulation. Les domaines d’applications sont en pleine expansion, et intéressent par exemple (clic) la pharmacologie, la médecine ou l’environnement.

Agilent: Puces à jet d’encre Introduction Introduction (2/3) * Membrane Nylon SAGE Puces perles Différentes Technologies GeneChip Affymetrix Puces ADNc CGH Agilent: Puces à jet d’encre

Introduction (2/3) Principe : technique d'hybridation. Puces ADNc

Analyse des données issues des puces à ADN Introduction Introduction (3/3) Eléments de biologie De la cellule à l’ADN De l’ADN au génome Du génome au transcriptome Les puces à ADN Principe Préparation du matériel biologique Acquisition d’une image de puce à ADN Analyse des données issues des puces à ADN Traitement d’images Analyse des données Quelques applications Etudes comparatives de transcriptomes Agriculture

Eléments de biologie moléculaire

Biologie De la cellule à l’ADN

Dogme central de la biologie moléculaire ADN ARN Protéine Transcription Traduction Réplication Transcription inverse Le "dogme central", introduit par Francis Crick (le co-découvreur de la structure de l'ADN) à la fin des années 50, veut que chez tous les êtres vivants, l'information ne soit transmise que dans un sens: de l'ADN, où repose l'information, à l'ARN, une structure transitoire permettant sa transmission à une machine de traduction, aux protéines, les constituants de base qui font fonctionner la cellule et l'organisme entier

Elements de biologie moléculaire Transcription Traduction Synthèse de protéines ADN ARNm ARNt Acides aminés codon Membrane nucléaire Anticodon ARN polymérase Nucléotides ARN ARNr Ribosome Chaîne polypeptide

Ribonucléotides libres Biologie Transcription Ribonucléotides libres

Copie du gène en ARN = ARNm Biologie Transcription Copie du gène en ARN = ARNm L'ARNm se détache et la molécule d'ADN se referme

Pour synthétiser la protéine, il faut : Biologie Traduction La synthèse de la protéine (assemblage des acides aminés) se fait au niveau des ribosomes Pour synthétiser la protéine, il faut : ARNm = information (la recette) Ribosome = machine à assembler les acides aminés Acides aminés = pièces de construction ARNt (ARN de transfert) = molécules qui transportent les acides aminés du cytoplasme au ribosome où ils sont assemblés en protéine.

Biologie Traduction 1 - Le brin d'ARNm s'attache au ribosome. En fait, Deux ARNt peuvent se fixer par leur anticodon sur l’ARNr au niveau du ribosome (un sur la zone appelée site P et l’autre sur la zone appelée site A). 2- Chaque ARNt se fixe par son anticodon sur trois nucléotides de l’ARNm. Ces trois nucléotides de l’ARNm constituent ce qu’on appelle un codon. Après leur fixation, les acides aminés qu’ils transportent sont reliés entre eux 3- Le ribosome avance de trois unités et le premier ARNt est retiré 4- Un autre ARNt se met en place

Biologie Traduction La maturation des protéines a lieu dans le Reticulum endoplasmique et l ’appareil de Golgi Modifications chimiques de la protéine (glycosylation, mérystylation, phosphorylation….) La maturation est indispensable à la fonctionnalité des protéines Feuillet  Hélice  Feuillet  Hélice 

Biologie Traduction La structure primaire est la simple séquence illustrant l'enchaînement des acides aminés. Elle est intéressante pour décrire une molécule mais insuffisante pour définir une activité enzymatique. Par exemple, un peptide présentant une séquence d'acides aminés particulière présente une activité biologique. Si on lui ajoute peu de détergent on perturbe sa structure spatiale et on détruit son activité biologique, phénomène qui ne peut apparaître dans ce schéma. La structure secondaire est un premier niveau d'agencement dans l'espace tenant compte des liaisons hydrogène. Elle met généralement en évidence certaines suites d'acides aminés qui se replient sous forme d'hélice alpha ou de feuillet béta comme indiqué dans le schéma La structure tertiaire est un second niveau de structure tridimensionnel plus global insistant sur l'agencement des structures secondaires entre elles. Celles-ci forment un ensemble compact qui permet de définir les sites actifs pour les enzymes. La structure quaternaire est l'assemblage de plusieurs sous-unités distinctes, formant un ensemble tel qu'ils existe réellement in vivo. La protéine assemblée se replie pour former une structure tridimensionnelle précise

Biologie Traduction Hémoglobine Insuline

Traduction Feuillets bêta Acétylcholinestérase Hélices alpha Biologie Enzyme qui catalyse l'hydrolyse de l'acéthylcholine en choline et acétate. Cette enzyme joue un rôle au niveau des jonctions neuromusculaires périphériques du système nerveux central Hélices alpha

Principales fonctions des protéines Biologie Traduction Principales fonctions des protéines 1. Structure 2. Régulation du métabolisme 3. Mouvement 4.Transport de molécules 5. Immunité 6. Transport membranaire 7. Métabolisme (les enzymes) 1- Les protéines peuvent former des fibres ou des tubes qui peuvent s'assembler pour former des structures solides.(Collagène : formé de trois chaînes d'acides aminés imbriquées, qui forme la peau (derme), les tendons, les ligaments, l'armature des os, etc.)

Principales fonctions des protéines Biologie Traduction Principales fonctions des protéines 1. Structure 2. Régulation du métabolisme 3. Mouvement 4.Transport de molécules 5. Immunité 6. Transport membranaire 7. Métabolisme (les enzymes) Les hormones : la plupart des hormones sont des protéines (insuline, vasopressine )

Principales fonctions des protéines Biologie Traduction Principales fonctions des protéines 1. Structure 2. Régulation du métabolisme 3. Mouvement 4.Transport de molécules 5. Immunité 6. Transport membranaire 7. Métabolisme (les enzymes) Mouvements dus à 2 protéines : l'actine et la myosine. Les cellules formant les muscles sont remplies de ces protéines.

Principales fonctions des protéines Biologie Traduction Principales fonctions des protéines 1. Structure 2. Régulation du métabolisme 3. Mouvement 4.Transport de molécules 5. Immunité 6. Transport membranaire 7. Métabolisme (les enzymes) L'hémoglobine : transporte l'oxygène La myoglobine : transporte l'oxygène dans les muscles L'albumine sérique : transporte le gras dans le sang

Principales fonctions des protéines Biologie Traduction Principales fonctions des protéines 1. Structure 2. Régulation du métabolisme 3. Mouvement 4.Transport de molécules 5. Immunité 6. Transport membranaire 7. Métabolisme (les enzymes) Les anticorps (ou immunoglobulines) sont faits de protéines Beaucoup de substances chimiques traversent la membrane des cellules en passant par des canaux formés par des protéines Anticorps IGE

Principales fonctions des protéines Biologie Traduction Principales fonctions des protéines 1. Structure 2. Régulation du métabolisme 3. Mouvement 4.Transport de molécules 5. Immunité 6. Transport membranaire 7. Métabolisme (les enzymes) Beaucoup de substances chimiques (eg chlore) traversent la membrane des cellules en passant par des canaux formés par des protéines

Principales fonctions des protéines Biologie Traduction Principales fonctions des protéines 1. Structure 2. Régulation du métabolisme 3. Mouvement 4.Transport de molécules 5. Immunité 6. Transport membranaire 7. Métabolisme (les enzymes) La plupart des réactions chimiques qui se déroulent dans la cellule sont catalysées par des protéines spéciales: les enzymes. Ex. synthèse ou digestion du saccharose

Dogme central de la biologie moléculaire ADN ARN Protéine Transcription Traduction Réplication Transcription inverse Protéine Transcription Traduction Ribosome ADN ARNm ARNr ARNt Le "dogme central", introduit par Francis Crick (le co-découvreur de la structure de l'ADN) à la fin des années 50, veut que chez tous les êtres vivants, l'information ne soit transmise que dans un sens: de l'ADN, où repose l'information, à l'ARN, une structure transitoire permettant sa transmission à une machine de traduction, aux protéines, les constituants de base qui font fonctionner la cellule et l'organisme entier Les puces à ADN permettent de mesurer globalement le niveau d’expression de l’ARNm

Intérêts et applications Biologie Intérêts et applications Etude de la dynamique du transcriptome Recherche et action de médicaments Recherche de mutations Oncologie Environnement et agriculture … Transcriptome : partie du génome transcrite en ARN, et en particulier en ARN messager pouvant encoder des protéines

Puces Les puces à ADN

Etapes d’une expérience utilisant des puces à ADN

On suppose disposes de deux types de cellules pour cet organisme : Puces Etude de cas On cherche à déterminer les gènes d’un organisme activés ou réprimés en conditions particulières On suppose disposes de deux types de cellules pour cet organisme : des cellules de contrôle des cellules représentative du phénomène étudié (pathologie, cycle cellulaire, stress hydrique, stress anaérobique,…) Exemple : croissance d’une levure en conditions aérobie/anaérobie Utilisation courante des puces à ADN

Préparation des cibles (1/2) Puces Préparation des cibles (1/2) Centrifugation On purifie  On isole les ARNm Tampon d'extraction On dilue  On facilite l’extraction On laisse croître les cellules dans les deux conditions  Ajustement des transcriptomes pour survivre

Préparation des cibles (2/2) Puces Préparation des cibles (2/2) Conversion ARNm/ADNc Marquage R/V Mélange La soupe est prête ! On ôte l’ARNm et on le place dans des nouveaux tubes Conversion ARNm/ADNc : reverse transcription

Préparation des sondes Puces Préparation des sondes On dépose des milliers de séquence d’ADNc (sondes) sur un support de verre de petite taille. Les sondes doivent être spécifiques d’un gène Chaque dépôt est la transcription inverse d’un ARNm que l’on souhaite mesurer  70 mm 20 mm Les sondes sont déposées par un robot spotteur

Hybridation Hybridation Puces Hybridation 1 nuit dans une chambre d’hybridation à température constante (environ 40°) Rincage, lavage, séchage

Acquisition de l’image de puce (1/3) Puces Acquisition de l’image de puce (1/3) Acquisition à l’aide d’un scanner deux couleurs : détection différentielle de la fluorescence des cibles aérobies/anaérobies présentes sur le support Amplification du signal par des tubes photomultiplicateurs Construction d’une image en fausses couleurs

Acquisition de l’image de puce (2/3) Puces Acquisition de l’image de puce (2/3) Exemple Excitation laser vert Excitation laser rouge

Acquisition de l’image de puce (2/3) Puces Acquisition de l’image de puce (2/3) Exemple Gène aérobique Gène anaérobique Gène exprimé dans les deux conditions

Acquisition de l’image de puce (3/3) Puces Acquisition de l’image de puce (3/3)

Schéma récapitulatif Sondes Analyse et normalisation d’images Puces Schéma récapitulatif Sondes Tableau N*P Analyse et normalisation d’images Hybridation excitation laser 1 laser 2 émission Puce à ADN

Analyse Analyse des données

Analyse des données Adressage Segmentation Quantification Extraction de connaissances Impact considérable sur l’interprétation biologique des données

Traitement d’images Recherche des centres de spots Analyse Traitement d’images Recherche des centres de spots Segmentation signal/fond et débruitage Extraction et normalisation de l’information Problèmes : Queues de comètes Débordement des puits Mauvais rapport S/B Superpositon

Localisation des spots Analyse Traitement d’images Localisation des spots Méthodes algorithmiques Méthodes géométriques

Extraction des gènes d’intérêt Analyse Traitement d’images Quantification Intensités en rouge et vert Intensités en rouge et vert corrigées du bruit de fond … Extraction des gènes d’intérêt Quels sont les gènes dont la variation d’intensité est significative ? Analyse de données/extraction de connaissances

Objectifs Analyse de données A partir de la liste des gènes ayant une variation significatives par rapport à l’expérience : Trouver les gènes ayant une variation recherchée Regrouper les gènes ayant des variations similaires Trouver les gènes expliquant les variations d’autres gènes

Classification hiérarchique : Analyse Analyse de données Classification hiérarchique : Calcul d’une matrice de similarité entre gènes Regroupement des deux gènes les plus proches Remplacement des deux gènes par un gène moyen Processus itératif Construction d’un arbre phylogénique représentant une hiérarchie de groupes de gènes Une des premières méthodes utilisées

Analyse de données Exemple : Extrait du génome de la Clustering hiérarchique Exemple : Extrait du génome de la levure du boulanger Saccharomyces cerevisiae

Algorithme des nuées dynamiques Analyse Analyse de données Algorithme des nuées dynamiques Initialisation Classification Mise à jour des centres

Analyse Analyse de données Réseaux de neurones 8 groupes stables 

Représentation des données Analyse Représentation des données Problèmes Visualiser les résultats de l’analyse du transcriptome à l’échelle du génome entier Intégrer les résultats pour répondre aux interrogations. Deux types de méthodes Organisation de la liste des gènes  visualisation des résultats Représentations quantitatives  vue globale de l’effet des expériences

Représentation des données Analyse Représentation des données Tableau résumant les expressions de chaque gène Pas d’inclusion des intensités Peu lisible Représentation en fausses couleurs Induction du gène par une échelle (noir/rouge) Répression du gène par une échelle (noir/vert) + intensité moyenne des gènes + éléments cis régulateurs dans les promoteurs

Représentation des données Analyse Représentation des données Graphique mettant en valeur l’effet observé à l’échelle du génome Localisation chromosomique des gènes 1 item : nombre global de gènes affectés si l’effet est quantitativement important Graphe : ex. de l’étude de l’utilisation du fer par la levure (Foury, 2001) : sous-région du génome situé au bout du chromosome XVI (vert : réprimés, rouge : induits). Chaque barre verticale=chromosome de la levure. Les gènes = barres horizontales ayant un sens correspondant au brin codant et une longueur égale à l’expression mesurée.

Représentation des données Analyse Représentation des données Utilisation de méthodes issues du data mining : exemple de la mise en évidence de relations entre objets Réseau de points Calcul de similarités Carte stable Carte aléatoire Exemple d’application Principe visu : calcul de similarité Placement dans un réseau de points (1 point=1 objet), et lien entre chaque couple d’objet représenté par une énergie proportionnelle à la similarité Minimisation d’énergie et obtention d’une carte stable Exemple d’application Kim et Al (caenorhabditis elegans : c’est un ver !!)

Représentation des données Analyse Représentation des données Incorporation d’autres informations Fonctionnelles (banques de données) Expertes (biologistes..) Comparaison des résultats obtenus avec ce qui est déjà connu

Quelques applications

Applications des puces à ADN

Applications des puces à ADN – études comparatives de transcriptomes Le transcriptome = population des ARNm exprimés par un organisme à un instant donné. résulte d’un équilibre entre la synthèse et la dégradation des ARNm varie en fonction des conditions intra- et extra-cellulaires. offre une représentation dynamique de l’état de la cellule et des processus biologiques en cours. L’analyse du transcriptome permet d’établir le « profil d’expression » de chaque gène considéré, c’est-à-dire la variation de son niveau d’expression selon un ou plusieurs paramètres (temps, type cellulaire, etc.).

Applications des puces à ADN – études comparatives de transcriptomes De nombreuses études ont été réalisées dans différents organismes afin d’identifier les gènes co-régulés dans certaines réponses cellulaires spécifiques. Chez la levure Saccharomyces cerevisiae, études de la variation transcriptionnelle des gènes : au cours du cycle cellulaire mitotique au cours de la méiose et de la sporulation en réponse à la transition de la fermentation anaérobie à la respiration en réponse aux lésions de l’ADN provoquées par des irradiations ou des agents génotoxiques etc. La levure Saccharomyces cerevisiae est un eucaryote unicellulaire largement étudié en biologie cellulaire et moléculaire. En effet, cet organisme représente un système expérimental qui procure de nombreux avantages, entre autres par la petite taille de son génome, la facilité à le manipuler en laboratoire, et ses hautes capacités de recombinaison alliées à un système génétique bien déni. De ce fait, cette levure est devenue un des organismes eucaryotes les plus étudiés et les mieux connus. La conservation des fonctions cellulaires chez les eucaryotes fait de cette cellule un modèle de référence pour étudier les génomes plus complexes.

Applications des puces à ADN – études comparatives de transcriptomes La comparaison de divers transcriptomes de mutants, de types cellulaires ou de tissus donnés permet également de prédire la fonction de gènes non caractérisés et d’élucider des réseaux de régulation de voies biochimiques complexes. l’analyse du transcriptome permettant de caractériser l’état de la cellule, l’utilisation de puces à ADN dans un objectif de diagnostic est en développement. distinguer des types de cancers non différentiables par d’autres méthodes recherche et la validation de substances thérapeutiques en permettant l’identification de nouveaux gènes cibles et la caractérisation de la réponse cellulaire à un traitement.

Applications des puces à ADN – études comparatives de transcriptomes Analyse de mutations : cribler des gènes caractérisés par leur polymorphisme. La diversité génétique d’une population peut être explorée et la relation entre le génotype et le phénotype, de gènes et de groupes de gènes peuvent ainsi être mis à jour. Analyse des mutations des gènes codant pour deux enzymes du virus du SIDA (Gen-Chip HIV, Affymetrix) détection des mutations génétiques liées à certains cancers du colon et du sein (Leti, Grenoble) détection des mutations de l’exon 11 du gène BRCA1, responsable du cancer héréditaire du sein et de l’ovaire (Hacia et al, Affymetrix) … La levure Saccharomyces cerevisiae est un eucaryote unicellulaire largement étudié en biologie cellulaire et moléculaire. En effet, cet organisme représente un système expérimental qui procure de nombreux avantages, entre autres par la petite taille de son génome, la facilité à le manipuler en laboratoire, et ses hautes capacités de recombinaison alliées à un système génétique bien déni. De ce fait, cette levure est devenue un des organismes eucaryotes les plus étudiés et les mieux connus. La conservation des fonctions cellulaires chez les eucaryotes fait de cette cellule un modèle de référence pour étudier les génomes plus complexes.

Applications des puces à ADN – agriculture Genoplante Programme fédérateur de génomique végétale qui associe en France la recherche publique (INRA, CIRAD, IRD, CNRS) et les principales sociétés privées impliquées dans l'amélioration et la protection des cultures ( Biogemma, Bayer Cropscience, Bioplante). Objectifs Découvrir des gènes utiles : amélioration des plantes raisonnée et découverte de nouvelles molécules agro-chimiques plus respectueuses de l'environnement. Etude des espèces "modèles : étude d'Arabidopsis et du riz permettra pour avancer dans la connaissance des autres plantes cultivées. Exemple Détermination des processus biologiques et moléculaires améliorant la tolérance au froid du blé L’analyse de la distribution génomique des sites d’interaction des facteurs de transcription présente plusieurs intérêts :

Applications des puces à ADN – agriculture Leader, Journal of Cereal Science, 41, pp 149.163, 2005 L’analyse de la distribution génomique des sites d’interaction des facteurs de transcription présente plusieurs intérêts : Etude des gènes activés après bourgeonnement

Domaine plurisiciplinaire Applications multiples Conclusion Conclusion Il est maintenant possible d’analyser l’expression de milliers de gènes en parallèle et à haut débit. Révolution technologique Changement d’échelle de la recherche biologique Domaine plurisiciplinaire Applications multiples

Conclusion Quel avenir pour les biopuces ? Les possibilités des puces à ADN sont inversement proportionnelles à leurs tailles. ARN artificiels capables de remplacer des anticorps monoclonaux Accès aux immuno-analyses simultanées du même prélèvement pour le diagnostic moléculaire des maladies infectieuses la recherche sur les résistances aux antibiotiques. Mise au point imminente de puces de polymorphismes dont les applications seront des plus nombreuses: Etude de la diversité génétique dans le cadre de la génétique des populations Etablissement de cartes génétiques affinées Recherche accélérée sur les maladies à origine génétique (dépistage, facteurs de risque...)

Conclusion Conclusion Et bientôt…la transformation des puces en laboratoires (CEA) Détection, en moins d'une heure, les agents infectieux présents dans un échantillon de sang ou de salive Détection de l'éventuelle présence d'une trentaine de micro-organismes en même temps Dépôt de l’échantillon Traitement de l’échantillon Puce à ADN