LE SEQUENCAGE A la découverte des génomes. Sommaire 1.Comment obtient-on une séquence nucléotidique ? 1.Methode de Sangers 2.Description succincte de.

Slides:



Advertisements
Présentations similaires
Cartographie génomes entiers
Advertisements

LES FRANÇAIS ET L’ONU. © Harris Interactive 2 SOMMAIRE > Méthodologie d’enquêteP.3 > Regard général sur l’ONUP.4 > Perception de l’action de l’ONU et.
M. Bétrancourt et C. Rebetez - Méthodologie expérimentale Diplôme MALTT Année La méthodologie expérimentale Fondements et bases d’application.
Diaporama de Gi Les castors repr é sentent un espoir aussi inattendu qu ’ important dans la pr é servation des eaux de la plan è te Des castors mâchent.
COMENIUS Identité européenne: l’unité dans la diversité.
1 Comment préparer un plan Document No. 2.1 Gestion des activités conjointes de lutte contre la tuberculose et le VIH: cours de formation pour responsables.
ABF Améliorer nos formations pour une microfinance plus sociale.
outLyzer Logiciel de détection des mutations à ratio allélique faible
19 Octobre 2012 C ARTO V ACCINS ™ Approche d’amélioration de la couverture vaccinale Département du Vaucluse.
DRH Groupe CONFIDENTIEL Plénière du 12 février 2016 Négociation sur le dialogue social et le droit syndical.
1 TECHNOLOGIE EN SEGPA Objets techniques instrumentés, didactisés et maquettisés que préconisent les nouveaux programmes Stage 10SEGDES2 du 14 et 15 décembre.
LES SOINS EN EHPAD EN 2012 Conseil CNSA du 15 octobre 2013.
AGORA SPORTS L’association AGORA SPORTS Affiliée à la FÉDÉRATION FRANÇAISE EPMM SPORTS pour TOUS Vous présente : Le programme de prévention.
Un modèle de séquence didactique pour l’enseignement de l’oral
Groupe « Vie au collège » Le 1% collégien An III.
Présentation - Projet d’amélioration des plantes Travail type ingénieur (pluridisciplinaire) Riz Tomate Arachide Ray-grass Œillet Pommier Riz Tomate Arachide.
19 mai 2011 Gwennaëlle BRILHAULT INSEE – Dép.de la Démographie Séminaire SFDS Les calculs de précision dans le recensement rénové.
MODÉLISATION 3D AU SERVICE DE L’INSPECTION DES OUVRAGES ir S. Flawinne.
Préparation de la réforme du collège: 3- La contribution du premier degré dans la réforme Quelques points: 1.La mise en œuvre du cycle 3 2.L’accompagnement.
Les outils de tests 1 1 CHAKI Abderrazak - ETIENNE Jonathan - TOUMI Nacereddine - VACHER Nicolas.
Lancement de la démarche 25 mars 2013 Barrême CONTRAT D’AXE Chemin de fer de Provence.
Travail de maturité CEC ANDRÉ-CHAVANNE TM.
Oct /01/13 CONVENTIONS INDUSTRIELLES DE FORMATION PAR LA RECHERCHE EN MIDI-PYRÉNÉES Délégation Régionale à la Recherche et à la Technologie Midi-Pyrénées.
LCA UFR SMBH (DCEM)1 Analyse critique d ’articles évaluant l ’intérêt de nouveaux tests à visée diagnostique Alain Venot UFR SMBH Campus virtuel SMBH
Tunis, le 13 Décembre 2004 RESULTATS PRELIMINAIRES DE L’ETUDE SUR L’INTERNATIONALISATION DES SERVICES DES CENTRES TECHNIQUES TUNISIENS Silvia Grandi (IPI)
Nos entreprises et Internet Très Haut Débit 1.  Enquête menée par le CERCL (Déc 2014/Mars 2015)  50 réponses collectées  Etude réalisée avec le concours.
Rôle de la génomique et de la post- génomique en amélioration des plantes Définitions et bilan Qu’est-ce que la génomique structurale? Qu’est-ce que la.
Le plan d'Achat et le plan d'Approvisionnement DIU de gestion des approvisionnements pharmaceutiques dans la lutte contre le SIDA, la tuberculose et le.
Mathilde Guiné – Outils-Réseaux - Rencontre “Le projet associatif, un mode d'Emplois” - 30 novembre 2007, Perpignan Pratiques et outils collaboratifs -
Technologie génétique. La technologie génétique regroupe une série de méthodes qui permettent d’étudier et de manipuler le matériel génétique Ces techniques.
Groupe de travail : Claire BRENEUR, Christelle GEORGET, Nathalie JACQUES, Régis BARDOULAT, Michael DESCOTTES, Frédéric GAUTHIER, Nicolas GIRAUD, Benoit.
La création des données d’exemplaire pour un exemplarisateur Sudoc.
INTRODUCTION L‘entre-deux guerres marque le début de l’ère industrielle pour les pays du sud Dans les années 50-60, les formes du processus d’industrialisation.
Au delà du PIB mesures multidimensionnelles du progrès quelques développements récents « Au service du Développement Economique et Social, une Statistique.
Valeurs Définir la mission d’une organisation, c’est définir sa raison d’être, c’est dire pourquoi elle existe. Définir la mission d’une organisation.
LA DIVISION CELLULAIRE, LA GÉNÉTIQUE ET LA BIOLOGIE MOLÉCULAIRE.
Résultats de la commission Enseignements Technologiques - Sciences Expérimentales.
Les « enquêtes d’analyse critique » en études sociales sur
Master 2 Entrepreneuriat International Option Gestion des Risques L’APPRECIATION DES PLUS OU MOINS VALUES LATTENTES, LES ECARTS DE CONSOLIDATION ET D’ACQUISITIONS.
Aurélien Besnard.  Des fréquences (points-contacts) évaluées sur…  …des transects choisis dans…  …des Aires de Présence (de surfaces évaluées) dans…
Un projet collaboratif « de Clou à Clou » L'ENT au service de la pédagogie de la culture / faire vivre une artothèque par l'ENT Projet cofinancé par l'Union.
Outil d’élaboration de progressions pédagogiques pour le cycle 4 Séminaire du 24 mars Nouveaux programmes de technologie au collège.
LA METHODE DU BARYCENTRE.  Objectif :  La méthode du barycentre permet de déterminer le milieu d’un réseau de points à desservir dont les coordonnées.
Clonage et construction de vecteur in silico Objectif Réaliser un clonage virtuel d’un ADNc codant pour une protéine d’intérêt dans un vecteur d’expression.
Régulation de l’expression génétique: Introduction Dr Ait-Ali D. Licence Biochime (2013/2014)
AJACCIO Mardi 24 mai 2011 Des CHS en CHSCT Quels enjeux pour la CGT? Personnel actif et retraité des communes, départements, régions, sapeurs pompiers,
Le séquençage du génome entier : prochain test central des laboratoires de génétique médicale ? Damien Sanlaville Nicolas Chatron Laboratoire de Cytogénétique.
Chapitre 5 Interprétation des données d’enquête 1.
Évolution Post-domestication Marie ROUMET (DEPS) Florence LOUIS (IPV)
Observatoire économique, social et financier 1 FEHAP – Registre des patients en dialyse Registre des patients en dialyse Nicolas Ferrafiat Observatoire.
Comment développer sa poitrine naturellement. Je n'avais pas beaucoup de solutions. En plus je risquais de perdre mon petit ami de l'époque que j'aimais.
Activité 7 : TP 4: Analyse documentaire d’expériences de transgénèse pour mettre en évidence l’universalité du rôle de l’ADN.
Communication du SGG sur le canevas de présentation d’une politique nationale et d’un plan stratégique à l’atelier national de révision de la politique.
1 PRESENTATION DU PROJET NTIC - SERMM. 2 SERMM Fondée en personnes, 6,9 M€ Spécialisée dans l’usinage, la soudure de pièces en métaux difficiles.
TENDANCES DE LA FORMATION DES FONCTIONNAIRES
BD MAX™.
Calcul Intensif en Génomique Comparative Laurent Duret Laboratoire de Biométrie et Biologie Evolutive.
1 Fabienne Ragain-Gire E-patiente DT1, bénévole & présidente AFFD Inscrite sur le forum en 2008 UN CLIC ET CA REPART ! LE SOUTIEN.
INSCRIPTIONS SPORTIVES
Genetic Suppression of Polyglutamine Toxicity in Drosophila Parsa Kasemi-Esfarjani, et al ; Science 287, 1837 (2000)
Réunion du groupe de liaison PECO, Paris 4 au 7 octobre 2011, Indicateurs de suivi, d’efficacité et d’efficience pour les classes bilingues André Blanchet,
Développement de la dimension européenne et de la compétence interculturelle à travers les Programmes d’Assistanat Comenius de l’Enseignement Tout au long.
Les sciences en 4 e et 5 e secondaires. Les sciences régulières en 4 e secondaire Il existe deux cours de sciences régulières en 4 e secondaire: Le cours.
Un projet pour tous, un engagement pour chacun Cette épreuve de « compte est bon » permet à tous les élèves, quel que soit leur compétence, de participer.
Marketing de l’assainissement : Retours d’expériences de différents pays et perspectives au Sénégal Juin 2016.
Appui budgétaire et Cadres d’évaluation de la performance Atelier CABRI sur l’Aide et le Budget Maurice, Mai 2007 Stephen Lister.
Chapitre 4: Variation dans le temps  Les données : audience totale en milliers (tableau 4.1, p. 47, extrait) o Origine : enquête sur les habitudes d’écoute.
Les Séquences et leurs Propriétés
Technologie de l’ADN recombinant
L’analyse d’ADN et la génomique
Transcription de la présentation:

LE SEQUENCAGE A la découverte des génomes

Sommaire 1.Comment obtient-on une séquence nucléotidique ? 1.Methode de Sangers 2.Description succincte de quelques utilisations du séquençage 1.Aide au clonage. 2.Aide aux études phylogéniques. 3.Aide au marquage moléculaire. 3.Le séquençage pour l’étude des génomes 1.Les différents types de séquençages (EST, FST et génome entier). 2.Bilan des programmes de séquençages mondiaux. 3.Principes d’obtention la séquence d’un génome entier. 4.Différentes illustrations 1.Arabidopsis thaliana 2.Oriza sativa 3.Populus trichocarpa 4.Vitis vinifera 5.Clin d’œil au génome humain 5.Comparaison des génomes des espèces modèles 6.Evolution des techniques –nouvelles applications

LE SEQUENCAGE 1. Comment obtient-on une séquence nucléotidique ?

Sangers Comment obtient-on une séquence nucléotidique ? Sangers Tube 1 = dNTP + ddGTP Tube 2 = dNTP + ddCTP Tube 3 = dNTP + ddATP Tube 4 = dNTP + ddTTP Tampon + taq polymérase + ADN matrice à séquencer

Sangers Comment obtient-on une séquence nucléotidique ? Sangers

LE SEQUENCAGE 2. Description succincte de quelques utilisations du séquençage

Description succincte de quelques utilisation du séquençage? Aide au clonage. 3 exemples : 1. Une stratégie de clonage : faire une PCR avec des amorces modifiés PCR fait des erreurs. 2. Lorsque l’on fait des ligations : possibilité d’erreur dans la jonction 3. Vérification de la séquence d’une bande PCR (amplifie t’on ce que l’on souhaite) 3 exemples : 1. Une stratégie de clonage : faire une PCR avec des amorces modifiés PCR fait des erreurs. 2. Lorsque l’on fait des ligations : possibilité d’erreur dans la jonction 3. Vérification de la séquence d’une bande PCR (amplifie t’on ce que l’on souhaite)

Description succincte de quelques utilisation du séquençage? Aide à la phylogénie. Détermination de la séquence du même gène chez différents organismes Alignement de séquences - Réalisation d’une matrice de différences Classement des séquences par la méthode du plus proches voisins Possibilité de faire des calculs de distances (ou proximité génétique) entre les différents organismes Réalisation d’un dendrogramme Détermination de la séquence du même gène chez différents organismes Alignement de séquences - Réalisation d’une matrice de différences Classement des séquences par la méthode du plus proches voisins Possibilité de faire des calculs de distances (ou proximité génétique) entre les différents organismes Réalisation d’un dendrogramme 1 0,81 0,63 0,44 0,25

Description succinte de quelques utilisation du séquençage? Aide au marquage moléculaire. Problèmatique : on souhaite cartographier un gène précis (ex : collocalisation de QTL, synténie densification de carte) Amplification et séquençage du gène chez les deux parents Y’a-t-il un polymorphisme de séquence ? Si oui, y’a-t-il une possibilité de transformer cette séquence en CAPS. Si non, coup d’un séquençage sur les descendants. Problèmatique : on souhaite cartographier un gène précis (ex : collocalisation de QTL, synténie densification de carte) Amplification et séquençage du gène chez les deux parents Y’a-t-il un polymorphisme de séquence ? Si oui, y’a-t-il une possibilité de transformer cette séquence en CAPS. Si non, coup d’un séquençage sur les descendants. Technologies SNP disponibles ?

LE SEQUENCAGE 3. Le séquençage pour l’étude des génomes

SEQUENCAGE EST (Expressed Sequence Tag) 1. Réalisation de banque d’ADNc (pure ou mélange) 2. Séquençage des extrémités 5’ et 3’. Avantages : - pas trop onéreux en temps et travail - on ne séquence que des parties codantes - on a une idée des gènes exprimés dans un tissu (si banque d’ADNc pure) Inconvénients : - aucune idée sur la structure intra ou intergénique - aucune idée sur les séquences régulatrices - séquençage en doublon des gènes très exprimés - pas accès aux gènes peu représentés dans les banques (niveau d’expression faible, petit tissu) Le séquençage pour l’étude des génomes EST, FST, génome entier SEQUENCAGE DES FST (Flanking Sequence Tag) - Réalisé sur les banques de mutants pour faire de la génétique inverse - A partir du mutant : DNA walk Intérêt : permet de voir où s’est inséré l’ADN-T Si génome séquencé RNAseq (8000 euros)

SEQUENCAGE du génome entier 1. A partir d’un génome coupé (shotgun) ou de banque Bac (shotgun hierarchique). Inconvénients : - très onéreux en temps et travail. - beaucoup de séquences non codante. - pas idées sur les gènes exprimés. Avantages : - idée sur la structure intra ou intergénique. - idée sur les séquences régulatrices. - accès à presque tous les gènes (sauf centromères et télomère) Le séquençage pour l’étude des génomes EST, FST, génome entier

1978 : 1978 : début du séquençage dans les laboratoires (manuelle, radioactivité, lecture unitaire de 100 bases : 1981 : séquençage du phage lambda (50kb). Entre 1983 et 1987 : obtention de la séquence de plusieurs virus à ADN (150kb) (Angleterre) : 1986 : obtention de plusieurs génomes chloroplastiques (Japon) (Shinozaki et al., 1986) : 1995 : obtention des premiers génomes de bactéries. Haemophilus influenzae (1.8MB). Opération rendue possible grâce au développement de séquenceurs automatiques 1997 : 1997 : obtention du premier eucaryote –levure (16Mb) – consortium internantional : 1998 : obtention du premier eucaryote pluricellulaire – Caenorhabditis elegans : 2000 : Obtention de la première plante –Arabidopsis thaliana 2005 : 2005 : Obtention de la première plante d’intérêt agronomique –Oriza sativa 2006 : 2006 : Obtention de la première ligneuse – Populus trichocarpa (séquence brouillonne) 2007 : 2007 : Obtention de la première plante à fruit – Vitis vinifera ( séquence brouillonne) 2009 : 2009 : Sorgho bicolor, Cucumis sativus Le séquençage pour l’étude des génomes Bilan des programmes de séquençage mondiaux

Le séquençage pour l’étude des génomes Bilan des programmes de séquençage mondiaux Base de données répertoriant les résultats des différents génomes GOLD (Genome OnLine Database) (Bernal et al., 2001) NAR Génomes entièrement séquencés En 2001 : (novembre): (octobre) : projets de Métagénomique

Le séquençage pour l’étude des génomes Bilan des programmes de séquençage mondiaux (2007)

Le séquençage pour l’étude des génomes Bilan des programmes de séquençage mondiaux

Historique du Genoscope 1993, 1993, les États-Unis et le Royaume-Uni avaient mis sur pied des programmes de séquençage à grande échelle. 18 décembre 1996 : 18 décembre 1996 : Création du Groupement d'Intérêt Public (GIP) "Centre National de Séquençage" pour 10 ans (Journal Officiel du 1er janvier 1997). Novembre 1997 : Novembre 1997 : Démarrage des activités dans des locaux nouvellement aménagés à Évry. 1er juillet 2002 : 1er juillet 2002 : Intégration du Genoscope au sein du GIP "Consortium National de Recherche en Génomique" (CNRG), créé pour 12 ans, qui réunit également le Centre National de Génotypage (CNG) et le Réseau National des Génopoles (RNG). Le séquençage pour l’étude des génomes Bilan des programmes de séquençages mondiaux

Le Genoscope - Centre National de Séquençage - premier "grand équipement" français en biologie (grands télescopes en astronomie ou des accélérateurs de particules en physique) Sélection des projets 1.dans le cadre de projets (appel d’offre) (secteur public ou secteur privé). 2.le centre entreprend des projets propres. 3.divers organismes (microbes, plantes, animaux, humain) présentant un intérêt scientifique, médical ou économique.Missions 1.produire et d'interpréter de grands volumes de données de séquence de haute qualité. 2.mettre au point de méthodes informatiques pour l'analyse et la comparaison des génomes. 3.Produire des publications scientifiques. 4.Fin février 2003, le Genoscope employait 153 personnes en équivalent temps plein. Le séquençage pour l’étude des génomes Bilan des programmes de séquençages mondiaux

1.Chaque manipulation de séquençage : une séquence de 500 à nucléotides. 2.Pour s'assurer de la qualité du résultat de chaque lecture et raccorder les séquences les unes aux autres, il est en outre nécessaire de réaliser des lectures redondantes. 1.Chaque manipulation de séquençage : une séquence de 500 à nucléotides. 2.Pour s'assurer de la qualité du résultat de chaque lecture et raccorder les séquences les unes aux autres, il est en outre nécessaire de réaliser des lectures redondantes. Déterminer la séquence complète d'un chromosome humain nécessite donc des millions de lectures. Création de centres de séquençage ("genome centers"). Automatisation, amortissement du matériel, groupement des compétences : possibilité d’effectuer chaque jour des dizaines de milliers de lectures à un coût moindre. Localisation des centres de séquençage aux Etats-Unis, au Royaume-Uni, au Japon, en Chine, en Allemagne et en France (Génoscope).

Le séquençage pour l’étude des génomes Séquences complètes : « shot gun hierarchique » Séquençage complet Normes de qualité « bermudes » élaborées pour le génome humain -Le moins de « trou » possible -Taux d’erreur inférieur à 10-4 (1 erreur toutes les bases) 5 étapes dans le séquençage 1.Construction d’une banque BAC, 2.Etablissement d’une carte physique de présequençage 3.Séquençage complet de BAC, 4.Progression sur le chromosome (carte de présenquençage – extrémité des BAC) 5.Annotation ab initio.

Le séquençage pour l’étude des génomes Séquençage de l’extrémité des BAC Réalisation de fingerprint Aide à la réalisation d’une carte physique Pour chaque BC

Le séquençage pour l’étude des génomes En général carte physique pas finie avant le séquençage M1 M2 M3 M4 M5 M6

Le séquençage pour l’étude des génomes Assemblage par analyse de fingerprint Recherche de BAC avec au moins 50% de bandes en commun Assemblage par STC (Sequence Tag Connector)

Le séquençage pour l’étude des génomes Carte Physique avec le chemin de recouvrement minimal

Le séquençage pour l’étude des génomes Séquences brouillonnes (Shotgun) But -Avantages Cette méthode a été mise au point par Craig Venter dans le cadre de du séquençage du génome humain. Le but principal était d’utiliser une méthode de séquençage afin d’améliorer la vitesse et le prix du décryptage. - Ex : 80 millions de bases séquencées en 5 ans avec les anciennes méthodes de séquençage, alors qu’avec les nouvelles méthodes, ce même nombre de bases est séquencé en une semaine, grâce à la robotisation des techniques et à la puissance informatique. Elle permet le séquençage au hasard de fragments d’ADN non cartographiés. Inconvénients Grosse difficulté = assemblage des données. (traitement informatique ) Perte d’efficacité : Les fragments obtenus mis bout à bout, représentent environ 10 fois la longueur d’un génome. Beaucoup d’erreurs les recouvrements ne sont pas parfaits à cause des erreurs de lecture statistiquement, il existe des gaps dans la couverture de lecture, même si la distribution est uniforme (biais expérimentaux) mais surtout, il existe de très nombreuses zones répétées qui engendrent une somme d’erreurs importantes.

LE SEQUENCAGE 4. Différentes illustrations (arabidopsis, riz, peuplier, vigne)

Séquençage de l’arabette : 1. Arabidopsis thaliana Plus petit génome végétale Sans intérêt agronomique : pas un pays plus avantagé qu’un autre Début des années 1990, début du séquençage d’Arabidopsis 1996 : création de l’Arabidopsis Genome Initiative (AGI). Répartition des chromosomes à séquencer entre équipe. Objectif mettre à disposition de tous, une séquence de haute qualité d’Arabidopsis pour Ressources de démarrage Banque BAC (18X) Carte physique banque YAC CIC Carte génétique 800 marqueurs EST extrémités BAC BAC fingerprints Séquençage shotgun hiérarchique

Séquençage de l’arabette : 1. Arabidopsis thaliana Séquençage du génome réalisé plus tôt que prévu (AGI, 2000) Séquence de 115,4 MB sur 125 (pb avec les centromères Gènes sur tous le génome mais densité variable de 38G/100kb a un g/100 kb gènes (11000 familles) Inattendu ! Nombre de gènes > drosophile et nématodes Inattendu ! Nombre de gènes > drosophile et nématodes

Séquençage de l’arabette : 1. Arabidopsis thaliana 9% des gènes validés expérimentaleme nt. Idée du nombre de gènes alloués aux différentes grandes fonctions cellulaires,… Inattendu ! Importance des familles multigéniques (rôle des redondances, problème : cartographie génétique, mutants,…) Différents autres organismes Fonction des gènes = défit 2010 Projet genoplant : identification de gènes Fonction des gènes = défit 2010 Projet genoplant : identification de gènes Raté !!!!

Séquençage de l’arabette : 1. Arabidopsis thaliana Inattendu ! Le génome d’Arabidopsis est une mosaïque de régions dupliquées… Répétitions des régions = polyploïdisation ? Morcellage = réarrangement des génomes Inattendu ! Le génome d’Arabidopsis est une mosaïque de régions dupliquées… Répétitions des régions = polyploïdisation ? Morcellage = réarrangement des génomes

Séquençage du riz : 2. Oryza sativa Premier génome d’une plante à intérêt agronomique – 1 ère Monocotylédones Plus petit génome des céréales : constitution de l’IRGSP (International Rice Genome Sequencing Project). Objectif : séquençage Oryza sativa ssp japonica cv Nipponbare Méthode séquençage en shotgun hiérachique : Ressources: Carte génétique saturée. Banque BAC et YAC (25x) BAC (bac end +fingerprint) Ressources : Séquence grossière de Monsanto, de Syngenta et chinoise (indica). Europe se désengage (que chr 12). France Financement :ministère de la recherche

Séquençage du riz : 2. Oryza sativa Obtention d’une bonne séquence qualité « Bermudes » (IRGSP, 2005) - Nature

Séquençage du riz : 2. Oryza sativa STRUCTURE DU GENOME Taille du génome : 389 Mb Nbre de gènes : Densité : 1 gène tous les 9,9kb % du génome occupé par des élements transposables : 35% Région dupliquée : 60% 71% de ces gènes ont un orthologue chez A. thaliana. Tous les types d’éléments transposables sont représentés

Séquençage du peuplier : 3. Populus trichocarpa 3 ème espèce végétale à être séquencée. 1 er ligneux. Il s’agit d’une séquence grossière obtenue par « shotgun » et cartographie génétique. (Tuskan et al.,2006) Science. Séquençage de Nisqually 1 (génotype femelle) Séquençage de 7,6 millions de fragments. Assemblé en 2447 contigs Utilisation de 356 marqueurs microsatellites pour ancré les contig Réalisation de 155 super-contigs (335 Mb) Génération d’un banque BAC (9,5X) – carte physique Problème d’hétérozygotie : deux gènes séquences presques identiques (même allèle avec erreurs de séquence, allèles différents ou paralogue ?)

Séquençage du peuplier : 3. Populus trichocarpa Taille du génome 485 Mb Nombre de gènes : (plus qu’Arabidopsis) Gènes surreprésentés chez le peuplier : - biosynthèse des lignines - développement des méristèmes - transport des métabolites Quelques données sur la structure du génome Etude général de l’expression des gènes par microarrays

Séquençage du peuplier : 3. Populus trichocarpa Le génome du peuplier contient aussi de nombreuses duplications,…

Séquençage de la vigne : 4. Vitis vinifera (Jaillon et al., 2007) Nature 4 ème plante angiosperme 2 ème ligneuse 1 ère plante qui produit des fruits (Jaillon et al., 2007) Nature 4 ème plante angiosperme 2 ème ligneuse 1 ère plante qui produit des fruits Pinot noir PN40024 (93% homozygotes) SERIE D’AUTOFECONDATIONS SERIE D’AUTOFECONDATIONS Séquençage par shotgun Dans la vigne 13% de divergences entre allèles – grosse difficulté pour formation contig -> stratégie shotgun 6,2 millions de séquences (soit 8,4 génome de la vigne) 6,2 millions de séquences (soit 8,4 génome de la vigne) Formation de 3514 supercontig (taille moyenne d’un contig 2 Mb) (taille génome : 487 Mb) Formation de 3514 supercontig (taille moyenne d’un contig 2 Mb) (taille génome : 487 Mb) Nombre de supercontig: (409 marqueurs moléculaires) Seulement ancré :191 Ancré et orienté de :143 Nombre de supercontig: (409 marqueurs moléculaires) Seulement ancré :191 Ancré et orienté de :143

Le séquençage de la vigne : 4. Vitis vinifera STRUCTURE DU GENOME La vigne contient donc gènes d’une taille moyenne de 372 codons répartis sur une moyenne de 5 exons La vigne contient tous les types d’éléments transposables (ET). Les introns contiennent 12,7% ET (majoritairement des rétrotransposons de type LINE) Présence de familles multigénique très importantes Silbène Synthase (resveratrol - santé) 43 gènes Terpène Synthase (arome) 89 gènes – grand nombre du en particulier au nombre de monoterpène synthase (spécialisation) (Jaillon et al., 2007) Nature

Le séquençage de la vigne : 4. Vitis vinifera Recherche de paralogues : 1.Obtention des séquences en protéines déduite à partir de la séquence nucléotidique d’un chromosome 2.Recherche des séquences protéiques prédites à partir de la séquence des autres chromosomes. Chaque région a 2 autres régions paralogues (vert clair, jaune, rouge, rose, bleu turquoise,…) Ancestralement, dans la vigne le génome diploide est constitué de 3 génomes diploides de 3 ancêtres La vigne est donc un ancien héxaploïde (Jaillon et al., 2007) Nature

Séquençage de l’homme : 5. l’Homo sapiens Ledford, 2007 (Nature) Publié en 2007 : le génome entier de Craig Venter (Levy et al., 2007) 1.La séquence de son gène ABCC11 indique qu’il doit avoir les cires d’oreille humide. 2.Il a quatre séquences répétées devant son gène MAOA. Le fait d’avoir 3 ou plus répétition est associé avec un comportement associable. 3.La séquence de son gène APOE est associée à des risques accrus de maladies cardiovasculaires et de maladies d’Alzheimer. 4.La séquence de son gène SORL1 contient des variations associées avec des risques de maladies d’Alzheimer. Gros niveau d’hétérozygotie : 1.44% des gènes contiennent au moins une différence entre les deux chromosomes, 2.Le taux de différence entre les deux chromosomes homologues est de 0,5% Gros niveau d’hétérozygotie : 1.44% des gènes contiennent au moins une différence entre les deux chromosomes, 2.Le taux de différence entre les deux chromosomes homologues est de 0,5% Autre génomes séquencés : Watson, korean male, nigerian male, Yan Huan,… Les femmes ? Une (2008)

LE SEQUENCAGE Comparaison des différents génomes

Taille du génome Nombre de gène A. thaliana O. sativa P. trichocarpa V. vinifera Répartiton des gènes Homogène Hétérogène Comparaison des génomes des espèces modèles Quelques chiffres

Comparaison des génomes des espèces modèles 3 chromosomes paralogues de vigne Vert –chr6 Bleu – chr8 Rouge – chr13 3 chromosomes paralogues de vigne Vert –chr6 Bleu – chr8 Rouge – chr13 P. trichocarpa A. thaliana O. sativa Recherche de régions orthologues de 3 chromosomes de vigne chez 3 plantes modèles 3 régions orthologues chez A.thaliana / Chr vigne. Vigne et arabette ont donc un ancêtre hexaploide commun et Arabette a subit des duplications supplémentaires Pas de régions orthologues évidentes. Vigne et riz ne partagent pas un ancêtre hexaploide commun 2 régions orthologues chez le peuplier / chromosome vigne. Vigne et peuplier ont un ancêtre hexaploide commun. Présence d’une duplication en plus chez peuplier (Jaillon et al., 2007) Nature

Comparaison des génomes des espèces modèles Recherche de régions orthologues globales chez les 3 Dicotylédons modèles Les régions paralogues sont étendues. La vigne est probablement l’espèce la plus proche de l’ancêtre hexaploide commun Les régions paralogues sont étendues. La vigne est probablement l’espèce la plus proche de l’ancêtre hexaploide commun Les régions paralogues sont morcelées. Signe d’au moins un événement de tétraploidisation. Les régions paralogues sont morcelées. Signe d’au moins un événement de tétraploidisation. Les régions paralogues sont très morcelées. Signe d’au moins deux événements de tétraploidisation. (Jaillon et al., 2007) Nature

Comparaison des génomes des espèces modèles Positions des effets de polyploidisation dans l’histoire de l’évolution des plantes modèles Uniquement chez les Dicotylédones Monocotylédones Dicotylédones Evénements de tétraploïdisation (Jaillon et al., 2007) Nature

LE SEQUENCAGE Evolution des techniques et nouvelles applications

Fragmentation de l’ADN ( pb) ( pb)Fixationavidine/biotine Chaque bille est isolé dans une goutte aqueuse (emulsion) Réalisation d’une em PCR PCR dans une emulsion Sur une bille nombreux fragments identiques 454 -pyroséquençage Evolution des techniques –nouvelles applications 454 -pyroséquençage

Une apyrase permet de détruire les bases non incorporées

454 -pyroséquençage Evolution des techniques –nouvelles applications 454 -pyroséquençage

solexa -illumina Evolution des techniques –nouvelles applications solexa -illumina

solid Evolution des techniques –nouvelles applications solid

comparaison Evolution des techniques –nouvelles applications - comparaison

454 Solexa SOLiDSanger Nombre d’échantillons Taille séquencée (pb) ou 2x Nombre de lecture Temps d’un run7,5 heuresPréparation 11h6 à 10 jours1h Capacités (MB) par run 100 à 200/run/7,5 jours 2 000/run/6,5 jours à ou à (selon la banque d’ADN)/run/6 jours 70 kb/run/1 jours Cout par mégabases ($) 6022 Cout équipement($) Taux d’erreurs Moins de 0,5% pour 250 pb Moins de 0,01%Moins de 0,04%0,1% Source erreurs Insertion ou délétion substitution Robustesse Pas de laser optique complexe Temps de vie des réactifs long Capacité de recommencer la manipulation sans besoin de renouveler les échantillons

application Evolution des techniques –nouvelles applications - application Application 1 : séquençage d’organisme avec des gros génomes. EX/ maïs, Pomme de terre, Jatopha, Pommier, Sorgho, Concombre, bananier, cacaoyer, soja, coton, lin, tomate, papayer, cotonier. Application 2 : Re-séquençage plusieurs variétés d’une même espèce. EX/ séquençage de 40 écotypes d’arabidopsis – de 100 humains avec cancer. But : évaluer le polymorphisme – découverte de mutations déterminantes. Application 3 : Séquençage d’un grand nombre de zones ciblées dans peu d’individus. Alternative séquençage de peu de zone ciblées dans un grand nombre d’individus. Analyse de diversité, sélection assistée par marqueur, diagnostique de maladie. Application 4 : Métagénomique. Analyse de diversité –intestins /sol Application 5 : Transcriptome. RNAseq. Comparaison de transcriptome Application 6 : Séquençage des petits ARN. Application 7: Séquençage des ADN traités au bisulfite. Determination des cytosine méthylés,… Application 8 : Utilisation de code barre à ADN.

Réflexion : le séquençage des génomes. Recherche fondamentale ou recherche appliquée Séquençage c’est de la recherche fondamentale (vision CNRS). 1.Mise au point des stratégies de séquençage : c’est le public. Les privées ont du fric mais ils font n’importe quoi. 2.Modèle de collaboration : des équipe américaines, européennes et asiatiques. 3.Production d’un outil utile à tous – la diffusion de l’information est libre. 4.Production de publications scientifiques de haut niveau. Séquençage c’est de la recherche appliquée (vision MONSANTO). 1.Les méthodes sont bien établis. 2.Des entreprises privées ont investit massivement dans le séquençage. (bien supérieur à ceux du public). Ce que fait le public c’est de l’amateurisme. 3.A partir des séquences il y a des applications directes : marquage moléculaire et transgénèse. ATTENTION : Un peu caricatural

Exam séquençage Sujet : Le S é quen ç age du concombre (FMOV101) PARTIE A - D ’ apr è s “ The genome of the cucumber, Cucumis sativus L ” ( Huang et al., 2009) Strat é gie utilis é e : Etape 1 : S é quen ç age de 72,2 fois le genome du concombre en utilisant la m é thode de Sangers (3,9 fois le g é nome) et Illumina (68,3 fois le g é nome). Etape 2 : Assemblage des s é quences. Question 1 (2 points) : Par rapport aux strat é gies utilis é es pour le s é quen ç age du g é nome d ’ Arabidopsis (riz) et de la vigne (peuplier), en quoi la strat é gie utilis é e pour le concombre est originale ? Pourquoi avoir utilis é deux m é thodes de s é quen ç age ?

Exam séquençage R é sultats : Figure 1 : comparaison de la distance g é n é tique (obtenue dans des cartes g é n é tiques) et les distances physiques obtenues par s é quen ç age de 2 chromosomes du concombre. Question 2 (figure 1) (1 point) : Les parties gris é es correspondent aux centrom è res. Que se passe t ’ il dans les r é gions marqu é es d ’ une é toile ? S ’ il y a des g è nes n é fastes dans ces r é gions chromosomiques, ceux-ci seront-ils faciles à é liminer par s é lection classique ?

Exam séquençage Figure 2 : Comparaison du nombre total de g è nes pr é dit, du nombre de g è nes organis é s en tandem et du nombre de g è nes par famille. Question 3 ( 1 point). Que vous apporte l ’ analyse des figures 2 et 3 Figure 3 : Comparaison de la synt é nie entre Concombre et melon, et concombre et past è que (watermelon).

Exam séquençage PARTIE B - D ’ apr è s (Guo et al., 2010) Strat é gie utilis é e Etape 1. Des ARN ont é t é extrait à partir de boutons floraux de deux g é notypes de concombre presques isog é niques : un gynoique (que des fleurs femelles) et un hermaphrodite (que des fleurs male et femelle) Etape 2. Ces deux lots d ’ ARN sont transform é s en deux lots d ’ ADNc Etape 3. Les deux lots d ’ ADNc sont s é quenc é s par 454/pyros é quen ç age. Question 4 (2 points). Que peut-on attendre de ce type d’expérience ? Proposer une stratégie alternative