INSERM TAGC Diversité des transcrits: Les sites de polyadenylation « intergéniques » Daniel Gautheret, 2005 INSERM ERM206 Université de la Méditerranée.

Slides:



Advertisements
Présentations similaires
Les pronoms compléments
Advertisements

Aire d’un rectangle Mesurer et calculer.
The Microsoft ® Mouse Mischief add-in works with Microsoft ® PowerPoint ® 2010 or Microsoft ® Office PowerPoint ® Download and install the Mouse.
Le pronom en. What does it do? En is a french object pronoun that is used to replace many expressions dependent on quantity En mostly refers to things.
#TrustMetrics « Expédition confiance » BarCampBankSF3 Saturday, May 08, 2010 | Sunday, May 09, 2010 Jean-Christophe Capelli, CEO, FriendsClear Draft en.
VLT 2ème génération MUSE et KMOS PNC Octobre 2002.
L’outil bio-informatique pour la génomique structurale
The Partitive French 1 Ch 8. What is the partitive? When discussing food, you need to be able to indicate whether you are talking about a whole item or.
TROUVER LES FACTEURS PREMIERS
Jalane is coming to Windsor You will interview her, in French, for the school paper. Page 127 # 5 You will interview her, in French, for the school paper.
Questions WHAT????. Quick review: we know how to make a sentence negative: Je vais ----> Je ne vais pas Personne ne va Rien ne va (theoretically)
Mercredi le 28 novembre. Warm-up Ask in 3 different ways the following statements: John et Sophie sont à lécole.
Sortez les devoirs-we will go over tomorrow!!!
Unité 3 Au café. What can you say instead ofÇa va? Comment vas-tu? Comment vas-tu? This is INFORMAL. This is INFORMAL. Use Comment allez-vous? if you.
Time with minutes French II Le 30 Octobre.
Status report SOLEIL April 2008
Réseau des Tribunaux référents Network of Pilot Courts 5. Quels indicateurs pour mesurer la qualité de la justice? Which indicators for measuring the quality.
Formal/Theory Phenomenology/Ex periments chaos break-up, giant-resonances, fusion interdisciplinarity (clusters, bose) mean-field (as a general theory)
Modalités de contrôle post-transcriptionnel cytoplasmique
Reading an analog clock
Université Des Sciences Et De La Technologie DOran Mohamed Boudiaf USTO République Algérienne Démocratique et Populaire Département de linformatique Projet.
Français I Leçon 2B Une semaine au lycée Au Debut #7 (for the dates of November 5 and 6) Please Translate the Following: 1. I love the math course. (Adorer.
Institut dAstronomie et de Géophysique G. Lemaître Chemin du Cyclotron, Louvain-la-Neuve UNCERTAINTIES AND THE CLIMATE SYSTEM A. BERGER European.
Les pronoms rélatifs Its the glue that holds sentences together…which makes it all possible!
Daphnie et Drosophile Cycle de vie et élevage
Les négatifs et linterrogation Grammaire A. Lélision/La liaison When a verb begins with a vowel or a silent h, je is shortened to j. This is known as.
1 of 46 2 of 46 UPDATE UPDATE ON TV ANTENNAS SINCE LAST BOARD MEETING SINCE LAST BOARD MEETING HELD ON FEBRUARY 25, 2010, YOUR BOARD HAS MADE MORE PROGRESS.
L’EPISSAGE ALTERNATIF DE L’ARN
La Régulation génétique chez les Procaryotes
Assessment and the new secondary curriculum S. Barfoot.
How to solve biological problems with math Mars 2012.
Faculté de médecine Bureau dévaluation Quelques biais possibles liés aux évaluateurs dans lutilisation des échelles dappréciation.
1 of of 40 UPDATE UPDATE ON TV ANTENNAS SINCE LAST BOARD MEETING SINCE LAST BOARD MEETING HELD ON FEBRUARY 25, 2010, YOUR BOARD HAS MADE MORE PROGRESS.
Discussion, Youth Engagement, and Appreciation of Diversity Kelly Campbell 1, Linda Rose-Krasnor 1, Michael Busseri 1, Mark Pancer 2 and the Centre of.
PROTECTION OF CONCEPTUAL ART BY COPYRIGHT IN FRANCE AND ENGLAND LA PROTECTION DE LART CONCEPTUEL PAR DROIT DAUTEUR EN FRANCE ET ANGLETERRE Tjasa Bobek.
28th Conference of Directors of Paying agencies Namur, 27 to 29 October 2010 The Belgian Presidency of the Council of the European Union Workshop 2 : Control.
Indefinite articles, plural of nouns
Le Passé Composé Past Tense (Past Perfect). The passé composé The passé composé expresses what happened in the past (sometimes called the past perfect.
Le octobre. Qui est présent? Résumons Le verbe avoir.
SEG 3601 Élaboration de cas d'utilisation avec UCEd
TortoiseSVN N°. Subversion : pour quoi faire ? Avoir un espace de stockage commun – Tous les étudiants du SIGLIS ont un espace svn commun Partager vos.
Observations from the International Drug Policy Consortium JAMIE BRIDGE SENIOR POLICY AND OPERATIONS MANAGER AU CONFERENCE OF MINISTERS OF DRUG CONTROL.
Le verbe VENIR.
Les choses que j aime Learning Objective: To know how to use j aime to talk about things I like to do.
Techniques de leau et calcul des réseaux séance 2a Michel Verbanck 2012.
Laboratoire de Bioinformatique des Génomes et des Réseaux Université Libre de Bruxelles, Belgique Introduction Statistics.
L’ensemble microcanonique
La pratique factuelle Années 90 un concept médical visant à optimiser les décisions cliniques face aux soins des patients Aujourdhui un concept évolutif,
ETL et Data Mining Présenté par : Marc Catudal-Gosselin Université de Sherbrooke automne 2004 automne 2004.
Introduction aux Virus
14 mai 2003TSTG Barcelona Meeting - Gilbert1 TSTG General Meeting: Configure and Makefile issues Gilbert Grosdidier LAL-Orsay/IN2P3/CNRS & LCG.
Passage entre quaternions et matrice des cosinus directeurs Transition from Quaternions to Direction Cosine Matrices.
Cest mercredi le neuf octobre Le plan! 1.Révisions 2.Vocabulaire 3.Jouer 4.Ecouter 5.Parler Il fait beau! Le but! Les couleurs!
Jeudi le 7 novembre. F 3 DUE: Virtual tour in LMS by 7:30 for the 70! DUE: Flashcards also for the 70 today (50 Friday) 1. Poem practice Le dormeur du.
Source: Dollar « Growth is good for the poor » Average income growth Income growth for the 20% poorest Unit of observation: country (over long period)
Guigage axonal dans le système nerveux ventral chez Drosophila: rôles du récepteur DRL et de son ligand WNT5 Jean-Maurice Dura Institut de Génétique Humaine.
Jean-Maurice Dura Institut de Génétique Humaine
Les Expressions Négatives
Thematic Alignment of Static Documents with Meeting Dialogs Dalila Mekhaldi Diva Group Department of Computer Science University of Fribourg.
Donnez l’heure “Time”… it’s a ticking!.
OHT 44 Starter 5, page 79 House vocabulary eée e a o auii e eueau aaàae esc. aaeeais a ae aoue acae eaae aa eeeu eai.
Saying what you have been doing
Title of topic © 2011 wheresjenny.com Each and Every when to use ?
Différencier: NOMBRE PREMIER vs. NOMBRE COMPOSÉ
8th International Conference on psychosocial and economic aspects of HIV infection
Quelle heure est-il? What time is it ?.
Leçon 25.
The ATD project is funded by the European Commission within its FP6 Programme, under the thematic area "Life sciences, genomics and biotechnology for health",
PERFORMANCE One important issue in networking is the performance of the network—how good is it? We discuss quality of service, an overall measurement.
Statistics & Econometrics Statistics & Econometrics Statistics & Econometrics Statistics & Econometrics Statistics & Econometrics Statistics & Econometrics.
Transcription de la présentation:

INSERM TAGC Diversité des transcrits: Les sites de polyadenylation « intergéniques » Daniel Gautheret, 2005 INSERM ERM206 Université de la Méditerranée

INSERM TAGC Annotation des génomes Humain/souris 2005: gènes annotés Est-on proche de la fin? Si peu de différence avec la mouche (15000 gènes) ou C. elegans (18000) ? Annotation Ensembl

INSERM TAGC Les EST (expressed sequence tags): loutil No 1 pour lannotation des génomes

INSERM TAGC Hier: clustering dESTs pour reconstruire les transcrits Transcrit reconstruit Cluster dESTs (avant 2001: génomes vertébrés non disponibles)

INSERM TAGC Aujourdhui: Alignements EST/génome exonsintrons

INSERM TAGC Skipped exon Alignement EST/génome

INSERM TAGC Epissage alternatif 3 gènes de détermination du sexe chez la drosophile, épissés différemment selon le sexe de l'individu:

INSERM TAGC Epissage alternatif via EST Nombreux travaux réalisés Sociétés créées exclusivement sur le thème (par ex. Compugen Ex: Modrek B, Resch A, Grasso C, Lee C. Genome-wide detection of alternative splicing in expressed sequences of human genes. Nucleic Acids Res 2001 Jul 1;29(13): :

INSERM TAGC ASAP, AltExtron, ASD, SpliceNest… ASAP interface (Lee et al. 2003)

INSERM TAGC Travaux récents sur la diversité du transcriptome – Tiling array – Full-length cDNA

INSERM TAGC Rosetta: technologie de spottage doligonuléotides par jet dencre (inkjet) Le Tiling Array

INSERM TAGC

Gène bien caractérisé: confirmation des exons « refseq » et apparition de nouvelles régions transcrites (ici correspondant à un cDNA déjà observé)

INSERM TAGC Apparition de nouveaux gènes dans régions intergéniques sans EST ni prédiction bioinformatique.

INSERM TAGC Que trouve-t-on? – Nouveaux gènes codants >2000 transcrits avec ORF non existant dans Ensembl – Nouveaux gènes non-codants >10000 transcrits – Transcrits antisens >5000 gènes ont transcription antisens – Isoformes de gènes connus Au moins 40% à 60% des gènes selon auteurs Comprend également extensions (parfaois très longues) en 3 – Artefacts biologiques: « bruit » transcriptionnel expérimentaux: hybridation non-spécifique, contamination génomique…

INSERM TAGC Science, 2005 – Technologie: Affymetrix – 25-mères espacés de 5bp – polyA+ et polyA- – Noyau et cytoplasme – 8 lignées cellulaires différentes Tiling 2

INSERM TAGC Etat de polyadenylation – Parmi tous les transcrits observés: 19% polyA+ 44% polyA- 37% polyA+ et polyA- Donc la moitié du transcriptome humain est polyA- Important, car les transcrits quon regardait jusquà présent nétaient que les polyA+!

INSERM TAGC Position des transcrits – 60% des loci exprimés présentent des évidences de transcription sur 2 brins – Beaucoup de transcription dans lintergénique: 50% des polyA- cytoplasmiques et 25% des polyA- nucléaires sont intergéniques 41% des polyA+ nucléaires sont intergéniques

INSERM TAGC Full length cDNAs – 100,000 Full length cDNAs – + 1M « CAGE » (sortes de SAGE en 5) Science, 2005

INSERM TAGC Utilité des full-lengths – Etude des promoteurs (impossible avec les EST) – TSS alternatifs, exons 5 alternatifs

INSERM TAGC Transcrits et Unités de Transcription – TU: Transcription Unit. mRNAs sharing at least 1 nt and with same location and orientation

INSERM TAGC Conclusion projet « FANTOM3 » – transcrits non-codants – nouveaux transcripts codants – 5000 nouvelles protéines – La majorité du génome est transcrit sur les deux brins – La grande diversité des transcrits dans chaque TU soulève le problème de la précision des puces ADN conventionnelles, dans lesquelles chaque sonde hybride différents transcrits

INSERM TAGC Les besoins actuels – Intégration initiation+épissage+transcription – Caractérisation des nouveaux transcrits Etude fonctionnelle (domaines, etc.) Conservation Validation expérimentale Tissu-spécificité The Alternative Transcript Diversity Project (ATD), 6e PCRD

INSERM TAGC

La polyadénylation alternative Coding sequence To 5' end AUUAAA AAAAAAAAA... AAUAAA CA GUUGU Cleavage + polyA-addition site Pre-mRNA mRNA alternative transcripts 3' UTR PolyAdenylation Signal CA GUUGU AAAAAAAAA...

INSERM TAGC PAS Discovery through EST/mRNA Alignment mRNA or EST-contig ESTs 5ESTs 3ESTs Gautheret et al. (1998) Genome Res. 8, 524 First observation in 1998: 189 cases of alternative polyadenylation 2000: 1000 cases Beaudoing et al. (2000) Genome Res. 10, 1001

INSERM TAGC EST-based PAS Map > 54% human, 32% mouse (accept multiple sites for 1 signal, but refseq UTR only) humanmousechicken Tot PAS66,60052,3003,500 PAS <3K from ENSEMBL Gene 31,00027,9002,900 PAS >10K from ENSEMBL Gene 29,00019, Genes with no PAS 30%36%80% Genes with 2 or more PAS* 50%43%7% *relative to all genes with 1+ PAS

INSERM TAGC Intergenic PAS? « Intergenic » PAS are made of – False positives – Long range PAS – PAS from novel genes stop

INSERM TAGC What is the actual reach of 3UTRs? Textbook « Human Molecular Genetics 2 » (1999): – 3 UTR Average of about 0.6 kb (see Zhang, 1998) but this is likely to be an underestimate because of underreporting of genes with long 3 UTRs Untranslated Regions of mRNA (Mignone et al. 2003) :

INSERM TAGC Several recent papers mentioning distal PAS – All rely on EST sampling, but: Require alignment on refseq gene/fl cdDNA or overlapping ESTs Cannot assess all long range PAS

INSERM TAGC Site distribution Distance from STOP # sites in 500nt window Ratio 5 supported -5 support is significant up to 9kb past Stop codon -May be limited by cloning capacity (few inserts larger than 6kb) 9kb ?

INSERM TAGC Distance of 3 EST from STOP Relative position of 5 EST (% of transcript) Position of 5 EST in transcript -As distance from Stop increases, 5 EST are located closer to 3 end -After >6kb, most 5 EST are « out of gene » stop cDNA 5EST 3EST start

INSERM TAGC Classification Trees for PAS prediction 8 Variables: canonical/non canonical signal Erpin score for downstream region #supporting ESTs PolyA/T in ESTs ESTs overlap previous site Full-length cDNA Single/multiple EST libraries 5EST from same clone mapping within gene stop5kb10kb15kb20kb Class 1Class 2

INSERM TAGC Classification tree + Voting Procedure -> class 1 / class 2

INSERM TAGC Importance of variables Canonical/non canonical Erpin score #supporting ESTs polyA/T in ESTs Overlap with previous site Full-length cDNA Single/multiple EST libraries 5EST from same clone All variables No 5 EST

INSERM TAGC Average P-value vs Distance Distance from STOP Relative position of 5 EST (% of ave P-value= % have P-value > % of long distance sites correspond to bona fide PAS 13kb

INSERM TAGC Conclusions P-values for polyA sites 6000 Novel polyA+ genes in intergenic Average 3 UTR longer than measured based on 5 EST mapping: around 2kb mean. – Consequence for ncRNA search in UTRs

INSERM TAGC Equipe polyA – Matthieu Legendre – William Ritchie – Takeshi Ara – Fabrice Lopez Arbres de classification: – Badih Ghattas, Département de Mathématiques, Aix- Marseille II