CHMI 4206 Bioinformatique appliquée

Slides:



Advertisements
Présentations similaires
I) Obtention de l’ADN recombinant
Advertisements

Les données et les banques de données
Question. Compléter les phrases suivantes.
Transcription de l’ADN
Colloque Traitement et Analyse de séquences : compte-rendu
Initiation à la bioinformatique
Régulations post-transcriptionnelles de l'expression
Les enzymes : outils de biologie moléculaire Enzymes de restriction: endonucléases Kinases: ajoutent un phosphate (P*) Phosphatases: retirent un phosphate.
Bioinformatique: prédiction de gènes
Analyse bioinformatique de données de séquençage NGS médicales
LA TRANSCRIPTION DE L’ADN CHEZ LES EUCARYOTES
L’EPISSAGE ALTERNATIF DE L’ARN
Projet Génome Humain (HGP)
Activité 5. Du génome au protéome
Expression de diverses protéines de stress chez Tetrahymena
TP 5 Du génome au protéome
La transcription.
Les méthodes d’analyse des transcrits différentiels
Expression du Génome Le transcriptome.
La méthode enzymatique de séquençage, dite de (Sanger; didésoxy)
Synthèse des protéines
ADN à ARN La synthèse des protéines étape 1
1) Structure du noyau 2) Structure des gènes et des chromosomes
La structure et la reproduction de l’ ADN
Recherche heuristique dans les bases de données L’algorithme BLAST
CHMI 2227F Biochimie I Expression des gènes
Figure 33 : un brin d’ARN obtenu à partir de l’ADN
Professeur Jeremías GONZÁLEZ
CHMI 4206F - Automne CHMI 4206 Bioinformatique appliquée Prof: Eric R. Gauthier, Ph.D. Département de chimie et biochimie Université Laurentienne.
La génétique et la biométrie
Introduction Matériels et méthodes Résultats
Collège Lionel-Groulx
Activité 6. Influence des gènes et de l’environnement sur les phénotypes aux différentes échelles du vivant.
E.R. Gauthier, Ph.D.CHMI 3216F – A20091 Bioingénierie de l’A.D.N. CHMI 3216 F 14 Septembre 2009 Boîte à outils, 2 ième partie (suite). Plasmides, clonage.
CHMI 2227F Biochimie I Expression des gènes
XUGUANG LI, JOHNSON MAK, ERIC J. ARTS, ZHENGXIAN GU, LAWRENCE KLEIMAN, MARK A. WAINBERG,* AND MICHAEL A. PARNIAK *
Gène Séquence d'acides nucléïques contenant une information codée pour la production régulée d'un ARN (transcription), ce dernier pouvant être traduit.
Réunion MODULOME 15/10/2007 Christine ROUSSEAU Recherche des CRISPRs : Résultats MODULOME.
Introduction à la Bio-Informatique
Institut Universitaire de Technologie de Clermont-Ferrand
La génétique et la biométrie
Chapitre 4 : Un regard sur l'évolution de l'homme
Recherche heuristique dans les bases de données L’algorithme BLAST
Cartographie génomes entiers
LA RÉGULATION DES GÈNES
L’analyse d’ADN et la génomique
Aspects techniques des biotechnologies
Exercice L’EPISSAGE ALTERNATIF DE L’ARN
On s‘intéressera à 3 gènes paralogues humains : HTR2A, HTR2B et HTR2C du récepteur de la sérotonine humaine (Swissprot : 5HT2A_HUMAN, 5HT2B_HUMAN, 5HT2C_HUMAN).
REGULATION DE L’EXPRESSION DES GENES
Introduction à la Bio-Informatique
CHMI 4206 Bioinformatique appliquée
Régulation de l’expression génétique: la transcription
Les banques de séquences nucléiques
CHMI 4206 Bioinformatique appliquée
CHMI 4206F - Automne CHMI 4206 Bioinformatique appliquée Prof: Eric R. Gauthier, Ph.D. Département de chimie et biochimie Université Laurentienne.
CHMI 4206 Bioinformatique appliquée
CHMI 4206 Bioinformatique appliquée
CHMI 4206 Bioinformatique appliquée
CHMI 4206 Bioinformatique appliquée
CHMI 4206F - Automne CHMI 4206 Bioinformatique appliquée Prof: Eric R. Gauthier, Ph.D. Département de chimie et biochimie Université Laurentienne.
Aspects techniques des biotechnologies
RASAHOLIARISON Nomena Interne 1 er semestre en Neurologie USFR Neurologie CHU-JRB FACULTE DE MEDECINE UNIVERSITE D’ANTANANARIVO Cours du 01 avril 2015.
Bio-Informatique Analyse de séquences nucléotidiques
De l’ADN à la Protéine : Transcription et Traduction
BIO-INFORMATIQUE Analyse de séquences nucléotidiques - séance n°1 Illustration:
Analyse de séquences nucléotidiques séance n°2 Bio-Informatique.
L’EPISSAGE ALTERNATIF DE L’ARN
Expression du Génome Le transcriptome.
Expression du Génome Le transcriptome.
Transcription de la présentation:

CHMI 4206 Bioinformatique appliquée Prof: Eric R. Gauthier, Ph.D. Département de chimie et biochimie Université Laurentienne Bioinformatique 3: Annotation de chromosomes. CHMI 4206F - Automne 2010

Annotation de chromosomes Suite au séquençage d’un chromosome, on doit procéder à l’étape suivant: identifier les morceaux de séquences importants du point de vue fonctionnel: Gènes: Implique la localisation des exons/introns Promoteurs Séquences répétées CHMI 4206F - Automne 2010

Structure des gènes eucaryotes CHMI 4206F - Automne 2010

Épissage L’épissage alternatif permet d’obtenir différentes saveurs de protéines en incluant/excluant des exons ou introns lors de l’épissage Le patron d’épissage alternatif est généralement spécifique au type cellulaire. CHMI 4206F - Automne 2010

Signaux d’épissage Séquence consensus bordant les introns/exons (R=purine; Y=pyrimidine; N=any nucleotide): On peut utiliser ces séquences pour nous aider à trouver des gènes parmi la séquence d’un chromosome INTRON 5’ EXON 3’ EXON 5’ AG/GUAAGU-(N)x-YNCURAC-Y9-NAG/G 3’ CHMI 4206F - Automne 2010

Quelques approches in silico pour l’annotation de chromosomes 1. Utilisation de logiciels reconnaissant les frontières exons/introns P.ex. GenomeScan 2. Utilisation de la séquence du chromosome pour faire une recherche BLAST dans des bases de données d’EST (expressed sequence tags). 3. Comparaison de séquence de chromosome appartenant à différentes espèces P.ex. PipMaker/MultiPipmaker Important: aucune de ces approches est parfaite. On doit confirmer les résultats obtenus avec une approche en utilisant une ou l’autre des deux autres approches (ou même les deux…). CHMI 4206F - Automne 2010

GenomeScan Exemple: structure du gène GADD153 humain 1) Localisation du chromosome encodant GADD153 Se fait aisément via un BLAST du génome humain avec l’ARNm de GADD153: NM_004083. Le résultat de Blast nous donne déjà un bon indice de la position des introns/exons! 2) Sélectionne la région du chromosome contenant la séquence de GADD153 3) Paste cette séquence dans la boîte appropriée de GenomeScan 4) Trouve le cadre de lecture ouvert de GADD153, convertir en format FASTA, et coller cette séquence dans la deuxième boîte de GenomeScan. CHMI 4206F - Automne 2010

CHMI 4206F - Automne 2010

CHMI 4206F - Automne 2010

CHMI 4206F - Automne 2010

CHMI 4206F - Automne 2010

57 910 000 57 914 500 CHMI 4206F - Automne 2010

CHMI 4206F - Automne 2010

Séquence chromosome 12 - Région contenant GADD153 CHMI 4206F - Automne 2010

Utilisation de « Blast 2 Sequences » (bl2seq) Permet de faire l’alignement entre 2 séquences; Ici, on choisis les 2 séquences suivante pous l’alignement: ARNm complet de GADD153 Format FASTA Obtenu à partir de Entrez Gene Portion du génome humain possèdant le gène GADD 153 Obtenu à partir d’un BLAST du génome humain CHMI 4206F - Automne 2010

Utilisation de « Blast 2 Sequences » (bl2seq) Gene mRNA CHMI 4206F - Automne 2010

Utilisation de « Blast 2 Sequences » (bl2seq) CHMI 4206F - Automne 2010

Utilisation de « Blast 2 Sequences » (bl2seq) Query = gène Subject = ARNm CHMI 4206F - Automne 2010

Utilisation de « Blast 2 Sequences » (bl2seq) 335 pb 109 pb ATG 49 pb 2663 pb 100 pb 594 pb 79 pb CHMI 4206F - Automne 2010

Confirmation par BLAST En utilisant la séquence du chromosome 12 contenant GADD153, on peut faire une recherche BLAST de bases de données d’EST. EST: Expressed sequence tags Base donnée de séquences anonymes d’ADNc issues de séquençage à grande échelle. CHMI 4206F - Automne 2010

Expressed Sequence Tags Transcriptase inverse Isolation ARNm Mélange d’ADNc (copies ADN de tous les ARNm du cerveau) Base de données de séquence d’EST Séquence des millions d’ADNc Clone le mélange d’ADNc dans des plasmides L’identité et la proportion relative (abondance) des EST dépend strictement de l’organe et de son état au moment de l’isolation de l’ARNm (développement, pathologie, stress, etc). CHMI 4206F - Automne 2010

Expressed Sequence Tags Utilité des bases de données de EST: Donne l’ensemble des ARNm exprimés dans un organe/tissu/cellule donné (donc: le transcriptome) au moment où les ARNm ont été isolés. Permet de détecter des formes d’ARNm jusqu’ici inconnues (p.ex. dû à un épissage alternatif). Permet de détecter l’expression de gènes inconnus jusqu’ici. CHMI 4206F - Automne 2010

Confirmation de l’organisation du gène GADD153 par BLAST CHMI 4206F - Automne 2010

Confirmation de l’organisation du gène GADD153 par BLAST CHMI 4206F - Automne 2010

Confirmation de l’organisation du gène GADD153 par BLAST CHMI 4206F - Automne 2010

Confirmation de l’organisation du gène GADD153 par BLAST CHMI 4206F - Automne 2010

Comparaison bl2seq et EST 335 pb 109 pb ATG 49 pb 2663 pb 100 pb 594 pb 79 pb EST 180 pb 264 pb ATG 49 pb 2743 pb 81 pb 588 pb La comparaison entre différentes méthodes permet d’identifier de nouvelles saveurs d’ARNm. CHMI 4206F - Automne 2010

Utilisation de MultiPipMaker - localisation du gène Ici, on va faire l’alignement de chromosomes de plusieurs espèces afin de déduire l’organisation du gène GADD153. Il faut donc en premier trouver les régions de chromosomes contenant GADD153 chez les espèces suivantes (BLAST des génomes avec ARNm de GADD153 humain): Souris Rat Chimpanzé Chien MultiPipmaker te permettra d’obtenir les informations suivantes: Présence d’ilôts de conservation de séquence en nucléotide entre toutes ces espèces (donc: indication de la présence possible d’un gène) Un fichier montrant l’alignement entre les génomes et les similarités de séquence. CHMI 4206F - Automne 2010

Utilisation de MultiPipMaker - localisation du gène CHMI 4206F - Automne 2010

Utilisation de MultiPipMaker - localisation du gène CHMI 4206F - Automne 2010

Multipipmaker CHMI 4206F - Automne 2010

Multipipmaker Les régions rouges indiquent une bonne conservation de la séquence en nucléotide. Les régions vertes montrent un certain degré de conservation. Il existe seulement un seul ilôt de conservation parmi toutes les espèces, centré à ~3500 pb de la séquence humaine CHMI 4206F - Automne 2010

Multipipmaker Distribution des séquences conservées vs humain CHMI 4206F - Automne 2010

Multipipmaker -alignement des séquences CHMI 4206F - Automne 2010

Multipipmaker Exon1 / Intron1 Intron1 / Exon 2 CHMI 4206F - Automne 2010

Multipipmaker Identification d’éléments du promoteur Bout 5’ de l’ARNm TATA box CHMI 4206F - Automne 2010

Exercice 1– Annotation Vous avec obtenu la séquence d’une partie d’un chromosome de souris. La séquence est accessible au lien suivant: http://www.ncbi.nlm.nih.gov/entrez/viewer.fcgi?val=NT_039302.6&from=3390566&to=3409909&view=fasta À l’aide de cette séquence répondez aux questions suivantes: 1) Trouvez le seul gène encodé par cette région de chromosome. 2) Donnez la position du gène sur le chromosome (carte cytogénétique). 3) Déterminez la structure complète (exon/intron) du gène. 4) Trouvez 500pb de la séquence promotrice de ce gène. Identifiez les régions potentiellement importantes pour l’expression de ce gène. CHMI 4206F - Automne 2010