Télécharger la présentation
La présentation est en train de télécharger. S'il vous plaît, attendez
Publié parAugustin Bernier Modifié depuis plus de 8 années
1
Bio-Informatique Analyse de séquences nucléotidiques
Illustration:
2
Objectifs Format Fasta Logiciel d’édition ApE BLAST
Prédiction de gènes Design primers Recherche de sites de restriction Analyse critique des résultats
3
Mise en situation Création banque cDNA Recherche de gènes candidats
Arabidopsis thaliana Recherche de gènes candidats impliqués dans la résistance à la sécheresse
4
Trouver des infos sur le vecteur pUC57
Enregistrer la séquence du vecteur vide en format .fasta Système de sélection Blanc/Bleu:
5
Le format FASTA (rappel)
FASTA = format de séquence (ARN, ADN, acides aminés) utilisable par de nombreux outils bioinformatiques Programme: Bloc Note >Identifiant (commentaire) AATTCCGGAATAAATGGCAA (séquence) Enregistrer « .fasta » Ce caractère indique le début d’une nouvelle séquence Pour faciliter l’alignement des caractères: dans WORD, utiliser police Courier Taille 8 ou 10
6
Logiciel d’édition : ApE
Logiciel gratuit et convivial d’édition de séquence Permet alignement, création de carte de restriction, obtenir un réverse complémentaire, rechercher des ORF,…
7
Logiciel d’édition : ApE
Logiciel gratuit et convivial d’édition de séquence Permet alignement, création de carte de restriction, obtenir un réverse complémentaire, rechercher des ORF,… Recherche d’éléments connus (features)
8
Logiciel d’édition : ApE
Logiciel gratuit et convivial d’édition de séquence Permet alignement, création de carte de restriction, obtenir un réverse complémentaire, rechercher des ORF,…
9
Distinguer la séquence de l’insert de celle du vecteur: VecScreen
10
Distinguer la séquence de l’insert de celle du vecteur: VecScreen
11
Logiciel d’édition : ApE
Tools: Align sequences (…) (…)
12
Traduire ADN en protéine, trouver la phase de lecture codante
Via ExPASy et ORF Finder Deux programmes simples : OK pour génomes procaryotes OK si départ de cDNA car pas d’introns MAIS à partir d’ADNg d’organismes eucaryotes, besoin de programmes plus sophistiqués
13
Traduire ADN en protéine, trouver la phase de lecture codante
ExPASy Outil de traduction Présente les 6 cadres de lecture possibles
14
Traduire ADN en protéine, trouver la phase de lecture codante
ExPASy Outil de traduction Présente les 6 cadres de lecture possibles Sélection des ORF probables: taille > 300 bp entre un START et un STOP Lien direct vers BLAST
15
Mise en évidence d’ORF
16
Mise en évidence d’ORF http://www.ncbi.nlm.nih.gov/projects/gorf/
Récupération de la séquence nucléotidique de l’ORF de notre choix en .fasta
17
Identification de la fonction potentielle
18
« Basic Local Alignment Search Tool »
- Regions of local similarity between sequences. Calculates the statistical significance of matches Calcul d’un score de similarité et une E-value (probabilité d’obtenir cette similitude par hasard) Au plus la E-value est faible au plus il est probable que les deux séquences comparées soient homologues Plusieurs types de BLAST: Nucleotide or protein sequences VS nucleotide or protein or translated DNA sequence databases
19
Choix du BLAST BlastN BlastP BlastX tBlastN tBlastX
Type de séquence à analyser Type de banque utilisée BlastN BlastP BlastX tBlastN tBlastX Nucléotidique Nucléotidique Protéique Protéique Nucléotidique Traduction AA Protéique Protéique Nucléotidique Traduction AA Nucléotidique Traduction AA Nucléotidique Traduction AA Interet des BlastX : outrepasser le « wobble » mutation silencieuse de la troisième base des codons
20
Choix du BLAST BlastN BlastP BlastX tBlastN tBlastX
Type de séquence à analyser Type de banque utilisée BlastN BlastP BlastX tBlastN tBlastX Nucléotidique Nucléotidique Protéique Protéique Nucléotidique Traduction AA Protéique Protéique Nucléotidique Traduction AA Nucléotidique Traduction AA Nucléotidique Traduction AA
21
« Basic Local Alignment Search Tool »
Blast de la séquence entière (pas que l’ORF)
22
« Basic Local Alignment Search Tool »
Code couleur: en fonction des E-values croissantes
23
Choix du BLAST BlastN: Nucleotide database vs nucleotide query.
Pratique pour trouver des homologies entre espèces proches. TBLASTN: Search translated nucleotide database (AA) using a protein query (AA) compares a protein query sequence against a nucleotide sequence database dynamically translated in all six reading frames (both strands). Efficace pour trouver d’une séquence EST des protéines probables TBLASTX: Search translated nucleotide database using a translated nucleotide query (compares the six-frame translations of a nucleotide query sequence against the six-frame translations of a nucleotide sequence database). Analyse intensif
24
Choix du BLAST BLASTP: Search protein database (AA) using a protein query (AA) Identifier une protéine, trouver des régions similaires Différents algorithmes possibles en fonction de ce que l’on cherche: Trouver des protéines apparentées mais plus éloignées (ou de nouveaux membres d’une famille protéique): (PSI)-BLAST (très sensible!) Trouver un motif protéique dans sa séquence et une similarité autour du motif: (PHI)-BLAST. Blastx: Search protein database using a translated nucleotide query (compares the six-frame conceptual translation products of a nucleotide query sequence (both strands) against a protein sequence database) plus sensible que nucléotide BLAST quand on a une séquence nucléotidique codante première analyse quand on a une nouvelle séquence nucléotidique!
25
Que contient une page d’entrée GenBank-NCBI?
Nom de la séquence dans la banque de données, taille et description brève Numéro d’accession unique! Le plus simple pour retrouver une séquence de façon certaine Eventuellement des synonymes Bibliographie
26
Que contient une page d’entrée GenBank-NCBI?
Liste des différents éléments de séquence identifiés Dépend du type de séquence encodée (ex: promoteur, gene, CDS, RBS…) Position exacte de la CDS suivie d’une description brève et de la séquence en AA de la protéine encodée et numéro d’accession de la séquence protéique dans la banque de donnée (…)
27
Que contient une page d’entrée GenBank-NCBI?
Séquence nucléotidique Début: Origine Fin: // (…) Obtenir la séquence en .fasta
28
Que contient une page d’entrée GenBank-NCBI?
Séquence génomique d’origine
29
Que contient une page d’entrée GenBank-NCBI?
Séquence génomique d’origine
30
Que contient une page d’entrée GenBank-NCBI?
Exemple plus complexe de séquence génomique encodée en plusieurs entrées Formule du gène: Reconstruction à suivre Nucléotides de 1 à 1735 de la page AF018429 Nucléotides de 1 à 1177 de la page actuelle Nucléotides de 1 à 45 de la page AF018431 Nucléotides de 658 à 732 de la page AF018432 (…) < et > signifie que le gène peut en réalité dépasser ces limites de début et de fin Deux mRNA différents Façon dont GenBank représente le splicing alternatif Plus loin dans la liste, on trouve la position d’un exon
31
Primer design Critères de départ: Longueur: entre 18 et 25 bp
Séquence: % en GC compris entre 50 et 60 % séquence se terminant par un C ou G Température de melting: T°m : 4(GC)+2(AT) identiques pour les deux primers REM : si bouts flottants, ne pas tenir compte de cette partie non hybridée pour les premiers cycles Structures secondaires, dimères de primers, self dimers,… Toujours simuler la PCR in silico avant la commande des primers
32
Primer design
33
Primer design
34
Primer design Analyseur d’oligonucléotides:
35
ADNc <> ADNg recherche d’introns-exons
MAIS, il faut disposer de la séquence cDNA et gDNA
36
ADNc <> ADNg recherche d’introns-exons
MAIS, il faut disposer de la séquence cDNA et gDNA On évite alors de choisir des primers à proximité (min 2 bases de distance) de l’intron mis en évidence
37
Genes prediction Localisation des gènes et positions introns exons
38
Trouver des sites de restriction
39
Trouver des sites de restriction
Logiciel ApE
40
Trouver des sites de restriction
Logiciel ApE
41
Trouver des sites de restriction
Logiciel ApE
42
Trouver des sites de restriction
Site de New England Biolabs : une mine d’informations sur les enzymes de restriction!!! Tout ce qu’il faut savoir sur les digestions par enzymes de restriction: Guide technique PDF à télécharger gratuitement Des outils pratiques: NEBcutter 2.0
43
Trouver des sites de restriction
44
Trouver des sites de restriction
Site de New England Biolabs : une mine d’informations sur les enzymes de restriction!!! Tout ce qu’il faut savoir sur les digestions par enzymes de restriction: Guide technique PDF à télécharger gratuitement Des outils pratiques: NEBcutter 2.0 et meme, … super pratiques: Enzyme finder
45
Trouver des sites de restriction
46
Analyse taux de GC
47
Functional analyse
48
Functional analyse
Présentations similaires
© 2024 SlidePlayer.fr Inc.
All rights reserved.