BIO-INFORMATIQUE Analyse de séquences nucléotidiques - séance n°1 Illustration:
Plan du TP Objectifs Mise en situation Présentation des outils Pratique Evaluation
Objectifs Format Fasta Logiciel BioEdit BLAST Prediction de gènes Design primers … Analyse critique des résultats
Mise en situation Création banque cDNA Recherche de gènes candidats Impliqués dans la résistance à la sécheresse Arabidopsis thaliana
VecScreen reen.html
BioEdit
Le format FASTA (rappel) FASTA = format de séquence (ARN, ADN, Prot) utilisable par de nombreux outils bioinformatiques Bloc Note > Header AATTCCGGAATAA (séquence) ATGGCAA Enregistrer «.fasta »
Traduire ADN en protéine, trouver la phase de lecture codante
Mise en évidence d’ORF
Trouver les sites de restriction
Trouver les sites de restriction
Analyse taux de GC
BLAST
« Basic Local Alignment Search Tool » « Regions of local similarity between sequences. Nucleotide or protein sequences VS sequence databases Calculates the statistical significance of matches. »
« Basic Local Alignment Search Tool »
Choix du BLAST BLASTP: Search protein database using a protein query Identifier une protéine, trouver des régions similaires: Blastp Trouver des protéines apparentées éloignées (ou de nouveaux membres d’une famille protéique): (PSI)-BLAST (très sensible!) Trouver un motif protéique dans sa séquence et une similarité autour du motif: (PHI)-BLAST. Blastx : Search protein database using a translated nucleotide query (compares the six-frame conceptual translation products of a nucleotide query sequence (both strands) against a protein sequence database) plus sensible que nucléotide BLAST quand on a une séquence nucléotidique codante première analyse quand on a une nouvelle séquence nucléotidique!
Choix du BLAST TBLASTN: Search translated nucleotide database using a protein query – (compares a protein query sequence against a nucleotide sequence database dynamically translated in all six reading frames (both strands)). Efficace pour trouver d’une séquence EST des protéines probables TBLASTX: Search translated nucleotide database using a translated nucleotide query – (compares the six-frame translations of a nucleotide query sequence against the six-frame translations of a nucleotide sequence database). Efficace pour trouver d’une séquence EST des protéines probables Analyse intensif BlastN: Nucleotide database vs nucleotide query. Pratique pour trouver des homologies entre espèces proches.
Functional analyse
Functional analyse
Primer design
Introns Exons Si vous disposer De la séquence cDNA et gDNA
Genes prediction Localisation des gènes et positions introns exons