Les banques de séquences nucléiques

Slides:



Advertisements
Présentations similaires
Cladogramme.
Advertisements

Du gène à la protéine A. Les molécules
Un aperçu de la bioinformatique moléculaire
Evaluation dheuristiques pour lalignement de séquences génomiques Stéphane Guyetant Séminaire Symbiose du 23/01/03.
DE ZÉRO à PAUP : Délimitation du groupe d'intérêt ("ingroup")
Les données et les banques de données
Question. Compléter les phrases suivantes.
Transcription de l’ADN
Colloque Traitement et Analyse de séquences : compte-rendu
Initiation à la bioinformatique
Les enzymes : outils de biologie moléculaire Enzymes de restriction: endonucléases Kinases: ajoutent un phosphate (P*) Phosphatases: retirent un phosphate.
1 Recherche de répétitions distantes dans les séquences Etudiant : Laurent NOE Encadrant : Gregory KUCHEROV.
Recherche heuristique de similitudes dans les séquences dADN École Jeunes Chercheurs en Algorithmique et Calcul Formel Laurent Noé
Analyse bioinformatique de données de séquençage NGS médicales
ADN.
Comment obtenir un prix Nobel ?
Bioinformatique =?? génomique protéomique
Correction du TP sur la transcription.
LES BASES MOLÉCULAIRES DE L’HÉRÉDITÉ DU GÈNE À LA PROTÉINE
YASS : Recherche de similarités dans les séquences d'ADN
Sélection doligonucléotides spécifiques à laide de familles de graines AS Indexation de Texte et Découverte de Motifs Lina (Nantes) mai 2004.
TP 5 Du génome au protéome
La synthèse des protéines
Alignement de séquences (suite)
Le ribosome.
La transcription.
Prédiction de la structure 3-D des protéines
Expression du Génome Le transcriptome.
La synthèse des protéines
ADN à ARN La synthèse des protéines étape 1
L'information génétique
II.2 La molécule d’ADN: le support chimique universel de l’information génétique > Activité 3-0 : une extraction de la molécule d’ADN.
LA SYNTHÈSE DES PROTÉINES
Les acides nucléiques.
La structure et la reproduction de l’ ADN
Rappels- introduction Le vivant =
La banque UniprotKB et le logiciel Blast
Recherche heuristique dans les bases de données L’algorithme BLAST
Alignements de séquences par paires
Université Hassan II AIN CHOCK Faculté de Médecine et de Pharmacie Casablanca - Cours de Biologie - Pr. Tahiri Jouti N. Année Universitaire
Ordre des chapitres : 1 – 3 – 2 – 4 1.
Activité 4 Correspondance gène/protéine.
Formation Bio-informatique IRD
Recherche exacte de motifs
Analyses phylogénétiques
Quand la génétique s'en mêle.
Alignement de séquences biologiques
De l’ADN aux protéines.
La réplication.
Création d’une base de données pour l’intégration de données génétiques et l’aide à la sélection de gènes candidats Franck De-graeve Master ASE.
4.6 – La synthèse des protéines
Page Révision du chapitre 7
Introduction à la Bio-Informatique
Changement de représentation et alignement de séquences. Hugues DELALIN Encadrement: E. Mephu Nguifo.
Institut Universitaire de Technologie de Clermont-Ferrand
Recherche heuristique dans les bases de données L’algorithme BLAST
Exercice L’EPISSAGE ALTERNATIF DE L’ARN
Introduction à la bioinformatique « Génomique Nouvelle Génération »
Introduction à la Bio-Informatique
Mais d’abord rappelez-vous!!
Régulation de l’expression génétique: la transcription
Pr B. AITABDELKADER CPMC
CHMI 4206 Bioinformatique appliquée
CHMI 4206 Bioinformatique appliquée
Techniques d’Analyse Moléculaire
Bio-Informatique Analyse de séquences nucléotidiques
Analyse et comparaison des séquences biologiques
BIO-INFORMATIQUE Analyse de séquences nucléotidiques - séance n°1 Illustration:
ADN : Acide désoxyribonucléique Santatra Ratsitohara RAZAFINDRASATA Interne des hôpitaux en Neurologie 1 er semestre – USFR Neurologie CHU/JRB FACULTE.
De l’ADN aux protéines.
Transcription de la présentation:

Les banques de séquences nucléiques Origine des données : Séquençage d’ADN et d’ARN Les données stockées : séquences + annotations Fragments de génomes Un ou plusieurs gènes, un bout de gène, séquence intergénique, … Génomes complets ARNm, ARNt, ARNr, … (fragments ou entiers) [ NB 1] : toutes les séquences (ADN ou ARN) sont écrites avec des T (thymine) [ NB 2] : les séquences sont toujours orientées 5’ vers 3’.

Allez dans «NCBI» Entrer la recherche suivante dans la base de donnée «Nucleotide»: Bovine chromogranin B

Séquence Fin

Nucleotide ambiguity code

Sbjct Query les caractères sont les mêmes: Identité ou match les caractères ne sont pas les mêmes: Substitution l’une des positions est un espace: Insertion / Délétion Identité (match) Substitution Délétion Insertion Sbjct Query Indel (Gap)

Format commun de manipulation des données: le format FASTA (Fast – alignment) Objectif: manipuler facilement des séquences dans les bases de données, à l’aide d’un format universel, compatibles avec les traitements de texte (sous forme de fichier texte), ou par copier – coller.

Séquence simplifiée (pas de chiffre)

Format commun de manipulation des données: le format FASTA (Fast – alignment) Remarques: -Les bases nucléotidiques ne référencient que des monobrins d’ADN (même si la séquence soumise est de l’ADN bicaténaire ou de l’ARN)  la séquence est toujours dans le sens 5’P – 3’OH -Les séquences nucléotidiques selon le degré de précision de l’enregistrement seront écrites le plus souvent avec A,T, C et G et/ou avec R,Y (base puRique A et G / base pYrimidique C et T) et/ou K,M (base Keto G et T / base aMino A et C)...

Comparaison de séquences La comparaison de séquences comme méthode de prédiction Activité principale en bioinformatique Alignement: processus de comparaison de séquences permettant d'obtenir le maximum de correspondances entre les lettres qui les composent. Il est quantifié par un score de similarité Similarité: mesure du degré de ressemblance entre séquences, quantifié par un score, calculé à l’aide d’une matrice de score. Homologie: parenté évolutive. Inférence déduite à partir du degré de similitude. Mais deux séquences similaires ne sont pas forcément dérivées d'un ancêtre commun.

Identification, prédiction de structure de propriétés, de fonction Principe de la comparaison de séquences La comparaison de séquences est l’outil central en bioinformatique : Repose sur des calculs matriciels ou des algorithmes complexes qui rendent des résultats sous forme de données statistiques (% match, score, e-value…) Logiciel d’alignement le plus connu = BLAST (Basic Local Alignment Search Tool) Alignement de séquences Score de similitude Démarche globale : Degré d’homologie Identification, prédiction de structure de propriétés, de fonction

NCBI: Blast

Specialized Blast (Blast spécialisé)

Allez dans: http://blast.ncbi.nlm.nih.gov/Blast.cgi

Autres portails bioinformatique…

Protéomique…

Génomique…

Principe de la comparaison de séquences Principe du calcul des scores d’alignement : En pratique, plus le score d’alignement est élevé, plus les séquences sont similaires et présenteront des propriétés et des fonctions proches.  plus de 70% de similarité permettent d’affirmer qu’il y a homologie