Analyse et comparaison des séquences biologiques

Slides:



Advertisements
Présentations similaires
Evaluation dheuristiques pour lalignement de séquences génomiques Stéphane Guyetant Séminaire Symbiose du 23/01/03.
Advertisements

Recherche de motifs par méthodes exploratoires: Comparaisons de performances et statistiques sur le score.
DE ZÉRO à PAUP : Délimitation du groupe d'intérêt ("ingroup")
Les données et les banques de données
Colloque Traitement et Analyse de séquences : compte-rendu
Initiation à la bioinformatique
Le remplacement moléculaire
Recherche heuristique de similitudes dans les séquences dADN École Jeunes Chercheurs en Algorithmique et Calcul Formel Laurent Noé
Caractérisation structurale d ’un régulateur transcriptionnel du « Quorum Sensing » chez Brucella abortus.
Yoann Beausse Journée Bioinformatique des Génopoles
Le code génétique Biologie 122.
TP 5 Du génome au protéome
Alignements par paires
UBLO Comparaison de génomes bactériens : questions méthodologiques autour de la définition du squelette et des boucles
Expression du Génome Le transcriptome.
La banque UniprotKB et le logiciel Blast
Recherche heuristique dans les bases de données L’algorithme BLAST
Alignements de séquences par paires
Formation Bio-informatique IRD
Recherche exacte de motifs
Familles de gènes Nadia El-Mabrouk.
Alignement de séquences biologiques
Création d’une base de données pour l’intégration de données génétiques et l’aide à la sélection de gènes candidats Franck De-graeve Master ASE.
Introduction à la Bio-Informatique
Recherche heuristique dans les bases de données L’algorithme BLAST
Présentations BIN1001.
Réalisation d’un arbre phylogénique à partir d’un fragment de séquence
On s‘intéressera à 3 gènes paralogues humains : HTR2A, HTR2B et HTR2C du récepteur de la sérotonine humaine (Swissprot : 5HT2A_HUMAN, 5HT2B_HUMAN, 5HT2C_HUMAN).
LES FRANÇAIS ET L’ONU. © Harris Interactive 2 SOMMAIRE > Méthodologie d’enquêteP.3 > Regard général sur l’ONUP.4 > Perception de l’action de l’ONU et.
M. Bétrancourt et C. Rebetez - Méthodologie expérimentale Diplôme MALTT Année La méthodologie expérimentale Fondements et bases d’application.
Introduction à la Bio-Informatique
Mais d’abord rappelez-vous!!
Les banques de séquences nucléiques
CHMI 4206 Bioinformatique appliquée
CHMI 4206 Bioinformatique appliquée
CHMI 4206 Bioinformatique appliquée
Plateforme de robotique
outLyzer Logiciel de détection des mutations à ratio allélique faible
APP-TSWD Apprentissage Par Problèmes Techniques des Sites Web Dynamiques Licence Professionnelle FNEPI Valérie Bellynck, Benjamin Brichet-Billet, Mazen.
Rôles et missions de l’AIS pour le développement économique de la région Réunion de travail du 17 mars 2016.
Bio-Informatique Analyse de séquences nucléotidiques
Création d’un site WEB 1 – Un site WEB c’est quoi ? 2 – Questions à se poser avant la construction d’un site WEB 3 – Principes de fonctionnement d’un site.
Etude de la suffisance et de la stabilité de la méta-analyse cumulative dans une base de données des essais cliniques randomisés en pédiatrie DJEMLI Amina.
Comment écrire un article scientifique Olivier MIMOZ DAR.
LCA UFR SMBH (DCEM)1 Analyse critique d ’articles évaluant l ’intérêt de nouveaux tests à visée diagnostique Alain Venot UFR SMBH Campus virtuel SMBH
1 PréAO LMD - Support de cours. 2 Qu'est un logiciel de PréAO ? Outil de création de présentation Multimédia –Texte –Image / Photo –Son –Vidéo –Autres.
Technologie génétique. La technologie génétique regroupe une série de méthodes qui permettent d’étudier et de manipuler le matériel génétique Ces techniques.
La création des données d’exemplaire pour un exemplarisateur Sudoc.
3. Exemple détaillé: Estimation des émissions de N 2 0 Aurore Philibert Doctorante en statistique appliquée à l’agronomie Oracle Kick-off Meeting
Du panier à la commande client Créer un panier Identification Validation de la commande Paiement Formulaire de création de compte Etats de la commande.
Mathématiques Mise à jour – Élaboration de l’examen en vue du diplôme – Mathématiques 30-1 et 30-2 (Cet atelier est la traduction d’un atelier en anglais.
Présentation projet de thèse Peut-on extrapoler le bénéfice thérapeutique des médicaments des adultes aux enfants? Perrine JANIAUD Directeur: Behrouz KASSAI.
LA METHODE DU BARYCENTRE.  Objectif :  La méthode du barycentre permet de déterminer le milieu d’un réseau de points à desservir dont les coordonnées.
Formation à l’utilisation de K-Sup V5 février 2009 CRISI - COM.
Le séquençage du génome entier : prochain test central des laboratoires de génétique médicale ? Damien Sanlaville Nicolas Chatron Laboratoire de Cytogénétique.
BIO-INFORMATIQUE Analyse de séquences nucléotidiques - séance n°1 Illustration:
1 Initiation aux bases de données et à la programmation événementielle VBA sous ACCESS Cours N° 7 Support de cours rédigé par Bernard COFFIN Université.
Évolution Post-domestication Marie ROUMET (DEPS) Florence LOUIS (IPV)
On the analysis of CMMN expressiveness: revisiting workflow patterns Renata Carvalho Hafedh Mili.
Calcul Intensif en Génomique Comparative Laurent Duret Laboratoire de Biométrie et Biologie Evolutive.
Marketing international
Universit é Mohamed Kheider de Biskra Facult é de science et technologie D é partement de g é nie é lectrique Sp é cialit é : t é l é communication Le.
Comparaison des méthodes d’extraction Abbott et NucliSENS easyMAG (bioMérieux) pour la quantification plasmatique du VIH-1. CONGO Malika Service de Bactériologie.
1 Sébastien BIRBANDT – Joël AUGUSTIN Séminaires Technologie en collège 2008 / e - DAAF 4 e - Détecteur Avertisseur Autonome de Fumée (DAAF) Approche.
Cours : Questions approfondies de méthodes didactiques et pédagogiques dans l'enseignement supérieur (PESU1051-1) Présenté par: Naziha DJEDAÏNI Année
Ensemble, éclairons votre réflexion. CONTINUER  NOTRE SAVOIR-FAIRE LES ENQUÊTES PAR INTERNET HERALIS Marketing S.A.S. Tel
Algorithme de Needleman et Wunsch (programmation dynamique)
L’arbre de la vie Page 20 Les relations évolutionnistes d’un groupe d’organismes sont des relations phylogénétiques Darwin: «phylogénie = branches d’un.
Technologie de l’ADN recombinant
Transcription de la présentation:

Analyse et comparaison des séquences biologiques Partie I: les alignements qualitatifs Identifiant: sv.bioinformatique@yahoo.fr Mot de passe: bioinformatique2015 Dr Lilia Romdhane Faculté des Sciences de Bizerte Institut Pasteur de Tunis 2015/2016

Objectifs: Initiation à la méthode de l’alignement pour la comparaison des séquences biologiques Initiation à l’utilisation de quelques logiciels bioinformatiques d’alignement

Comparaison –pourquoi faire ? Les alignements permettent de comparer des séquences biologiques. Cette comparaison est nécessaire dans différents types d’études : Localiser un gène sur un génome Recherche de similarité dans les banques: transférer des informations connues sur une nouvelle séquence Recherche de domaines ou motifs conservés: identification des résidus importants pour la structure ou la fonction Identification de gènes homologues Recherche de contraintes fonctionnelles communes à un ensemble de gènes ou de protéines. Prédiction de fonction Prédiction de structure (ARN, protéine) Reconstitution des relations évolutives entre séquences (phylogénie) Choix d'amorces PCR ...

Similarité et homologie Mesurée en % d’identité ou en % de similarité la similarité n’a pas directement de connotation évolutive 2 séquences peuvent être similaires: Par hasard: Exemple: Région de faible complexité Par évolution convergente: Exemple: Subtilisine et chymotrypsine sont 2 sérine protéases avec la même triade catalyitque (Ser, His, Asp) mais les séquences et les structures 3D sont différentes Par évolution divergente: Elles dérivent d’une même séquence ancestrale

Similarité et homologie Homologie: 2 séquences sont homologues si elles descendent d’un ancêtre commun Il n’existe pas de pourcentage d’homologie !!! Une similarité significative (> 20% d’identité) est généralement le signe d’une homologie Une similarité non significative ne veut pas dire que les séquences ne sont pas homologues: Exemples: myoglobine des mammifères et leghémoglobine des plantes: Séquences: moins de 20% d’identité même structure

Types d’alignement Alignement 2 à 2 (pairwise alignment): Exemple: Recherche de similarité dans une banque  Fasta, Blast Alignement multiple: Exemple: Alignement d’une famille de protéines  ClustalX, Mafft, multiZ Alignement global: Sur la totalité de la longueur des séquences Alignement local: Alignement de la ou des régions les plus fortement conservées: Intéressant si les séquences ne sont pas colinéaires

Similarité globale, locale

Comparaison de séquences

Alignement graphique

Matrice de points (dotplot) Référence: Gibbs and McIntyre. The diagram, a method for comparing sequences. Its use with amino acid and nucleotide sequences. European Journal of biochimestry, 1970 Principe de base: Les 2 séquences à comparer sont placées le longs des axes d’un graphique L’intersection de chaque colonne et de chaque ligne est marquée d’un point si la lettre est la même dans les 2 séquences

Alignement graphique avec le dotplot Dot Plot: Méthode de représentation visuelle des positions des similarités entre deux séquences (ou sur une même séquence) Objectif: * Détecter des répétitions internes dans une séquence * Identifier des régions de similarité entre 2 séquences * Identifier de longs indels entre deux séquences Principe: Mettre les séquences le long des axes d’une matrice et de mettre un point là où il y a une correspondance.

Exemple 1: Dot plot à partir des 2 séquences différentes: THFLTQHYDAKPQYRNDR KHFLTQHQHAKPFGRNDR L’alignement: trouver le meilleur chemin dans ce graphe T H F L Q Y D A K P R N X G

Exemple 2: Dot plot de la séquence avec elle-même: ABCDDFGKDFGABFGK

Le signal: Les diagonales Identité Une grande diagonale en cas d’identité parfaite: la séquence contre elle-même Les régions de similarité apparaissent comme des suites de points alignés  diagonales Similarité

Le signal: Les diagonales Un décalage par rapport à la diagonale indique une insertion ou une délétion dans l’une des séquences Une inversion de l’orientation d’une diagonale traduit une inversion d’une région d’ADN

Le signal: Les diagonales Une séquence avec elle-même: diagonales parallèles  présence de régions répétées Une séquence avec sa séquence complémentaire : détection de régions complémentaire dans une séquence (ex: structure secondaire d’ARN)

Exemple de programme: Dotlet (http://myhits.isb-sib.ch/cgi-bin/dotlet) Recherche de régions répétées dans la protéine ribosomale S1 de E.Coli Swiss-Prot: P0AG67

Partie de la fiche SwissProt de la protéine RS1 de E.Coli Swiss-Prot: P0AG67

Comparaison de la séquence du gène de l’actine du muscle à son mRNA ACTA1: GeneID: 58 Comment apparaissent les exons dans un dotplot ? Combien d’exon comptez-vous? Que pouvez-vous dire de la taille des exons comparée à celle des introns?

Partie de la fiche du gène de l’actine du muscle chez l’Homme dans Gene (NCBI)

Matrice de points: Comparaison de chromosomes complets Genome sequences of Chlamydia trachomatis MoPn and Chlamydia pneumonia AR39. Read et al. Nucleic Acids Research 28, 1397-1406, 2000

La matrice des points (dotplot) Avantages: Vision globale de similarité entre 2 séquences toutes les zones de similarité sont visibles détection rapide: des insertions / délétions des inversions des régions répétées des zones d’appariements potentiels de l’ARN Inconvénients: Méthode visuelle aucun alignement n’est fourni Programmes: Dotter, GCG (Compare et Dotplot), Dottup (http://mobyle.pasteur.fr/cgi-bin/portal.py#forms::dottup )

Le serveur Mobyle@Pasteur S’enregistrer Les logiciels

Chercher le logiciel Dottup Alignment > pairwise > dot_plots > dottup

Dottup Copier-coller séquence 1 Copier-coller séquence 2

Copier-coller les séquences

Saisie de l’adresse mail

Saisie de l’adresse mail

Valider la soumission

Sauvegarde du fichier résultat

Sauvegarde du fichier résultat