Initiation à la bioinformatique

Slides:



Advertisements
Présentations similaires
Taxonomie bactérienne
Advertisements

Evaluation dheuristiques pour lalignement de séquences génomiques Stéphane Guyetant Séminaire Symbiose du 23/01/03.
I. Recherche du gène correspondant aux séquences initiales.
I) Obtention de l’ADN recombinant
I) Obtention de l’ADN recombinant
Biologie Moléculaire des Hépatites Virales
Colloque Traitement et Analyse de séquences : compte-rendu
Université Paris XII - IUP SIAL maîtrise Breton Elodie – Royer Gwladys
Le remplacement moléculaire
Génomique et post-génomique végétale
UML (Unified Modeling Langage)
Modélisation des systèmes non linéaires par des SIFs
Les enzymes : outils de biologie moléculaire Enzymes de restriction: endonucléases Kinases: ajoutent un phosphate (P*) Phosphatases: retirent un phosphate.
Bioinformatique =?? génomique protéomique
Université de La Rochelle Saisie et Mise à jour des fiches ECTS le 05/12/2001.
Recherche bibliographique Interrogation de banques de données
Activité 5. Du génome au protéome
LES BASES MOLÉCULAIRES DE L’HÉRÉDITÉ DU GÈNE À LA PROTÉINE
Les systèmes d’information Géographique . نظم المعلومات الجغرافية
La création de sinistre, la sélection à des fins de consultation, modification ou impression sont accessibles grâce à la barre de menu à gauche de l'écran.
Collège Lionel-Groulx
Transcription in vitro : principe et applications
Biochimie structurale
Université de La Rochelle Saisie et Mise à jour des fiches ECTS le 01/12/2000.
<? Le PHP appliqué à la BioInformatique ?>
CHAPITRE 19 - La génétique des populations
Expression du Génome Le transcriptome.
Clonage Moléculaire.
Introduction à la bioinformatique
II.2 La molécule d’ADN: le support chimique universel de l’information génétique > Activité 3-0 : une extraction de la molécule d’ADN.
Prédiction d’interactions protéine-protéine
La banque UniprotKB et le logiciel Blast
Recherche heuristique dans les bases de données L’algorithme BLAST
printemps des sciences
Etienne Danchin & Amandine Campan Présentation interne, pôle Santé des Plantes, Sophia - Antipolis Mercredi 21 avril 2010 Grille PACA ProActive : retour.
Recherche exacte de motifs
Collège Lionel-Groulx
Présentation de l’ENT (espace numérique de travail)
E.R. Gauthier, Ph.D.CHMI 3216F – A20091 Bioingénierie de l’A.D.N. CHMI 3216 F 14 Septembre 2009 Boîte à outils, 2 ième partie (suite). Plasmides, clonage.
Introduction et Généralités sur l’Algorithmique
Réseau d’interactions Développement, reproduction,
Banques de données en bio-informatique
Soutenance du mémoire de synthèse
Protéine.
Clonage Moléculaire.
Création d’une base de données pour l’intégration de données génétiques et l’aide à la sélection de gènes candidats Franck De-graeve Master ASE.
Intégration des données sur le transcriptome
Introduction à la Bio-Informatique
Changement de représentation et alignement de séquences. Hugues DELALIN Encadrement: E. Mephu Nguifo.
Recherche heuristique dans les bases de données L’algorithme BLAST
L’analyse d’ADN et la génomique
Sylvain Foisy, Ph. D. Bio-informaticien Conseil Diploide.net Sources de données en bio-informatique.
Introduction à la bioinformatique « Génomique Nouvelle Génération »
Introduction à la Bio-Informatique
Mais d’abord rappelez-vous!!
Dreamweaver Séance 1.
Les banques de séquences nucléiques
CHMI 4206 Bioinformatique appliquée
CHMI 4206 Bioinformatique appliquée
DREAMWEAVER SEANCE 1 Axel JACQUET GM05 – Julien VAN MOORLEGHEM GM05 A2008 Écriture interactive & multimédia Présentation Dreamweaver 8.
CHMI 4206 Bioinformatique appliquée
Aspects techniques des biotechnologies
Note 1 : Tous les rapports de T.P. devront être soumis avant la date limite via le serveur Esilbac. Aucune autre forme de remise ne sera acceptée. Note.
Techniques d’Analyse Moléculaire
Bio-Informatique Analyse de séquences nucléotidiques
Analyse et comparaison des séquences biologiques
1 Tableur Excel. 2 Introduction Un tableur est un logiciel permettant de manipuler des données numériques et d'effectuer automatiquement des calculs sur.
1 Initiation aux bases de données et à la programmation événementielle VBA sous ACCESS Cours N° 4 Support de cours rédigé par Bernard COFFIN Université.
BIO-INFORMATIQUE Analyse de séquences nucléotidiques - séance n°1 Illustration:
elmousaoui mourad dalli mohammed bouzIane omar Prof. N. Boukhatem
Transcription de la présentation:

Initiation à la bioinformatique Formation biologie moléculaire / bioinformatique Mercredi 20 mars 2013 Initiation à la bioinformatique

La bioinformatique. C’est quoi ? Initiation à la bioinformatique – 20 mars 2013

La bioinformatique. C’est quoi ? Ensemble de méthodes, de logiciels et d’applications en ligne qui permettent de gérer, manipuler, et analyser des données biologiques. La bioinformatique met en jeu plusieurs champs disciplinaires : Informatique Mathématiques formelles Statistiques Biologie Initiation à la bioinformatique – 20 mars 2013

La bioinformatique. Pourquoi ? Initiation à la bioinformatique – 20 mars 2013

La bioinformatique. Pourquoi ? La bioinformatique a différents objectifs et différentes applications : 1-Collecter et stocker des informations dans des bases de données, accessibles en ligne. Explosion de la quantité de données biologiques nécessitant des outils de stockage adaptés Initiation à la bioinformatique – 20 mars 2013

La bioinformatique. Pourquoi ? La bioinformatique a différents objectifs et différentes applications : 2-Fournir des outils de comparaison de séquences (protéiques ou nucléotidiques). Séquence de référence Séquence à analyser Identification ? Points communs ? Objectifs : -identifier une séquence par rapport à une base de données -déterminer le degré de similitudes entre deux séquences (intérêt en taxonomie) -repérer des motifs structuraux : -gènes, promoteurs, etc. pour un nucléotide. -zone de repliement, site actif, etc. pour un polypeptide. Initiation à la bioinformatique – 20 mars 2013

La bioinformatique. Pourquoi ? La bioinformatique a différents objectifs et différentes applications : 3-Fournir des outils de traduction de séquences. Séquence nucléotidique Séquence polypeptidique Traduction Objectifs : -simplifier les taches de traduction -proposer plusieurs possibilités de protéines pour une même séquence -repérer exons / introns Initiation à la bioinformatique – 20 mars 2013

La bioinformatique. Pourquoi ? La bioinformatique a différents objectifs et différentes applications : 4-Fournir des outils de prédiction Prédiction physiologique et fonctionnelle Prédiction expérimentale Objectifs : -repérer des sites de restriction -prévoir la digestion d’un nucléotide -prévoir / simuler la migration de fragments nucléotidiques ou protéiques lors d’une électrophorèse… Objectifs : -repérer un opéron -repérer un gène ou une protéine anormale -prévoir la structure 3D d’une protéine -repérer des mutations -prédire une pathologie… Initiation à la bioinformatique – 20 mars 2013

La bioinformatique. Pourquoi ? Analyse de séquences Séquence nucléotidique Fonction biochimique Activité biologique Gène Protéine Prédiction / simulation expérimentale Biologie in silico Initiation à la bioinformatique – 20 mars 2013

La bioinformatique. Quelques repères historiques… Initiation à la bioinformatique – 20 mars 2013

Quelques repères historiques… Années 80 : - Début de la micro-informatique - Création des premières bases de données (GENBANK) Années 90 : - Développement de l’internet et des réseaux - Apparition des logiciels de comparaison de séquences (FASTA, BLAST) Années 2000 : Consultation libre en ligne des bases de données Mutualisation des données avec les projets de séquençages de génomes Initiation à la bioinformatique – 20 mars 2013

Les bases de données Le cœur de la bioinformatique… Initiation à la bioinformatique – 20 mars 2013

Initiation à la bioinformatique – 20 mars 2013 Les bases de données Différentes catégories de bases de données : Bases de données bioinformatiques Bases généralistes -banque N -banque P Bases spécialisées Banques génomiques Banques fonctionnelles : -transcriptome -protéome -métabolome… Difficultés !! -Harmoniser le classement des informations -Utiliser un langage commun pour échanger des informations entre toutes ces bases Initiation à la bioinformatique – 20 mars 2013

Initiation à la bioinformatique – 20 mars 2013 Les bases de données Harmonisation des fiches de données Exemple de la fiche GENBANK d’un plasmide d’E.faecalis Initiation à la bioinformatique – 20 mars 2013

Initiation à la bioinformatique – 20 mars 2013 Les bases de données Harmonisation des fiches de données Suite de la fiche GENBANK d’un plasmide d’E.faecalis Initiation à la bioinformatique – 20 mars 2013

Initiation à la bioinformatique – 20 mars 2013 Les bases de données Harmonisation des fiches de données Fin de la fiche GENBANK d’un plasmide d’E.faecalis Initiation à la bioinformatique – 20 mars 2013

Initiation à la bioinformatique – 20 mars 2013 Les bases de données Harmonisation des fiches de données En résumé, une fiche comporte de nombreuses informations : Locus Identificateur (nom et taille de la séquence) Definition Description de la séquence Accession / version Numéro d’accès dans la base Keyword / Source / Organism / Reference / Authors / Title / Journal Informations diverses (taxonomie, publications…) Features Caractéristiques de la séquence / produits d’expression Origin Séquence (par blocs de caractères / par lignes) // Fin de l’entrée dans la base Initiation à la bioinformatique – 20 mars 2013

Initiation à la bioinformatique – 20 mars 2013 Les bases de données Format commun de manipulation des données : le format FASTA (Fast – alignment) Objectif : manipuler facilement des séquences dans les bases de données, à l’aide d’un format universel, compatibles avec les traitements de texte (sous forme de fichier texte), ou par copier – coller. Exemple de la fiche précédente du plasmide d’E.faecalis en format FASTA : Initiation à la bioinformatique – 20 mars 2013

Initiation à la bioinformatique – 20 mars 2013 Les bases de données Format commun de manipulation des données : le format FASTA (Fast – alignment) Remarques : -Les bases nucléotidiques ne référencient que des monobrins d’ADN (même si la séquence soumise est de l’ADN bicaténaire ou de l’ARN)  la séquence est toujours dans le sens 5’P – 3’OH -Les séquences nucléotidiques selon le degré de précision de l’enregistrement seront écrites le plus souvent avec A,T, C et G et/ou avec R,Y (base puRique A et G / base pYrimidique C et T) et/ou K,M (base Keto G et T / base aMino A et C). -Les bases protéiques sont référencées :  avec la séquence dans le sens N vers C terminal  avec le symboles d’acides aminés à 1 lettre Initiation à la bioinformatique – 20 mars 2013

Principe de la comparaison de séquences La comparaison de séquences est l’outil central en bioinformatique : Repose sur des calculs matriciels ou des algorithmes complexes qui rendent des résultats sous forme de données statistiques (% match, score, e-value…) Logiciel d’alignement le plus connu = BLAST (Basic Local Alignment Search Tool) Alignement de séquences Score de similitude Démarche globale : Degré d’homologie Identification, prédiction de structure de propriétés, de fonction Initiation à la bioinformatique – 20 mars 2013

Principe de la comparaison de séquences Principe du calcul des scores d’alignement : Exemple : Séquence de référence : AAA TTT GGG CCC Séquence 1 à analyser : AAA CCC GGG CCC Séquence 2 à analyser : AAA TTT CCC Alignement : AAA TTT GGG CCC AAA CCC GGG CCC Alignement : AAA TTT GGG CCC AAA TTT - - - CCC Non identité (mismatch) Non correspondance (gap) Score d’alignement = Somme des scores individuels (avec identité (match) = +2, non identité = -1 et gap -8) Score de la séquence 1: 2+2+2-1-1-1+2+2+2+2+2+2 = 15 Score de la séquence 2: 2+2+2-8+2+2+2+2+2+2 = 10 Initiation à la bioinformatique – 20 mars 2013

Principe de la comparaison de séquences Principe du calcul des scores d’alignement : En pratique, plus le score d’alignement est élevé, plus les séquences sont similaires et présenteront des propriétés et des fonctions proches.  plus de 70% de similarité permettent d’affirmer qu’il y a homologie Initiation à la bioinformatique – 20 mars 2013

Ou trouver les outils de bioinformatique ? Initiation à la bioinformatique – 20 mars 2013

Où trouver les outils de bioinformatique ? Outils indépendants, autonomes, en accès libre via internet (soit à utiliser en ligne, soit à télécharger sous forme d’installeurs).  on les recherche par l’intermédiaire d’un moteur de recherche Portails de bioinformatiques, fonctionnant en ligne, et comportant plusieurs outils en accès libre ou payant.  Exemples : - EBI (European Bioinformatics Institute) http://www.ebi.ac.uk - NCBI (National Center for Biotechnology Information) http://www.ncbi.nlm.nih.gov Initiation à la bioinformatique – 20 mars 2013

Où trouver les outils de bioinformatique ? Le portail EBI Initiation à la bioinformatique – 20 mars 2013

Où trouver les outils de bioinformatique ? Le portail NCBI Initiation à la bioinformatique – 20 mars 2013

Où trouver les outils de bioinformatique ? Le logiciel BLAST accessible depuis le portail Initiation à la bioinformatique – 20 mars 2013

La bioinformatique. Pour quelles applications en STL ? Initiation à la bioinformatique – 20 mars 2013

Initiation à la bioinformatique – 20 mars 2013 Applications en STL ? Recherche de données bibliographiques Alignement d’une séquence inconnue pour identification Analyse d’une séquence à la recherche de zones fonctionnelles Calcul de Tm, recherche d’amorces, simulation d’électrophorèse Etude des propriétés physico-chimiques d’une protéine Modélisation tridimensionnelle Initiation à la bioinformatique – 20 mars 2013

Exemple de scénario pédagogique Cas de toxi-infection : présence récurrente d’une protéine inconnue dans un aliment surgelé !! Identification après alignement avec une base de données Le gène correspondant à la protéine est-il connu ? Traduction protéine  nucléotide Le gène est retrouvé chez un taxon connu : on souhaite mettre en place une PCR afin de détecter la souche productrice dans l’aliment Prévision des amorces nécessaires On dispose du matériel pour réaliser la PCR, on veux maintenant, isoler le gène d’intérêt par électrophorèse Digestion de l’ADN par des enzymes de restriction et simulation de séparation par électrophorèse Initiation à la bioinformatique – 20 mars 2013

Initiation à la bioinformatique Formation biologie moléculaire / bioinformatique Mercredi 20 mars 2013 Initiation à la bioinformatique