La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Initiation à la bioinformatique Formation biologie moléculaire / bioinformatique Mercredi 20 mars 2013.

Présentations similaires


Présentation au sujet: "Initiation à la bioinformatique Formation biologie moléculaire / bioinformatique Mercredi 20 mars 2013."— Transcription de la présentation:

1 Initiation à la bioinformatique Formation biologie moléculaire / bioinformatique Mercredi 20 mars 2013

2 Initiation à la bioinformatique – 20 mars 2013 La bioinformatique. Cest quoi ?

3 Initiation à la bioinformatique – 20 mars 2013 La bioinformatique. Cest quoi ? Ensemble de méthodes, de logiciels et dapplications en ligne qui permettent de gérer, manipuler, et analyser des données biologiques. La bioinformatique met en jeu plusieurs champs disciplinaires : Informatique Mathématiques formelles Statistiques Biologie

4 Initiation à la bioinformatique – 20 mars 2013 La bioinformatique. Pourquoi ?

5 Initiation à la bioinformatique – 20 mars 2013 La bioinformatique. Pourquoi ? La bioinformatique a différents objectifs et différentes applications : 1-Collecter et stocker des informations dans des bases de données, accessibles en ligne. Explosion de la quantité de données biologiques nécessitant des outils de stockage adaptés

6 Initiation à la bioinformatique – 20 mars 2013 La bioinformatique. Pourquoi ? La bioinformatique a différents objectifs et différentes applications : 2-Fournir des outils de comparaison de séquences (protéiques ou nucléotidiques). Objectifs : -identifier une séquence par rapport à une base de données -déterminer le degré de similitudes entre deux séquences (intérêt en taxonomie) -repérer des motifs structuraux : -gènes, promoteurs, etc. pour un nucléotide. -zone de repliement, site actif, etc. pour un polypeptide. Séquence de référence Séquence à analyser Identification ? Points communs ?

7 Initiation à la bioinformatique – 20 mars 2013 La bioinformatique. Pourquoi ? La bioinformatique a différents objectifs et différentes applications : 3-Fournir des outils de traduction de séquences. Objectifs : -simplifier les taches de traduction -proposer plusieurs possibilités de protéines pour une même séquence -repérer exons / introns Séquence nucléotidique Séquence polypeptidique Traduction

8 Initiation à la bioinformatique – 20 mars 2013 La bioinformatique. Pourquoi ? La bioinformatique a différents objectifs et différentes applications : 4-Fournir des outils de prédiction Objectifs : -repérer un opéron -repérer un gène ou une protéine anormale -prévoir la structure 3D dune protéine -repérer des mutations -prédire une pathologie… Prédiction physiologique et fonctionnelle Prédiction expérimentale Objectifs : -repérer des sites de restriction -prévoir la digestion dun nucléotide -prévoir / simuler la migration de fragments nucléotidiques ou protéiques lors dune électrophorèse…

9 Initiation à la bioinformatique – 20 mars 2013 La bioinformatique. Pourquoi ? Séquence nucléotidique GèneProtéine Fonction biochimique Activité biologique Analyse de séquences Prédiction / simulation expérimentale Biologie in silico

10 Initiation à la bioinformatique – 20 mars 2013 La bioinformatique. Quelques repères historiques…

11 Initiation à la bioinformatique – 20 mars 2013 Quelques repères historiques… Années 80 : - Début de la micro-informatique - Création des premières bases de données (GENBANK) Années 90 : - Développement de linternet et des réseaux - Apparition des logiciels de comparaison de séquences (FASTA, BLAST) Années 2000 : -Consultation libre en ligne des bases de données -Mutualisation des données avec les projets de séquençages de génomes

12 Initiation à la bioinformatique – 20 mars 2013 Les bases de données Le cœur de la bioinformatique…

13 Initiation à la bioinformatique – 20 mars 2013 Les bases de données Différentes catégories de bases de données : Bases de données bioinformatiques Bases généralistes -banque N -banque P Bases spécialisées Banques génomiques Banques fonctionnelles : -transcriptome -protéome -métabolome… Difficultés !! -Harmoniser le classement des informations -Utiliser un langage commun pour échanger des informations entre toutes ces bases

14 Initiation à la bioinformatique – 20 mars 2013 Les bases de données Harmonisation des fiches de données Exemple de la fiche GENBANK dun plasmide dE.faecalis

15 Initiation à la bioinformatique – 20 mars 2013 Les bases de données Harmonisation des fiches de données Suite de la fiche GENBANK dun plasmide dE.faecalis

16 Initiation à la bioinformatique – 20 mars 2013 Les bases de données Harmonisation des fiches de données Fin de la fiche GENBANK dun plasmide dE.faecalis

17 Initiation à la bioinformatique – 20 mars 2013 Les bases de données Harmonisation des fiches de données En résumé, une fiche comporte de nombreuses informations : LocusIdentificateur (nom et taille de la séquence) DefinitionDescription de la séquence Accession / versionNuméro daccès dans la base Keyword / Source / Organism / Reference / Authors / Title / Journal Informations diverses (taxonomie, publications…) FeaturesCaractéristiques de la séquence / produits dexpression OriginSéquence (par blocs de caractères / par lignes) //Fin de lentrée dans la base

18 Initiation à la bioinformatique – 20 mars 2013 Les bases de données Format commun de manipulation des données : le format FASTA (Fast – alignment) Objectif : manipuler facilement des séquences dans les bases de données, à laide dun format universel, compatibles avec les traitements de texte (sous forme de fichier texte), ou par copier – coller. Exemple de la fiche précédente du plasmide dE.faecalis en format FASTA :

19 Initiation à la bioinformatique – 20 mars 2013 Les bases de données Remarques : -Les bases nucléotidiques ne référencient que des monobrins dADN (même si la séquence soumise est de lADN bicaténaire ou de lARN) la séquence est toujours dans le sens 5P – 3OH -Les séquences nucléotidiques selon le degré de précision de lenregistrement seront écrites le plus souvent avec A,T, C et G et/ou avec R,Y (base puRique A et G / base pYrimidique C et T) et/ou K,M (base Keto G et T / base aMino A et C). -Les bases protéiques sont référencées : avec la séquence dans le sens N vers C terminal avec le symboles dacides aminés à 1 lettre Format commun de manipulation des données : le format FASTA (Fast – alignment)

20 Initiation à la bioinformatique – 20 mars 2013 Principe de la comparaison de séquences La comparaison de séquences est loutil central en bioinformatique : Repose sur des calculs matriciels ou des algorithmes complexes qui rendent des résultats sous forme de données statistiques (% match, score, e-value…) Logiciel dalignement le plus connu = BLAST (Basic Local Alignment Search Tool) Alignement de séquences Score de similitude Degré dhomologie Identification, prédiction de structure de propriétés, de fonction Démarche globale :

21 Initiation à la bioinformatique – 20 mars 2013 Principe de la comparaison de séquences Principe du calcul des scores dalignement : Séquence de référence : AAA TTT GGG CCC Score dalignement = Somme des scores individuels (avec identité (match) = +2, non identité = -1 et gap -8) Séquence 1 à analyser : AAA CCC GGG CCC Séquence 2 à analyser : AAA TTT CCC Alignement : AAA TTT GGG CCC AAA CCC GGG CCC Alignement : AAA TTT GGG CCC AAA TTT CCC Score de la séquence 1: = 15 Score de la séquence 2: = 10 Non identité (mismatch) Non correspondance (gap) Exemple :

22 Initiation à la bioinformatique – 20 mars 2013 Principe de la comparaison de séquences Principe du calcul des scores dalignement : En pratique, plus le score dalignement est élevé, plus les séquences sont similaires et présenteront des propriétés et des fonctions proches. plus de 70% de similarité permettent daffirmer quil y a homologie

23 Initiation à la bioinformatique – 20 mars 2013 Ou trouver les outils de bioinformatique ?

24 Initiation à la bioinformatique – 20 mars 2013 Où trouver les outils de bioinformatique ? Outils indépendants, autonomes, en accès libre via internet (soit à utiliser en ligne, soit à télécharger sous forme dinstalleurs). on les recherche par lintermédiaire dun moteur de recherche Portails de bioinformatiques, fonctionnant en ligne, et comportant plusieurs outils en accès libre ou payant. Exemples : - EBI (European Bioinformatics Institute) - NCBI (National Center for Biotechnology Information)

25 Initiation à la bioinformatique – 20 mars 2013 Où trouver les outils de bioinformatique ? Le portail EBI

26 Initiation à la bioinformatique – 20 mars 2013 Où trouver les outils de bioinformatique ? Le portail NCBI

27 Initiation à la bioinformatique – 20 mars 2013 Où trouver les outils de bioinformatique ? Le logiciel BLAST accessible depuis le portail

28 Initiation à la bioinformatique – 20 mars 2013 La bioinformatique. Pour quelles applications en STL ?

29 Initiation à la bioinformatique – 20 mars 2013 Applications en STL ? Recherche de données bibliographiques Alignement dune séquence inconnue pour identification Analyse dune séquence à la recherche de zones fonctionnelles Calcul de Tm, recherche damorces, simulation délectrophorèse Etude des propriétés physico-chimiques dune protéine Modélisation tridimensionnelle

30 Initiation à la bioinformatique – 20 mars 2013 Exemple de scénario pédagogique Cas de toxi-infection : présence récurrente dune protéine inconnue dans un aliment surgelé !! Identification après alignement avec une base de données Le gène correspondant à la protéine est-il connu ? Digestion de lADN par des enzymes de restriction et simulation de séparation par électrophorèse On dispose du matériel pour réaliser la PCR, on veux maintenant, isoler le gène dintérêt par électrophorèse Traduction protéine nucléotide Le gène est retrouvé chez un taxon connu : on souhaite mettre en place une PCR afin de détecter la souche productrice dans laliment Prévision des amorces nécessaires

31 Initiation à la bioinformatique Formation biologie moléculaire / bioinformatique Mercredi 20 mars 2013


Télécharger ppt "Initiation à la bioinformatique Formation biologie moléculaire / bioinformatique Mercredi 20 mars 2013."

Présentations similaires


Annonces Google