La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Institut Suisse de Bioinformatique Groupe Swiss-Prot novembre 2006.

Présentations similaires


Présentation au sujet: "Institut Suisse de Bioinformatique Groupe Swiss-Prot novembre 2006."— Transcription de la présentation:

1 Institut Suisse de Bioinformatique Groupe Swiss-Prot novembre 2006

2 Un des changements important Nouvelles technologies: -> arrivée de données biologiques en masse -> utilisation de linformatique pour le stockage et lanalyse de données biologiques. Rôle important joué par la bioinformatique

3 La bioinformatique, cest quoi ? Lutilisation de linformatique pour lanalyse de données biologiques.

4 Bioinformatique Surtout: –Biologie + Informatique –Biochimie + Informatique Mais aussi… –Médecine + Informatique –Pharmacie + Informatique –Chimie + Informatique –Mathématique + Informatique –Statistique + Informatique Cest un domaine pluridisciplinaire!

5 Bioinformatique Surtout: –Biologie + Informatique –Biochimie + Informatique Pourquoi faire ?

6 Acquérir puis stocker les informations biologiques sous la forme dencyclopédies appelées bases de données; Encyclopédies informatisées

7 Exemples de données biologiques qui ne peuvent plus être gérées sans laide de linformatique: - Séquences: ADN (génomes), ARN, protéines - Structures 3D: ADN, ARN, protéines, sucres… - Classification des espèces - Voies métaboliques - Expression des gènes (microarrays) - Spectrométrie de masse - Publications scientifiques … Beaucoup de omics, mais… !

8

9 Acquérir puis stocker les informations biologiques sous la forme dencyclopédies appelées bases de données; Développer des programmes de prédiction et danalyse en utilisant les informations contenues dans les bases de données; Analyser/Interpréter/Prédire: utiliser ces programmes pour analyser de nouvelles données biologiques et prédire in silico par exemple la fonction potentielle dune protéine;

10 Conclucion dune analyse in silico dune protéine inconnue Poids moléculaire: 126 kD; Fonction: ATPase potentielle; Localisation subcellulaire: Membrane plasmique. Transmembranaire (~10 hélices); N terminal: intracellulaire; C terminal: intracellulaire PTM: Phosphorylée Ça me semble bio- logique …mais reste à le prouver !

11 Acquérir puis stocker les informations biologiques sous la forme dencyclopédies appelées bases de données; Visualiser: développer des programmes pour visualiser la structure en trois dimensions des protéines et de lADN, pour shématiser des voies métaboliques ou des arbres phylogénétiques. Développer des programmes de prédiction et danalyse en utilisant les informations contenues dans les bases de données; Analyser/Interpréter/Prédire: utiliser ces programmes pour analyser de nouvelles données biologiques et prédire in silico par exemple la fonction potentielle dune protéine;

12 Exemple dun dendrogramme obtenu à partir dun résultat de CLUSTALW à laide du programme « phylodendron » Dendogramme Le Dodo et le poulet ont un ancêtre commun ! Le Mammouth et léléphant ont un ancêtre commun ! 9 Arbre obtenu avec le cytochrome B (phylophilo)

13 HIV: exemple dapplication de la bioinformatique 1984: identification du virus;

14 HIV: exemple dapplication de la bioinformatique 1984: identification du virus; 1985: séquençage du génome de HIV-1 ; (4 laboratoires dont Montagnier/France et Gallo (USA) (??))

15 HIV: exemple dapplication de la bioinformatique 1984: identification du virus; 1985: séquençage du génome de HIV-1 ; (4 laboratoires dont Montagnier/France et Gallo (USA) (??)) : caractérisation des protéines; 1989: structure X-ray de la protéase;

16 HIV: exemple dapplication de la bioinformatique 1984: identification du virus; 1985: séquençage du génome de HIV-1 ; (4 laboratoires dont Montagnier/France et Gallo (USA) (??)) : caractérisation des protéines; 1989: structure X-ray de la protéase; 1990: premiers inhibiteurs modélisés à partir de la structure 3D de la protéase

17 HIV: exemple dapplication de la bioinformatique 1984: identification du virus; 1985: séquençage du génome de HIV-1 ; (4 laboratoires dont Montagnier/France et Gallo (USA) (??)) : caractérisation des protéines; 1989: structure X-ray de la protéase; 1990: premiers inhibiteurs modélisés à partir de la structure 3D de la protéase Novembre 1995: premier médicament (Invirase) approuvé par la FDA (trithérapie).

18 Structure 3D de la protease de HIV

19 Structure 3D de la protease de HIV + inhibiteur

20 Quelques remarques 1.Il nexiste pas une banque centrale qui contient toutes les infos: il est toujours nécessaire de grapiller les infos dans différentes banques.

21 Quelques remarques 1.Il nexiste pas une banque centrale qui contient toutes les infos: il est toujours nécessaire de grapiller les infos dans différentes banques. 2. Les données s'accroissent quotidiennement (il y a en moyenne un nouveau génome séquencé toutes les semaines) et sont continuellement remises à jour: le résultats de vos requêtes peut donc être différent d'un jour à l'autre (contenu, liens ou look) !

22 -> -> 3. Beaucoup de chercheurs travaillent sur le même sujet -> un gène, plusieurs séquences -> redondance. Ces séquences peuvent être différentes (erreurs de séquençage ou mutations, longueurs variables).

23 -> -> 3. Beaucoup de chercheurs travaillent sur le même sujet -> un gène, plusieurs séquences -> redondance. Ces séquences peuvent être différentes (erreurs de séquençage ou mutations, longueurs variables). 4. Importance du numéro daccession: identificateur dune information biologique (1 séquence, 1 spot sur un gel, 1 structure 3D…)

24 -> -> 3. Beaucoup de chercheurs travaillent sur le même sujet -> un gène, plusieurs séquences -> redondance. Ces séquences peuvent être différentes (erreurs de séquençage ou mutations, longueurs variables). 4. Importance du numéro daccession: identificateur dune information biologique (1 séquence, 1 spot sur un gel, 1 structure 3D…) -> 5. Les banques de données sont liées entre elles (links, cross-références -> réseau). Ces liens ne sont pas toujours bidirectionnels !

25 -> -> 3. Beaucoup de chercheurs travaillent sur le même sujet -> un gène, plusieurs séquences -> redondance. Ces séquences peuvent être différentes (erreurs de séquençage ou mutations, longueurs variables). 4. Importance du numéro daccession: identificateur dune information biologique (1 séquence, 1 spot sur un gel, 1 structure 3D…) -> 5. Les banques de données sont liées entre elles (links, cross-références -> réseau). Ces liens ne sont pas toujours bidirectionnels ! 6. Les banques de données contiennent des erreurs !

26 Conclusions Extraordinaire potentiel de la bioinformatique… mais ne elle ne remplace(ra) pas les expériences «wet lab» génomiques, protéomiques et autres, ni lesprit critique humain (contexte bio-logique) ! La bioinfo fournit des outils performants aux biologistes… Les données expérimentales des biologistes permettent daméliorer les programmes bioinformatiques (prédiction)…

27

28

29 Génomique Mise en place des techniques danalyse de lexpression des gènes Mise à la disposition des chercheurs dune plateforme génomique Patrick Descombes Biomedical Proteomics Research Group (BPRG) Plateforme Génomique Frontiers in Genetics Centre Médical Universitaire (CMU)

30 Jean-Charles Sanchez Biomedical Proteomics Research Group (BPRG) Department of Structural Biology and Bioinformatics Centre Médical Universitaire (CMU) Pionnier de la protéomique (depuis 1989) Mise en place des techniques danalyse des protéines Mise à la disposition des chercheurs dune plateforme protéomique Recherche de biomarqueurs (AVC et diabète)

31 Pionnier de la bioinformatique Programmes danalyse in silico des protéines Créateur de la banque de données Swiss-Prot Intéressé par lexobiologie Amos Bairoch Groupe Swiss-Prot Centre Médical Universitaire (CMU)

32

33 Bioinformatique - application 1: acquisition de données Exemples: lecture dimages de gels 2D, spectrométrie de masse (MS), séquençage ADN... Détection de signaux ou dimages Absence de contexte biologique.

34 Séquençage dADN Informatique instrumentale Programme pour analyser les données dun séquenceur ADN Exemple: pregap4 de Rodger Staden https://sourceforge.net/projects/staden.

35 Bioinformatique - application 2: Analyse de séquences ADN Détection des régions codantes; Recherche de similarité (BLAST) Analyse des sites de restriction (enzymes); Traduction ADN en protéine; Détection de séquences « répétées » comme les microsatellites, minisatellites, Alu repeats, etc.; Détection de régions ADN importantes non-codantes comme les signaux de transcription (promoteur), origines de la réplication, etc.; Détection de séquences de tARN et autres types de ARN (exemples: rARN, uARN, tmARN).

36 Une séquence ADN de C.elegans) (~25000 bp) …

37 Schéma récapitulatif 3 5 Genebuilder prédiction EST => cDNA ADN génomique exons14 Splicing / Epissage « in silico » mARN mature

38 Des cas moins idéaux… Ex: Chromosome 21

39 Bioinformatique- application 3: analyse de la séquence primaire des protéines Caractérisation physicochimique Prédiction de la localisation subcellulaire (signal séquences, transit peptides); Recherche de régions transmembranaires; Recherche des régions fonctionnelles (domaines conservés) Recherche de sites de modifications post- traductionelles (PTM). Recherche de régions antigéniques; Recherche de régions dont la composition est biaisée (low complexity sequences);

40 Mettre en relation 2 séquences en comparant les acides aminés à chaque position et en tenant compte de leur probabilité de mutation au cours de lévolution; Bioinformatique - application 4: comparaison de séquences MY-TAIL--ORIS-RICH- #x #### x#x# #### MONTAILLEURESTRICHE (algorithme pour comparer des chants doiseaux)

41 by Sebastian Böcker

42 Bioinformatique - application 5: phylogénétique Reconstruction de lévolution des espèces; Reconstruction de lévolution moléculaire des familles de protéines; Reconstruction de lévolution des chemins métaboliques.

43 Bioinformatique - application 6 analyse de la structure secondaire & modélisation des protéines Séquence dune protéine Structure dune protéine ? MSTNNYQTLSQNKADRMGPGGSRRPRNSQHATASTPSASSCKEQQKDVEH EFDIIAYKTTFWRTFFFYALSFGTCGIFRLFLHWFPKRLIQFRGKRCSVE NADLVLVVDNHNRYDICNVYYRNKSGTDHTVVANTDGNLAELDELRWFKY RKLQYTWIDGEWSTPSRAYSHVTPENLASSAPTTGLKADDVALRRTYFGP NVMPVKLSPFYELVYKEVLSPFYIFQAISVTVWYIDDYVWYAALIIVMSL YSVIMTLRQTRSQQRRLQSMVVEHDEVQVIRENGRVLTLDSSEIVPGDVL VIPPQGCMMYCDAVLLNGTCIVNESMLTGESIPITKSAISDDGHEKIFSI DKHGKNIIFNGTKVLQTKYYKGQNVKALVIRTAYSTTKGQLIRAIMYPKP ADFKFFRELMKFIGVLAIVAFFGFMYTSFILFYRGSSIGKIIIRALDLVT IVVPPALPAVMGIGIFYAQRRLRQKSIYCISPTTINTCGAIDVVCFDKTG TLTEDGLDFYALRVVNDAKIGDNIVQIAANDSCQNVVRAIATCHTLSKIN NELHGDPLDVIMFEQTGYSLEEDDSESHESIESIQPILIRPPKDSSLPDC

44 Avant … Après …


Télécharger ppt "Institut Suisse de Bioinformatique Groupe Swiss-Prot novembre 2006."

Présentations similaires


Annonces Google