La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Protein Data Bank La banque de données sur les protéines du Research Collaboratory for Structural Bioinformatics, plus communément appelée Protein Data.

Présentations similaires


Présentation au sujet: "Protein Data Bank La banque de données sur les protéines du Research Collaboratory for Structural Bioinformatics, plus communément appelée Protein Data."— Transcription de la présentation:

1 Protein Data Bank La banque de données sur les protéines du Research Collaboratory for Structural Bioinformatics, plus communément appelée Protein Data Bank ou PDB est une collection mondiale de données sur la structure tridimensionnelle (ou structure 3D) de macromolécules biologiques : protéines , essentiellement acides nucléiques. Ces structures sont essentiellement déterminées par: cristallographie aux rayons X ou spectroscopie RMN Ces données expérimentales sont déposées dans la PDB par des biologistes et des biochimistes du monde entier et appartiennent au domaine public. Leur consultation est gratuite et peut se faire directement depuis le site web [1] de la banque. La PDB est la principale source de données de biologie structurale et permet en particulier d’accéder à des structures 3D de protéines d’intérêt pharmaceutique. D'après Wikipédia, l'encyclopédie libre

2 Historique: les années 60
Début de la structure 3D 1ère structure 3D: prix Nobel pour myoglobine et l'hémoglobine The Nobel Prize in Chemistry 1962 "for their studies of the structures of globular proteins" Max Ferdinand Perutz John Cowdery Kendrew

3 Historique: les années 60
Début de la structure 3D 1937 Max Perutz performed some experiments in Cambridge to find out whether it might be possible to determine the structure of haemoglobin by X-ray diffraction 1947 John Kendrew joined Perutz' research group, Perutz succeeded in incorporating heavy atoms, namely those of mercury, into definite positions in the haemoglobin molecule 1953 1957 production of a three-dimensional model of myoglobin at 6Å resolution 1960 an almost complete structure of myoglobin at 2.0 Å resolution

4 Historique: les années 60
an almost complete structure at 2.0 Å resolution production of a three-dimensional model of myoglobin at 6Å resolution

5 Historique: les années 60
Représentation 3D John Kendrew with his model of myoglobin in 1959. Photograph from Max Perutz

6 Historique: les années 60
Repliement des protéines: Expérience d'Anfinsen Nobel Prize in Chemistry 1972 "for his work on ribonuclease, especially concerning the connection between the amino acid sequence and the biologically active conformation"

7 Historique: les années 70
Fondée par le Laboratoire national de Brookhaven, La PDB contient à l’origine 7 structures 1971 1975 financement assuré par la National Science Foundation 32 structures 1977 Bernstein FC, Koetzle TF, Williams GJ, Meyer Jr EF, Brice MD, Rodgers JR, Kennard O, Shimanouchi T, Tasumi M. The Protein Data Bank: a computer-based archival file for macromolecular structures. J Mol Biol 1977; 112: PMID 1979 environ 120 structures

8 Historique: les années 80
Décollage technologique Biologie moléculaire Informatique (matériel et logiciel) instrumentation Promouvoir le partage des données Parution des normes ("guidelines") IUCr pour les données destinées à la PDB

9 Historique: les années 90
Dépôt des données Double publication (la majorité des journaux demandent un code PDB) Une agence de financement, le NIST, exigeait le dépôt de toutes les données structurales. Diffusion La PDB est également devenu accessible par le réseau Internet Communauté d'utilisateurs augmente Biologie structurale Nombre de structures augmente exponentiellement Apparition de nouvelles banques de données Stockage des données Création du format mmCIF

10 Historique: les années 90
en 1998 Transfert au Research Collaboratory for Structural Bioinformatics (RCSB): de l'Université de Rutgers, de l'Université du Wisconsin à Madison, du National Institute of Standards and Technology (NIST) et du "San Diego Supercomputer Center". Le financement est assuré par la National Science Foundation, le Department of Energy, la National Library of Medicine et le National Institute of General Medical Sciences. Autres organismes traitant les données structurales L’European Bioinformatics Institute, (EBI), au Royaume-Uni [banque MSD] L' Institute for Protein Research, au Japon [banque PDBj]

11 création de la Worlwide Protein Data Bank (wwPDB)
Historique: les années 2000 En 2003 création de la Worlwide Protein Data Bank (wwPDB) Trois organisations membres RCSB (USA), MSD-EBI (Macromolecular Structure Database - EBI, Europe) PDBj (Protein Data Bank Japan, Japon). Rôles centres de dépôt centres de traitement centres de distribution des données de la PDB. Mission de la wwPDB maintenir à jour une archive PDB unique de données structurales macromoléculaires, accessible gratuitement et publiquement pour l’ensemble de la communauté.

12 Historique: les années 2000

13 Historique: les années 2000
Avènement génomique structurale compréhension structure/fonction programmes de détermination de structures de tous les génomes Progrès technologiques Grosses structures résolues : Ribosome Virus Création d'un volet Microscopie électronique dans la PDB banque EMDB

14 Contenu La PDB contient, au 01/05/2006, 36247 structures.
Format des données - Fichiers plats depuis l’origine au format pdb, et sont depuis quelques années également au format mmCif, spécifiquement développé pour les données structurales de la PDB. en préparation PDBML, XML pour PDB à 3000 structures sont ajoutées chaque année. - La banque contient des fichiers pour chaque modèle moléculaire. - Ces fichiers décrivent la localisation exacte de chaque atome de la macromolécule étudiée, c'est-à-dire les coordonnées cartésiennes de l’atome dans un repère à trois dimensions.

15

16 Format PDB Annotations Coordonnées 3D

17 Format PDB: présentation générale
HEADER HORMONE SEP ZNI TITLE INSULIN COMPND MOL_ID: 1; COMPND 2 MOLECULE: INSULIN; COMPND 3 CHAIN: A, B, C, D COMPND 4 BIOLOGICAL_UNIT: HETERODIMER; SOURCE MOL_ID: 1; SOURCE 2 ORGANISM_SCIENTIFIC: SUS SCROFA; SOURCE 3 ORGANISM_COMMON: PORCINE KEYWDS HORMONE, GLUCOSE METABOLISM EXPDTA X-RAY DIFFRACTION AUTHOR M.G.W.TURKENBURG,J.L.WHITTINGHAM,G.G.DODSON,E.J.DODSON, AUTHOR 2 B.XIAO,G.A.BENTLEY REVDAT JAN-98 1ZNI 0 JRNL AUTH G.BENTLEY,E.DODSON,G.DODSON,D.HODGKIN,D.MERCOLA JRNL TITL STRUCTURE OF INSULIN IN 4-ZINC INSULIN JRNL REF NATURE V JRNL REFN ASTM NATUAS UK ISSN

18 Format PDB: remarques REMARK 1 REMARK 1 REFERENCE 1
REMARK 1 AUTH G.D.SMITH,G.G.DODSON REMARK 1 TITL THE STRUCTURE OF A RHOMBOHEDRAL R6 INSULIN HEXAMER REMARK 1 TITL 2 THAT BINDS PHENOL REMARK 1 REF BIOPOLYMERS V REMARK 1 REFN ASTM BIPMAA US ISSN REMARK 1 REFERENCE 8 REMARK 1 AUTH G.BENTLEY,G.DODSON,A.LEWITOVA REMARK 1 TITL RHOMBOHEDRAL INSULIN CRYSTAL TRANSFORMATION REMARK 1 REF J.MOL.BIOL V REMARK 1 REFN ASTM JMOBAK UK ISSN REMARK 2 REMARK 2 RESOLUTION ANGSTROMS. REMARK 3 REMARK 3 REFINEMENT. REMARK 4 REMARK 4 1ZNI COMPLIES WITH FORMAT V. 2.2, 16-DEC-1996 REMARK 6 REMARK 6 SOLVENT MOLECULES ARE INCLUDED IN THE REFINEMENT REMARK 7 REMARK 7 IN 2ZN INSULIN (ENTRY 4INS) THE FOLLOWING APPLIES: REMARK 8 REMARK 8 ENTRY 4INS WILL BE UPDATED TO BE CONSISTENT WITH THE NEW REMARK 10 SOME RESIDUES ARE APPARENTLY DISORDERED AND CERTAINLY REMARK 11 REMARK 200 REMARK 200 EXPERIMENTAL DETAILS REMARK 500 REMARK 500 GEOMETRY AND STEREOCHEMISTRY REMARK 999 1ZNI D SWS P NOT IN ATOMS LIST

19 Format PDB: Géométrie, struct II
DBREF 1ZNI A SWS P INS_PIG DBREF 1ZNI B SWS P INS_PIG DBREF 1ZNI C SWS P INS_PIG DBREF 1ZNI D SWS P INS_PIG SEQRES 1 A GLY ILE VAL GLU GLN CYS CYS THR SER ILE CYS SER LEU SEQRES 2 A TYR GLN LEU GLU ASN TYR CYS ASN SEQRES 3 B THR PRO LYS ALA SEQRES 1 C GLY ILE VAL GLU GLN CYS CYS THR SER ILE CYS SER LEU HET ZN HET ZN HET ZN HET CL HET CL HET CL HETNAM ZN ZINC ION HETNAM CL CHLORIDE ION FORMUL ZN 3(ZN1 2+) FORMUL CL 3(CL1 1-) FORMUL 7 HOH *103(H2 O1) HELIX ILE A CYS A SHEET A 2 PHE B 24 TYR B TURN B1 CYS B 19 ARG B 22 SSBOND 1 CYS A CYS A 11 LINK ZN ZN NE2 HIS D 10 LINK ZN ZN NE2BHIS B 10 LINK ZN ZN CL CL 4 LINK ZN ZN NE2AHIS B 10 CRYST H ORIGX ORIGX ORIGX SCALE SCALE SCALE MTRIX MTRIX MTRIX

20 structures II MULTISTRAND SHEET PARALLEL/ANTIPARALLEL
SHEET S1 5 GLN ASP TLN 185 SHEET S1 5 ILE ASP N ILE O ASP TLN 186 SHEET S1 5 ILE TYR N SER O PHE TLN 187 SHEET S1 5 GLU TYR N TYR O SER TLN 188 SHEET S1 5 ASN TRP N PHE O VAL TLN 189 SHEET S2 5 GLY LEU TLN 190 SHEET S2 5 ILE ASP N ASP O SER TLN 191 SHEET S2 5 ILE TYR N SER O PHE TLN 192 SHEET S2 5 GLU TYR N TYR O SER TLN 193 SHEET S2 5 ASN TRP N PHE O VAL TLN 194 SHEET S3 5 TRP ASP TLN 195 SHEET S3 5 TYR TYR O TYR N ASP TLN 196 SHEET S3 5 ASP SER O THR N TYR TLN 197 SHEET S3 5 THR ARG O THR N THR TLN 198 SHEET S3 5 GLN PHE O VAL N PHE TLN 199

21 Format PDB: Atomes ATOM 20 N GLU A 4 -6.621 12.553 14.777 1.00 40.46 N
ATOM CA GLU A C ATOM C GLU A C ATOM O GLU A O ATOM CB GLU A C ATOM CG GLU A C ATOM CD GLU A C ATOM OE1 GLU A O ATOM OE2 GLU A O ATOM N GLN A N ATOM CA GLN A C ATOM C GLN A C ATOM O GLN A O ATOM CB GLN A C ATOM CG GLN A C ATOM CD GLN A C ATOM OE1 GLN A O ATOM NE2 GLN A N

22 Format PDB Record Format COLUMNS DATA TYPE FIELD DEFINITION
Record name "ATOM " Integer serial Atom serial number. Atom name Atom name. Character altLoc Alternate location indicator. Residue name resName Residue name. Character chainID Chain identifier. Integer resSeq Residue sequence number. AChar iCode Code for insertion of residues. Real(8.3) x Orthogonal coordinates for X in Angstroms. Real(8.3) y Orthogonal coordinates for Y in Real(8.3) z Orthogonal coordinates for Z in Real(6.2) occupancy Occupancy. Real(6.2) tempFactor Temperature factor. LString(4) segID Segment identifier, left-justified. LString(2) element Element symbol, right-justified. LString(2) charge Charge on the atom.

23 Format PDB: Hétéroatomes... et fin.
HETATM O HOH O HETATM O HOH O HETATM O HOH O HETATM O HOH O HETATM O HOH O HETATM O HOH O HETATM O HOH O HETATM O HOH O HETATM O HOH O HETATM O HOH O CONECT CONECT CONECT MASTER END

24 Format mmCIF devient : HEADER PLANT SEED PROTEIN 11-OCT-91 1CBN
_struct.entry_id '1CBN' _struct.title 'PLANT SEED PROTEIN' _struct_keywords.entry_id '1CBN' _struct_keywords.text 'plant seed protein' _database_2.database_id 'PDB' _database_2.database_code '1CBN' _database_PDB_rev.rev_num 1 _database_PDB_rev.date_original ' ' appariement nom-valeur est la différence majeure par rapport au format pdb. Il présente l’avantage de fournir une référence explicite pour chaque élément des données du fichier, plutôt que de librement laisser l’interprétation au programme qui lit le fichier.

25 Protein Data Bank Markup Language (PDBML)
Traduction du format mmCIF <?xml version="1.0" encoding="UTF-8" ?> <PDBx:datablock datablockName="1ZNI" xmlns:PDBx=" xmlns:xsi=" xsi:schemaLocation=" pdbx.xsd"> <PDBx:audit_authorCategory> <PDBx:audit_author name="Turkenburg, M.G.W."></PDBx:audit_author> <PDBx:audit_author name="Whittingham, J.L."></PDBx:audit_author> <PDBx:audit_author name="Dodson, G.G."></PDBx:audit_author> <PDBx:audit_author name="Dodson, E.J."></PDBx:audit_author> <PDBx:audit_author name="Xiao, B."></PDBx:audit_author> <PDBx:audit_author name="Bentley, G.A."></PDBx:audit_author> </PDBx:audit_authorCategory>


Télécharger ppt "Protein Data Bank La banque de données sur les protéines du Research Collaboratory for Structural Bioinformatics, plus communément appelée Protein Data."

Présentations similaires


Annonces Google