II. Détermination de la structure tridimensionnelle Chapitre 1 – Structure des protéines Chapitre 2 – Le repliement des protéines Chapitre 3 – Détermination de la structure des macromolécules biologiques I. Détermination de la structure secondaire I.1. Méthodes expérimentales I.1 – 1. Spectroscopie Infrarouge I.1 – 2. Spectroscopie Raman I.2. Méthodes prédictives I.2 – 1. Analyse des clusters hydrophobes I.2 – 2. Méthodes « automatiques » II. Détermination de la structure tridimensionnelle
Méthodes expérimentales : Obtention de coordonnées atomiques Cristallographie et diffraction des rayons X Spectroscopie de résonance magnétique
Méthodes expérimentales : Obtention de coordonnées atomiques Cristallographie et diffraction des rayons X Spectroscopie de résonance magnétique
Résumé Xtallo Atomes d'hydrogènes absents
Avantages et inconvénients Xtallo Image 3D Pas de limite de taille Protéines fonctionnelles Méthode éprouvée (1960) Plus de 33000 structures résolues (PDB 2005) Inconvénients Système moléculaire " figé " (cristal) Zones trop variables invisibles Pureté et quantité des échantillons Travail à basses températures Cristallisation empirique Résolution du problème de phase Méthode relativement longue
Méthodes expérimentales : Obtention de coordonnées atomiques Cristallographie et diffraction des rayons X Spectroscopie de résonance magnétique
Etude des protéines par RMN #----------------------------------------------------------- # Upper limit restraints of HIV-1 Nucleocapsid Protein bound # to SL3 RNA Recognition Element # NOE restraints for N-terminal 3-10 Helix # Hydrogen Bonds 3 LYS O 6 PHE HN 2.00 1.00E+00 3 LYS O 6 PHE N 3.00 1.00E+00 4 GLY O 7 ARG HN 2.00 1.00E+00 4 GLY O 7 ARG N 3.00 1.00E+00 5 ASN O 8 ASN HN 2.00 1.00E+00 5 ASN O 8 ASN N 3.00 1.00E+00 6 PHE O 9 GLN HN 2.00 1.00E+00 6 PHE O 9 GLN N 3.00 1.00E+00 7 ARG O 10 ARG HN 2.00 1.00E+00 7 ARG O 10 ARG N 3.00 1.00E+00 8 ASN O 11 LYS HN 2.00 1.00E+00 8 ASN O 11 LYS N 3.00 1.00E+00 # HN(i)-HN(i+1) 3 LYS HN 4 GLY HN 2.70 1.00E+00 4 GLY HN 5 ASN HN 2.70 1.00E+00 5 ASN HN 6 PHE HN 2.70 1.00E+00 6 PHE HN 7 ARG HN 2.70 1.00E+00 7 ARG HN 8 ASN HN 2.70 1.00E+00 8 ASN HN 9 GLN HN 2.70 1.00E+00 9 GLN HN 10 ARG HN 2.70 1.00E+00 10 ARG HN 11 LYS HN 2.70 1.00E+00 11 LYS HN 12 THR HN 2.70 1.00E+00 # HA(i)-HN(i+2) 4 GLY HA1 6 PHE HN 5.00 1.00E+00 5 ASN HA 7 ARG HN 5.00 1.00E+00 6 PHE HA 8 ASN HN 5.00 1.00E+00 7 ARG HA 9 GLN HN 5.00 1.00E+00 8 ASN HA 10 ARG HN 5.00 1.00E+00 Séquence primaire nécessaire + « contraintes » obtenues par l'analyse des spectres RMN
Etude des protéines par RMN #----------------------------------------------------------- # Upper limit restraints of HIV-1 Nucleocapsid Protein bound # to SL3 RNA Recognition Element # NOE restraints for N-terminal 3-10 Helix # Hydrogen Bonds 3 LYS O 6 PHE HN 2.00 1.00E+00 3 LYS O 6 PHE N 3.00 1.00E+00 4 GLY O 7 ARG HN 2.00 1.00E+00 4 GLY O 7 ARG N 3.00 1.00E+00 5 ASN O 8 ASN HN 2.00 1.00E+00 5 ASN O 8 ASN N 3.00 1.00E+00 6 PHE O 9 GLN HN 2.00 1.00E+00 6 PHE O 9 GLN N 3.00 1.00E+00 7 ARG O 10 ARG HN 2.00 1.00E+00 7 ARG O 10 ARG N 3.00 1.00E+00 8 ASN O 11 LYS HN 2.00 1.00E+00 8 ASN O 11 LYS N 3.00 1.00E+00 # HN(i)-HN(i+1) 3 LYS HN 4 GLY HN 2.70 1.00E+00 4 GLY HN 5 ASN HN 2.70 1.00E+00 5 ASN HN 6 PHE HN 2.70 1.00E+00 6 PHE HN 7 ARG HN 2.70 1.00E+00 7 ARG HN 8 ASN HN 2.70 1.00E+00 8 ASN HN 9 GLN HN 2.70 1.00E+00 9 GLN HN 10 ARG HN 2.70 1.00E+00 10 ARG HN 11 LYS HN 2.70 1.00E+00 11 LYS HN 12 THR HN 2.70 1.00E+00 # HA(i)-HN(i+2) 4 GLY HA1 6 PHE HN 5.00 1.00E+00 5 ASN HA 7 ARG HN 5.00 1.00E+00 6 PHE HA 8 ASN HN 5.00 1.00E+00 7 ARG HA 9 GLN HN 5.00 1.00E+00 8 ASN HA 10 ARG HN 5.00 1.00E+00 => logiciels de modélisation + « oeil » de l'expert !!! => ~ 200 structures différentes à regrouper en famille => ~ 20 familles dont est choisi un représentant (le plus proche de la structure moyenne de la famille)
Etude des protéines par RMN Structure de la protéine de nucléocapside de HIV-1 liée à l ’élément de reconnaissance SL3 PSI-RNA. RMN 25 structures Code PDB 1A1T
Avantages et inconvénients Protéines en solution Informations des zones très flexibles Inconvénients Limitation en taille de la molécule ( 300 AA au maximum, généralement 100 AA) Pureté et quantité des échantillons Attribution des spectres (parfois longue et difficile)
Avantages et limites des 2 méthodes expérimentales Methodes expérimentales !!! Limites Matériel important et cher Synchrotron pour hautes résolution Xtallo Champs magnétiques de haute intensité pour RMN Grande quantité de l’échantillon (10aine de mg) en RMN Pureté de l’échantillon Absence de modifications post-traductionnelles importantes Point commun : utilisent la modélisation moléculaire pour la résolution des structures à partir de données expérimentales
II.2 – Méthodes prédictives = bioinformatique structurale Chapitre 1 – Structure des protéines Chapitre 2 – Le repliement des protéines Chapitre 3 – Détermination de la structure des macromolécules biologiques I. Détermination de la structure secondaire I.1. Méthodes expérimentales I.1 – 1. Spectroscopie Infrarouge I.1 – 2. Spectroscopie Raman I.2. Méthodes prédictives I.2 – 1. Analyse des clusters hydrophobes I.2 – 2. Méthodes « automatiques » II. Détermination de la structure tridimensionnelle II.1 – Méthodes expérimentales II.2 – Méthodes prédictives = bioinformatique structurale
Bio-informatique structurale : intérêt Statistiques GenBank Tous organismes confondus Statistiques Uniprot Tous organismes confondus Séquences d'ADN complémentaires ou de prédiction de gènes 2006 : 52 millions de séquences Séquences de protéines « vérifiées » 2006 : 250 000 séquences
Bio-informatique structurale : intérêt Statistiques PDB Tous organismes confondus Structures de protéines => 40 000 / 200 000 séq. prot. => 40 000 / 52 millions séq. nucl.
Prédiction de domaines transmembranaires Peu de protéines membranaires dans la PDB (~ 200 structures)
Bio-informatique structurale Méthodes de prédiction de structure tridimensionnelle des protéines Recherche du meilleur repliement par itérations successives => Grid Computing (Rosetta) Méthodes de threading => comparaison des séquences avec des banques de repliement Modélisation par analogie structurale => alignement de la séquence de la protéine inconnue => recherche d'une protéine similaire, dont la structure est connue
Bio-informatique structurale Méthodes de prédiction de structure tridimensionnelle des protéines Recherche du meilleur repliement par itérations successives => Grid Computing (Rosetta) Méthodes de threading => comparaison des séquences avec des banques de repliement Modélisation par analogie structurale => alignement de la séquence de la protéine inconnue => recherche d'une protéine similaire, dont la structure est connue
Modélisation par analogie structurale Bases théoriques Statistiques PDB Tous organismes confondus Nombre de topologies CATH => stable depuis 2005 La majorité des nouvelles structures de protéines sont soit des variations, soit des combinaisons d'environ 10 architectures protéiques fondamentales
~95% des protéines peuvent être classées en ~10 structures supersecondaires
Deux protéines de séquences similaires auront des structures proches
Modélisation par analogie structurale Méthodologie générale Séquence protéique à modéliser 1. Choix d’un analogue structural => recherche dans la PDB (Protein Data Bank) Séquence Structure
Modélisation par analogie structurale Méthodologie générale 2. Alignement des séquences Séquence à modéliser + Template
Modélisation par analogie structurale Méthodologie générale 2. Alignement des séquences Similarité supérieure à 30%
Modélisation par analogie structurale Méthodologie générale 2. Alignement des séquences Régions non modélisables => Pas d’informations structurales
Modélisation par analogie structurale Méthodologie générale 2. Alignement des séquences Régions structurellement conservées => Identifiées par score de similarité + prédiction de structure secondaire
Modélisation par analogie structurale Méthodologie générale 2. Alignement des séquences Régions variables => Identifiées par score de similarité
Modélisation par analogie structurale Méthodologie générale 2. Alignement des séquences => Identification des différentes régions sur la séquence à modéliser 3. Obtention des coordonnées atomiques (modélisation moléculaire) Différente suivant les régions : conservées ou variables 3 méthodes : 1. Méthode utlisant le remplacement moléculaire (dérivée de Xtallo) 2. Méthode utilisant des contraintes structurales (dérivée de RMN) 3. Méthode mixte
Méthode dérivée des techniques de raffinements cristallographiques : Remplacement moléculaire Structure cristallographique homologue Boucles extraites de structures de la PDB Régions Structurellement Conservées (SCR) Régions variables (boucles) Coordonnées Minimisations d’énergie (steepest descent et gradients conjugués) Évaluation du modèle final
Méthode dérivée des techniques de raffinements cristallographiques : Remplacement moléculaire Structure cristallographique homologue Boucles extraites de structures de la PDB Régions Structurellement Conservées (SCR) Régions variables (boucles) Coordonnées
Méthode dérivée des techniques de résolution de structures RMN : Application de contraintes Structure cristallographique homologue Boucles extraites de structures de la PDB Régions Structurellement Conservées (SCR) Régions variables (boucles) Contraintes Génération des coordonnées : Dynamique moléculaire et recuit simulé Minimisations d’énergie Évaluation du modèle final
Application de contraintes sur les régions structurellement conservées Méthode mixte : Application de contraintes sur les régions structurellement conservées Remplacement moléculaire pour les régions variables Structure cristallographique homologue Boucles extraites de structures de la PDB Régions Structurellement Conservées (SCR) Régions variables (boucles) Contraintes Coordonnées
Extraction de contraintes Méthode mixte : Application de contraintes sur les régions structurellement conservées Remplacement moléculaire pour les régions variables Structure cristallographique homologue Boucles extraites de structures de la PDB Régions Structurellement Conservées (SCR) + Régions variables (boucles) Contraintes Coordonnées Modèles initiaux Extraction de contraintes “type RMN “ Application des contraintes : Dynamique Moléculaire (recuit simulé) Structures finales Évaluation des structures
Résumé : modélisation moléculaire par analogie structurale Alignement de séquence Recherche d’analogues structuraux dans les banques de données Prédictions de structure secondaire Identification des SCR et des régions variables Modélisation Moléculaire Obtention des coordonnées structurales Evaluation des structures Minimination d'énergie globale Structure(s)
Analogues structuraux : > 75 % de similarité Liste des diff.fonc. +cytokinine + actine Et intérêt pour l’H. => TLp de fruits allergisantes et maturation des fruits. T= devant cette multiplicité de propriétés alors que struct prim similaire établissement des relations struct fonction. Exemple de modélisation : structure cristallographique absente de la PDB Analogues structuraux : > 75 % de similarité
Utilisation de serveurs automatisés pour la prédiction de la structure des protéines SWISS-MODEL (http://swissmodel.expasy.org) => Méthode de remplacement moléculaire pour toute la séquence GENO3D (http://geno3d-pbil.ibcp.fr) => Méthode d'extraction de contraintes pour toute la séquence Utilisation d'un logiciel commercial : InsightII (Accelrys) => Méthode mixte Liste des diff.fonc. +cytokinine + actine Et intérêt pour l’H. => TLp de fruits allergisantes et maturation des fruits. T= devant cette multiplicité de propriétés alors que struct prim similaire établissement des relations struct fonction.
Liste des diff.fonc. +cytokinine + actine Et intérêt pour l’H. => TLp de fruits allergisantes et maturation des fruits. T= devant cette multiplicité de propriétés alors que struct prim similaire établissement des relations struct fonction. Structure cristallographique Modèle « mixte » 0,5 Å
Modèle Geno3d 1,0 Å Liste des diff.fonc. +cytokinine + actine Et intérêt pour l’H. => TLp de fruits allergisantes et maturation des fruits. T= devant cette multiplicité de propriétés alors que struct prim similaire établissement des relations struct fonction. Structure cristallographique Modèle Swiss-Model 0,6 Å
Liste des diff.fonc. +cytokinine + actine Et intérêt pour l’H. => TLp de fruits allergisantes et maturation des fruits. T= devant cette multiplicité de propriétés alors que struct prim similaire établissement des relations struct fonction. Structure cristallographique Modèle «artisanal» Modèle Swiss-Model Modèle Geno3d
Coloration selon le RMS : Structures globalement semblables Liste des diff.fonc. +cytokinine + actine Et intérêt pour l’H. => TLp de fruits allergisantes et maturation des fruits. T= devant cette multiplicité de propriétés alors que struct prim similaire établissement des relations struct fonction. Coloration selon le RMS : Structures globalement semblables
II.3 – Evaluation de la qualité des structures : PROCHECK Chapitre 1 – Structure des protéines Chapitre 2 – Le repliement des protéines Chapitre 3 – Détermination de la structure des macromolécules biologiques I. Détermination de la structure secondaire I.1. Méthodes expérimentales I.1 – 1. Spectroscopie Infrarouge I.1 – 2. Spectroscopie Raman I.2. Méthodes prédictives I.2 – 1. Analyse des clusters hydrophobes I.2 – 2. Méthodes « automatiques » II. Détermination de la structure tridimensionnelle II.1 – Méthodes expérimentales II.2 – Méthodes prédictives = bioinformatique structurale II.3 – Evaluation de la qualité des structures : PROCHECK
Ramachandran plot
III. La génomique structurale Chapitre 1 – Structure des protéines Chapitre 2 – Le repliement des protéines Chapitre 3 – Détermination de la structure des macromolécules biologiques I. Détermination de la structure secondaire I.1. Méthodes expérimentales I.1 – 1. Spectroscopie Infrarouge I.1 – 2. Spectroscopie Raman I.2. Méthodes prédictives I.2 – 1. Analyse des clusters hydrophobes I.2 – 2. Méthodes « automatiques » II. Détermination de la structure tridimensionnelle II.1 – Méthodes expérimentales II.2 – Méthodes prédictives = bioinformatique structurale II.3 – Evaluation de la qualité des structures : PROCHECK III. La génomique structurale
Relations structure – fonction des protéines Caractérisation Purification Séquence protéique Relations structure/fonction Clonage Séquence nucléotidique Structure
Relations structure – fonction des protéines Caractérisation => conception de nouveaux médicaments Séquence protéique Relations structure/fonction Séquence nucléotidique Structure => méthodes expérimentales = génomique structurale => méthodes informatiques = bioinformatique structurale à haut débit
Génome humain : 100 000 gènes prédits (avant 2001) 35 000 gènes après séquençage et annotations 25 000 gènes selon les derniers calculs (fin 2005) Dogme central : 1 gène -> 1 ARN -> 1 protéine 1 gène -> 1 fonction Après la génomique => la protéomique => Épissage alternatif d'ARN, Modifications post-traductionnelles => 1 gène -> nb protéines ? Estimation => x 4 Protéines humaines dans la PDB => ~ 3 500 structures uniques
Chapitre 4 – Intéractions entre macromolécules Chapitre 1 – Structure des protéines Chapitre 2 – Le repliement des protéines Chapitre 3 – Détermination de la structure des macromolécules biologiques I. Détermination de la structure secondaire II. Détermination de la structure tridimensionnelle III. La génomique structurale Chapitre 4 – Intéractions entre macromolécules I. Interactions protéines – protéines
Mêmes interactions mises en jeu que pour les structures quaternaires Essentiellement 3 modes d’interaction :
II. Interactions protéines – Acides nucléiques Chapitre 1 – Structure des protéines Chapitre 2 – Le repliement des protéines Chapitre 3 – Détermination de la structure des macromolécules biologiques Chapitre 4 – Intéractions entre macromolécules I. Interactions protéines – protéines II. Interactions protéines – Acides nucléiques II.1 – Rappels sur la structure des acides nucléiques II.1 – 1. L'ADN
ADN Forme B
Forme B Forme A Forme Z
Autres formes possibles de l’ADN
II.1 – 2. L'ARN Chapitre 1 – Structure des protéines Chapitre 2 – Le repliement des protéines Chapitre 3 – Détermination de la structure des macromolécules biologiques Chapitre 4 – Intéractions entre macromolécules I. Interactions protéines – protéines II. Interactions protéines – Acides nucléiques II.1 – Rappels sur la structure des acides nucléiques II.1 – 1. L'ADN II.1 – 2. L'ARN
Différentes structures secondaires de l’ARN
Structures secondaires de l’ARN Pseudonoeud Tige boucle (stem loop) Boucle intérieure Simple brin Boucle en bulle (bulge) Boucle en épingle à cheveu (hairpin) Jonction (Multiboucle)
Structures tertaires de l’ARN
Structure d’un ARNt
Structure des ARNr de la grande sous-unité d’un ribosome bactérien (déterminée par cristallographie et diffraction des rayons X)
II.2 – Motifs protéiques de liaison à l'ADN Chapitre 1 – Structure des protéines Chapitre 2 – Le repliement des protéines Chapitre 3 – Détermination de la structure des macromolécules biologiques Chapitre 4 – Intéractions entre macromolécules I. Interactions protéines – protéines II. Interactions protéines – Acides nucléiques II.1 – Rappels sur la structure des acides nucléiques II.1 – 1. L'ADN II.1 – 2. L'ARN II.2 – Motifs protéiques de liaison à l'ADN
Motifs en doigt de zinc
Fermeture à leucine (leucine zipper)
Fermeture à leucine (leucine zipper)
Fermeture à leucine (leucine zipper)
II.3 – Interactions protéines – ARN Chapitre 1 – Structure des protéines Chapitre 2 – Le repliement des protéines Chapitre 3 – Détermination de la structure des macromolécules biologiques Chapitre 4 – Intéractions entre macromolécules I. Interactions protéines – protéines II. Interactions protéines – Acides nucléiques II.1 – Rappels sur la structure des acides nucléiques II.1 – 1. L'ADN II.1 – 2. L'ARN II.2 – Motifs protéiques de liaison à l'ADN II.3 – Interactions protéines – ARN
Interaction ARN-Protéines : le ribosome
Différentes structures de liaison protéines - ARN
III. Interactions protéines – polysaccharides III.1 – Glycoprotéines Chapitre 1 – Structure des protéines Chapitre 2 – Le repliement des protéines Chapitre 3 – Détermination de la structure des macromolécules biologiques Chapitre 4 – Intéractions entre macromolécules I. Interactions protéines – protéines II. Interactions protéines – acides nucléiques II.1 – Rappels sur la structure des acides nucléiques II.1 – 1. L'ADN II.1 – 2. L'ARN II.2 – Motifs protéiques de liaison à l'ADN II.3 – Interactions protéines – ARN III. Interactions protéines – polysaccharides III.1 – Glycoprotéines
Conformations étendues ? Interactions plus proches ?
III. 2 – Carbohydrates binding modules Chapitre 1 – Structure des protéines Chapitre 2 – Le repliement des protéines Chapitre 3 – Détermination de la structure des macromolécules biologiques Chapitre 4 – Intéractions entre macromolécules I. Interactions protéines – protéines II. Interactions protéines – acides nucléiques III. Interactions protéines – polysaccharides III.1 – Glycoprotéines III. 2 – Carbohydrates binding modules
Historiquement appelés cellulose binding domain (CBD) Forment un ou des domaines chez des hydrolases qui dégradent des polysaccharides insolubles Dans leur majorité structurés en β sandwich En général sont constitués d’une fissure chargée négativement
Type A => CBM de liaison en surface : plateforme plane AA aromatiques
Type B => CBM de liaison à une chaîne glycannique Fissure en général chargée (-)
CBM de type B
Type C => CBM de liaison à des monosaccharides ou petits oligosaccharides
Spécificité de l’interaction => plateforme d’interaction : AA aromatiques Plane CBM de type A
Spécificité de l’interaction => plateforme d’interaction : AA aromatiques Twisted Plane
Spécificité de l’interaction => plateforme d’interaction : AA aromatiques Twisted Plane En sandwich
Protéine de liaison au xylanne (struture RMN) site actif en violet 2 tryptophanes perpendiculaires, courbure permettant d’interagir avec le xylanne
Mutation d’une arginine en glycine => changement de conformation du Mutation d’une arginine en glycine => changement de conformation du tryptophane noté par une flèche et de la courbure de la protéine => perte de la spécificité et de l’affinité pour le xylane => interaction avec la cellulose cristalline
Spécificité de l’interaction => liaisons hydrogènes => présence dans les sites actifs de résidus polaires sérine, thréonine, mais aussi des résidus acides et basique maximum de liaisons hydrogènes => Interactions avec des ions calcium
Plasticité de l’interaction : flexibilité du polysaccharide => Ajustement induit entre la protéine et le polysaccharide
Interaction avec un cello-oligosaccharide linéaire
Protéine de la même famille fonctionnelle et structurale mais 2 insertions de boucles => reconnaissance de laminarioligosaccharides
IV. Modélisation des intéractions entre macromolécules Chapitre 1 – Structure des protéines Chapitre 2 – Le repliement des protéines Chapitre 3 – Détermination de la structure des macromolécules biologiques Chapitre 4 – Intéractions entre macromolécules I. Interactions protéines – protéines II. Interactions protéines – acides nucléiques III. Interactions protéines – polysaccharides III.1 – Glycoprotéines III. 2 – Carbohydrates binding modules IV. Modélisation des intéractions entre macromolécules IV.1 – Modélisation par remplacement moléculaire
Interaction protéine inhibiteur protéine : structure cristallo
+ Inhibiteur homologue Enzyme
Minimisation d’énergie et étude de l’interaction
IV. 2 – Modélisation automatique Chapitre 1 – Structure des protéines Chapitre 2 – Le repliement des protéines Chapitre 3 – Détermination de la structure des macromolécules biologiques Chapitre 4 – Intéractions entre macromolécules I. Interactions protéines – protéines II. Interactions protéines – acides nucléiques III. Interactions protéines – polysaccharides IV. Modélisation des intéractions entre macromolécules IV.1 – Modélisation par remplacement moléculaire IV. 2 – Modélisation automatique
Exemple : interaction protéines sucres
Résultat de la prédiction