La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

INTERACTIONS PROTEINE-PROTEINE : DU PRODUCTEUR AU CONSOMMATEUR Christine Brun, LGPD, Marseille Réunion Satellite JOBIM, Lyon, Juillet 2005.

Présentations similaires


Présentation au sujet: "INTERACTIONS PROTEINE-PROTEINE : DU PRODUCTEUR AU CONSOMMATEUR Christine Brun, LGPD, Marseille Réunion Satellite JOBIM, Lyon, Juillet 2005."— Transcription de la présentation:

1 INTERACTIONS PROTEINE-PROTEINE : DU PRODUCTEUR AU CONSOMMATEUR Christine Brun, LGPD, Marseille Réunion Satellite JOBIM, Lyon, Juillet 2005

2 Une protéine nagit jamais seule… …mais interagit avec dautres afin dassurer sa fonction.

3 LA DIVERSITE DES INTERACTIONS P-P d'après Nooren & Thornton Linteraction a lieu entre homo- ou hétéro-oligomères Lassociation est isologue ou hétérologue : les surfaces de contact sont identiques (homo-oligomères) les surfaces de contact sont différentes (homo-/hétéro-oligomères) chaînes identiqueschaînes différentes 1- Diversité Structurale

4 LA DIVERSITE DES INTERACTIONS P-P d'après Nooren & Thornton 2- Diversité Fonctionnelle IPP obligatoire : Les protéines ne sont pas stables indépendamment. Les protéines ne sont pas fonctionnelles indépendamment. L'interaction est nécessaire à la stabilité et à la fonction. Ex: gros complexes protéiques (ADN polymérase, ARN polymerase, ribosome…) IPP non-obligatoire : Les protéines sont stables indépendamment. Les protéines sont fonctionnelles indépendamment. Linteraction est responsable dune action. Ex: complexes antigène-anticorps, enzyme-inhibiteur, complexes de signalisation intracellulaire…

5 LA DIVERSITE DES INTERACTIONS P-P d'après Nooren & Thornton 3- Diversité Dynamique IPP permanente : N'existe qu'au sein d'un complexe. Les IPP obligatoires sont généralement permanentes. IPP transitoire : S'associe et se dissocie in vivo. Les IPP non-obligatoires peuvent être transitoires ou permanentes.

6 LES GRANDS RESEAUX D'INTERACTIONS Graphe non orienté, Nœud = protéine, Arête = interaction physique

7 Comment identifier les interactions protéine-protéine à l'échelle du protéome entier? Deux méthodes automatisées: - le double-hybride dans la levure - le TAP-tag (tandem affinity purification)

8 DF DA Gène LA MODULARITE DES FACTEURS DE TRANSCRIPTION, comme principe élémentaire du double hybride dans la levure Facteur de transcription: Domaine de fixation à l'ADN DF + Domaine d'activation de la transcription DA, capable d'activer la machinerie basale de transcription Site de fixation pour le facteur de transcription Facteur de transcription ARN messager DF DA

9 DF Appât X DA Proie Y Gène rapporteur LE DOUBLE-HYBRIDE DANS LA LEVURE, le test La protéine appât (dont on veut identifier les interacteurs) est fusionnée au domaine de fixation à l'ADN DF d'un facteur de transcription. Les protéines proies (interacteurs potentiels) sont fusionnées au domaine d'activation de la machinerie basale de transcription DA d'un facteur de transcription. Les protéines fusions sont exprimées dans des cellules de levure contenant un gène rapporteur dont l'expression est placée sous le contrôle du site de fixation pour le domaine de fixation à l'ADN DF.

10 DF Appât X DA Proie Y Lorsque la protéine proie Y est capable d'interagir avec la protéine appât X, le domaine d'activation se retrouve à proximité du promoteur du gène rapporteur et la transcription a lieu. Gène rapporteur ARN rapporteur DA Proie Y LE DOUBLE-HYBRIDE DANS LA LEVURE, le test

11 QUELLES INTERACTIONS SONT IDENTIFIEES PAR UN CRIBLE DOUBLE HYBRIDE ? - Interactions permanentes - Interactions transitoires dont les interactions enzyme- substrat (ex: 10 à 40 % des interactions kinase-substrat). - Interactions qui n'existent pas physiologiquement Faux-positifs DF Appât X Gène rapporteur ARN rapporteur L'appât auto-activateur (activation de la transcription en absence d'interacteur) DF Appât X DA Proie Y DF Appât A DF Appât B DF Appât C La proie collante (interagit avec un très grand nombre d'appâts)

12 QUELLES INTERACTIONS NE SONT PAS IDENTIFIEES PAR UN CRIBLE DOUBLE HYBRIDE ? - Les interactions impliquant des protéines qui présentent des problèmes: - structuraux (repliement) - stabilité - toxicité - mauvaise localisation (protéines membranaires) - modification post-traductionnelle - Estimation: 80 à 90 % des interactions sensées exister, n'auraient pas été détectées Faux-négatifs évolution des méthodes de double-hybrides pour palier à ces problèmes.

13 PRINCIPAUX CRIBLES DOUBLE-HYBRIDE A GRANDE ECHELLE Helicobacter pylori 1524 Rain et al.* Saccharomyces cerevisiae 840 Uetz et al.* 4500 Ito et al. Caenorhabditis elegans 4000 Li et al. Drosophila melanogaster 2060 Formstecher et al.* Giot et al.* 1800 Stanyon et al.*

14 COMPARAISON DES RESULTATS DES 3 CRIBLES DOUBLE-HYBRIDE DROSOPHILE Giot et al. Science 2003 Formstecher et al. Genome Res 2005 Stanyon et al. Genome Biol interactions extraites de la littérature (20/885=2.3%)(51/2787=1.8%) (9/605=1.5%) Peu de recouvrement entre expériences Peu de recouvrement avec la littérature, mais des recouvrements du même ordre quelle que soit l'expérience Meilleur recouvrement entre expériences et littérature qu'entre expériences

15 Giot et al. Science 2003 Formstecher et al. Genome Res 2005 COMPARAISON DES RESULTATS DE 2 CRIBLES DOUBLE-HYBRIDE DROSOPHILE SUR 30 APPATS IDENTIQUES Le 'faible' recouvrement est dû aux méthodologies employées: - Giot et al. protéines entières - Formstecher et al. fragments de protéines Les résultats des deux approches sont complémentaires.

16 LES SCORES DE CONFIANCE Probabilités basées sur des prédicteurs: - # d'interacteurs/proie - orientation de linteraction - probabilité d'interaction appât/proie comparée au hasard - # dobservations indépendantes de linteraction - clustering local du réseau - région du gène clonée (5 UTR, CDS, 3 UTR) ATTENTION Une interaction avec un score faible n'est pas forcément un faux-positif!

17 Tag Appât Y anticorps anti-Tag PRINCIPES DU TANDEM-AFFINITY PURIFICATION

18 QUELLES INTERACTIONS SONT/NE SONT PAS IDENTIFIEES PAR LE TAP-TAG ? - Interactions permanentes complexe - Faux-positifs 20% (estimation) - Complexes identifiés en conditions quasi physiologiques (cellules, animaux entiers) -Variation de la composition des complexes (par exemple, en fonction d'un stimulus, de l'activation d'une voie…) - Pas d'interactions transitoires - Pb: conformation gènes essentiels très petites protéines protéines non solubles

19 LE PROBLEME DE LA REPRESENTATION DES RESULTATS DE TAP-TAG DANS LES GRAPHES Y2H interactions directes Tap-TAG composition des complexes Qui interagit avec qui? Quelle représentation dans les graphes? Matrix model Spoke model Expériences Tap-TAG Données de la littérature Réalité

20 L'INTEGRATION DES DONNEES POUR 'VALIDER' LES INTERACTIONS ISSUES DES EXPERIENCES A GRANDE ECHELLE Une interaction a plus de chance d'exister lorsque: - l'interaction a été identifiée par des méthodes expérimentales différentes - les protéines contiennent des domaines connus pour interagir - les deux protéines sont localisées dans le même compartiment cellulaire - leur expression est corrélée (correlation interactome-transcriptome) - leurs annotations fonctionnelles (Gene Ontology) sont corrélées - l'interaction est connue chez un autre organisme (notion d'interologue) Ce que j'en pense: Ces notions sont trop restrictives… …et ne laissent pas la place à la nouveauté et à la possibilité de découvrir de nouveaux phénomènes.

21 DES SOLUTIONS ALTERNATIVES 1- Les jeux de données: - Des jeux de données d'interactions mixant des interactions d'origines différentes: littérature, expériences à petite et à grande échelles - Multiplicité des jeux de données, de 'stringences' différentes - Adaptation des jeux de données à la question biologique posée (analyse globale jeux de données de haute confiance, analyse locale jeux de données le plus large possible) 2- Les méthodes d'analyses: - Validées statistiquement - Résistantes au bruit Ce sont celles que nous avons adoptées! 3- La représentation dans les graphes - Poids des arêtes - Adaptation des méthodes d'analyses

22 Sommets = protéines LES RESEAUX D'INTERACTIONS Arêtes = interactions physiques ANALYSER LES RESEAUX DINTERACTIONS = APPORTER DE LINFORMATION SUR LA FONCTION CELLULAIRE DES GENES/PROTEINES

23 PRINCIPE: …ne pas comparer les protéines elles-mêmes… …mais leurs groupes dinteracteurs respectifs… HYPOTHESE: plus les protéines possèdent dinteracteurs communs, plus elles doivent être fonctionnellement reliées. A B D C

24 UNE TRADUCTION MATHEMATIQUE POSSIBLE DE L'HYPOTHESE: LA DISTANCE DE CZEKANOWSKI-DICE | X Y | + | X Y | | X \ (X Y) | + | Y \ (X Y) | D(X, Y) = Y X e c a fghfgh d b =

25 X Y Z T PRODISTIN (Protein Distance based on Interactions), une méthode de classification fonctionnelle des protéines Disposer dune liste d'interactions entre protéines Construire un arbre de classification à partir des distances XYZT X Y-0.6 Z-0.8 T- Tableau de distances Calculer la distance entre les protéines X Y Z T Identifier des classes fonctionnelles de protéines daprès: - les annotations fonctionnelles pour les protéines - la topologie des sous-arbres Principales étapes de la méthode

26 UN ARBRE PRODISTIN DE 602 PROTEINES DE LEVURE Quelle est la signification biologique du regroupement des protéines dans larbre ? 2139 protéines 2946 interactions

27 UTILISATION DES ANNOTATIONS FONCTIONNELLES POUR IDENTIFIER DES CLASSES DANS LARBRE Les classes PRODISTIN Une classe contient au moins 3 protéines partageant la même annotation fonctionnelle. Ces protéines représentent au moins 50% des protéines de la classe. Cycle cellulaire

28 Arbre de classification fonctionnelle de 602 protéines de levure selon la fonction cellulaire - 67% des protéines de larbre classées - 64 classes protéines - 30/44 fonctions cellulaires

29 CLASSE 'DNA METABOLISM' ET 'CELL CYCLE' Complexe pré-réplication Complexe protéine kinase Réplication télomère Cible le CPR sur l'origine Contrôle du cycle celulaire Structure chromatine ?? Duplication spindle pole body PRODISTIN - regroupe les protéines impliquées dans les mêmes complexes protéiques, voies ou processus biologiques - permet dinférer une fonction cellulaire pour des protéines de fonction inconnue (42/93)

30 PREDICTIONS DE FONCTION CELLULAIRE 93 protéines de fonction inconnue 42 dans des classes PRODISTIN une fonction cellulaire est prédite 2 prédictions nouvelles (5%) 40 prédites par d'autres méthodes bioinfo ou récemment caractérisées expérimentalement + 27 en accord (64%) 13 différentes (30%)

31 EVALUATION STATISTIQUE DE LA QUALITE DES CLASSES ET DES PREDICTIONS FONCTIONNELLES (1) - Le regroupement des protéines dans les classes est-il significatif? Est-il différent d'un regroupement au hasard? Test sur des réseaux au hasard de topologie identique – Reshuffling 15 classes au lieu de 64 Significatif - Quelle est la qualité des prédictions fonctionnelles? On suppose que toutes les protéines membres d'une même classe assurent la fonction cellulaire de la classe; comparaison de ces prédictions avec les fonctions cellulaires connues. Taux de succès = # de fonctions correctement prédites/ # de prédictions 67 % - Quelle est la qualité topologique des classes? Index de robustesse des classes. Vérifie l'adéquation de la représentation en arbre avec les valeurs de distances 0 < 0.96 < 1

32 - Comment la méthode PRODISTIN réagit-elle à la présence de 'bruit' dans les données d'interactions? Test sur des réseaux de topologies différentes – Rewiring Quel est le taux de succès pour les prédictions? EVALUATION STATISTIQUE DE LA QUALITE DES CLASSES ET DES PREDICTIONS FONCTIONNELLES (2)

33 PRODISTIN, une méthode de classification fonctionnelle des protéines à partir du réseau dinteractions protéine-protéine, validée statistiquement Extrait de linformation fonctionnelle à partir dun réseau complexe en donnant une vision intégrée des fonctions Regroupe les protéines impliquées dans les mêmes fonctions cellulaires Prédiction de fonction cellulaire pour les protéines de fonction inconnue (67% de taux de succès) Un nouvel outil complémentaire à lanalyse de séquence pour la prédiction de fonction, permettant une nouvelle approche de la fonction des gènes/protéines au niveau cellulaire Prodistin Web Server: LA METHODE PRODISTIN : CONCLUSIONS Brun et al., 2003, Genome Biology, 5:R6 Baudot et al., 2004, Genome Biology, 5:R76

34 Anaïs BAUDOT Bernard JACQ Christine BRUN David MARTIN Pierre MOUREN LGPD, IBDM, Marseille IML, Marseille Alain Guénoche IRD, Montpellier François Chevenet Hybrigenics, Paris Jérôme Wojcik Laurent Daviet


Télécharger ppt "INTERACTIONS PROTEINE-PROTEINE : DU PRODUCTEUR AU CONSOMMATEUR Christine Brun, LGPD, Marseille Réunion Satellite JOBIM, Lyon, Juillet 2005."

Présentations similaires


Annonces Google