Karsten Suhre IGS-CNRS Interactions protéine-protéine: Réseaux globaux à l’échelle atomique … … une approche de bio-informatique Karsten Suhre IGS-CNRS Interactions protéine-protéine, Karsten Suhre, 18 Octobre 2004
Sommaire L’ « Interactome » Ontologie de gènes Bases de données Prédiction d’interactions protéine-protéine Interactions protéine-protéine, Karsten Suhre, 18 Octobre 2004
L’ « Interactome » Définition: Liste de toutes les interactions entre les macro-molécules d’une cellule : Protéine – protéine Protéine – ADN Protéine – ARN ARN – ADN …. Interactions protéine-protéine, Karsten Suhre, 18 Octobre 2004
L’ « Interactome » Le nombre de gènes d’un génome ne semble pas être proportionnel à la complexité de l’organisme en question: E.coli : ~ 4,200 gènes Levure : ~ 6,400 gènes H. sapiens ~ 30,000 gènes La complexité d’un organisme est un résultat de la complexité de son « interactome » Interactions protéine-protéine, Karsten Suhre, 18 Octobre 2004
Cartographier l’ « interactome » Approches classiques « low throughput » Co-Immunoprécipitation Co-cristallisation Génétique … Approches « high throughput » (méthodes à haut débit): Yeast two-hybrid system Tandem-Affinity Purification (TAP) tagging HMS-PCI Interactions protéine-protéine, Karsten Suhre, 18 Octobre 2004
Yeast two-hibrid system Interactions protéine-protéine, Karsten Suhre, 18 Octobre 2004
Detection of protein associations in yeast using the two-hybrid system. a, Fusion of the 'bait' protein and the DNA-binding domain of the transcriptional activator cannot turn on the reporter gene. b, Likewise, fusion of the 'prey' protein and the activating region of the transcriptional activator is also insufficient to switch on the reporter gene. c, When 'bait' and 'prey' associate, however, the DNA-binding domain and activator region are brought close enough together to switch on the reporter gene. The result is gene transcription and a colour change that can be monitored. Interactions protéine-protéine, Karsten Suhre, 18 Octobre 2004
Interactions protéine-protéine, Karsten Suhre, 18 Octobre 2004
Homo-dimers Hétéro-dimers Interactions protéine-protéine, Karsten Suhre, 18 Octobre 2004
Tandem affinity purification (TAP-tag) Interactions protéine-protéine, Karsten Suhre, 18 Octobre 2004
Spectroscopie de masse à haute résolution: HMS-PCI Interactions protéine-protéine, Karsten Suhre, 18 Octobre 2004
Des limitations à ne pas oublier Protéines membranaires difficiles Modifications des protéines natives (rajout de TAGs) Repliement de domaines pas garanti Milieu « non-natif » (ex. yeast double-hybrid) Protéines paralogues … Interactions protéine-protéine, Karsten Suhre, 18 Octobre 2004
Cartographier l’ « interactome » Approches classiques « low throughput » plus fiable, mais aussi plus cher Approches « high throughput » (méthodes à haut débit): Yeast two-hybrid system Tandem-Affinity Purification (TAP) tagging HMS-PCI attention aux fausses positives et faux négatives !!! Interactions protéine-protéine, Karsten Suhre, 18 Octobre 2004
Ontologie de gènes Annotation des gènes dépend de l’organisme étudié Difficile de comparer les réseaux d’interaction de manière automatique et objective Pb. de paralogies Langage d’annotation commun à développer GO et COG Interactions protéine-protéine, Karsten Suhre, 18 Octobre 2004
Interactions protéine-protéine, Karsten Suhre, 18 Octobre 2004
GO: Gene Ontology http://www.geneontology.org/ Effort collaboratrice dans l’annotation des organismes modèle (drosophile, levure, souris) Objectif: description consistante de la fonction d’un gène 3 vocabulaires structurés (+/- spécifique) : molecular function biological process cellular component Interactions protéine-protéine, Karsten Suhre, 18 Octobre 2004
GO: exemples des 3 vocabulaires molecular function : catalytic activity transporter activity binding adenylate cyclase activity Toll receptor binding biological process : cell growth and maintenance signal transduction pyrimidine metabolism alpha-glucoside transport. cellular component : rough endoplasmic reticulum nucleus ribosome proteasome Interactions protéine-protéine, Karsten Suhre, 18 Octobre 2004
biological process cellular component molecular function Interactions protéine-protéine, Karsten Suhre, 18 Octobre 2004
COG: Cluster of Orthologous Groups http://www.ncbi.nlm.nih.gov/COG/ COG: Cluster of Orthologous Groups Interactions protéine-protéine, Karsten Suhre, 18 Octobre 2004
COG: Critère du Mutual Best Match genome1 genome2 genome1 genome2 genome1 genome2 COG Interactions protéine-protéine, Karsten Suhre, 18 Octobre 2004
COG: Liens entre trois génomes Genome 1 Non Genome 2 Genome 3 Genome 4 Oui Interactions protéine-protéine, Karsten Suhre, 18 Octobre 2004
COG: résumé Généralisation de la notion d’un gène à celle d’un COG « Abstraction » du génome d’origine Classification fonctionnelle (rudimentaire) … et plus encore: Profiles phylogénomique (simple) Contexte génomique Alignements multiples Interactions protéine-protéine, Karsten Suhre, 18 Octobre 2004
Annotation de gènes avec des ontologies GO (Gene Ontology) plutôt adapté aux eucaryotes COG (Cluster of Orthologous Groups) plutôt adapté aux procaryotes … mais il y a de la convergence ! Interactions protéine-protéine, Karsten Suhre, 18 Octobre 2004
L’ « interactome » dans les bases de données dédiées DIP Database of Interacting Proteins EMBL-EBI Interact BIND Biomolecular Interaction Network Database MIPS Mammalian Protein-Protein Interaction Database GRID General Repository for Interaction Datasets Interactions protéine-protéine, Karsten Suhre, 18 Octobre 2004
DIP Database of Interacting Proteins http://dip.doe-mbi.ucla.edu/ Interactions protéine-protéine, Karsten Suhre, 18 Octobre 2004
Interactions protéine-protéine, Karsten Suhre, 18 Octobre 2004
Interactions protéine-protéine, Karsten Suhre, 18 Octobre 2004
Interactions protéine-protéine, Karsten Suhre, 18 Octobre 2004
Interactions protéine-protéine, Karsten Suhre, 18 Octobre 2004
Interactions protéine-protéine, Karsten Suhre, 18 Octobre 2004
CheZ CheA CheY FliG FliM ArcB FliN Interactions protéine-protéine, Karsten Suhre, 18 Octobre 2004
EMBL-EBI Interact http://www.ebi.ac.uk/intact/ Interactions protéine-protéine, Karsten Suhre, 18 Octobre 2004
Interactions protéine-protéine, Karsten Suhre, 18 Octobre 2004
Interactions protéine-protéine, Karsten Suhre, 18 Octobre 2004
Interactions protéine-protéine, Karsten Suhre, 18 Octobre 2004
Interactions protéine-protéine, Karsten Suhre, 18 Octobre 2004
Interactions protéine-protéine, Karsten Suhre, 18 Octobre 2004
BIND Biomolecular Interaction Network Database http://bind.ca/ Interactions protéine-protéine, Karsten Suhre, 18 Octobre 2004
Interactions protéine-protéine, Karsten Suhre, 18 Octobre 2004
Interactions protéine-protéine, Karsten Suhre, 18 Octobre 2004
Interactions protéine-protéine, Karsten Suhre, 18 Octobre 2004
Interactions protéine-protéine, Karsten Suhre, 18 Octobre 2004
Interactions protéine-protéine, Karsten Suhre, 18 Octobre 2004
Interactions protéine-protéine, Karsten Suhre, 18 Octobre 2004
Interactions protéine-protéine, Karsten Suhre, 18 Octobre 2004
Interactions protéine-protéine, Karsten Suhre, 18 Octobre 2004
Interactions protéine-protéine, Karsten Suhre, 18 Octobre 2004
Interactions protéine-protéine, Karsten Suhre, 18 Octobre 2004
Interactions protéine-protéine, Karsten Suhre, 18 Octobre 2004
Interactions protéine-protéine, Karsten Suhre, 18 Octobre 2004
Interactions protéine-protéine, Karsten Suhre, 18 Octobre 2004
MIPS Mammalian Protein-Protein Interaction Database http://mips.gsf.de/proj/ppi/ Interactions protéine-protéine, Karsten Suhre, 18 Octobre 2004
Interactions protéine-protéine, Karsten Suhre, 18 Octobre 2004
Interactions protéine-protéine, Karsten Suhre, 18 Octobre 2004
Interactions protéine-protéine, Karsten Suhre, 18 Octobre 2004
Interactions protéine-protéine, Karsten Suhre, 18 Octobre 2004
GRID the General Depository for Interaction Datasets http://biodata.mshri.on.ca/grid/ Interactions protéine-protéine, Karsten Suhre, 18 Octobre 2004
Interactions protéine-protéine, Karsten Suhre, 18 Octobre 2004
Interactions protéine-protéine, Karsten Suhre, 18 Octobre 2004
Interactions protéine-protéine, Karsten Suhre, 18 Octobre 2004
Interactions protéine-protéine, Karsten Suhre, 18 Octobre 2004
Interactions protéine-protéine, Karsten Suhre, 18 Octobre 2004
Interactions protéine-protéine, Karsten Suhre, 18 Octobre 2004
Interactions protéine-protéine, Karsten Suhre, 18 Octobre 2004
Interactions protéine-protéine, Karsten Suhre, 18 Octobre 2004
Interactions protéine-protéine, Karsten Suhre, 18 Octobre 2004
L’ « interactome » dans les bases de données dédiées DIP Database of Interacting Proteins EMBL-EBI Interact BIND Biomolecular Interaction Network Database MIPS Mammalian Protein-Protein Interaction Database GRID General Repository for Interaction Datasets Interactions protéine-protéine, Karsten Suhre, 18 Octobre 2004
Plus de ressources sur le Web GenomeWeb http://www.hgmp.mrc.ac.uk/GenomeWeb/prot-interaction.html Interactions protéine-protéine, Karsten Suhre, 18 Octobre 2004
Interactions protéine-protéine, Karsten Suhre, 18 Octobre 2004
PAUSE Interactions protéine-protéine, Karsten Suhre, 18 Octobre 2004
Prédiction d’interactions putatives protéine-protéine basée sur des données expérimentales basée sur des données génomiques … éventuellement Docking protéine-protéine Co-expression (puces à ADN) Co-régulation (facteurs de transcription, …) Interactions protéine-protéine, Karsten Suhre, 18 Octobre 2004
InterPreTS protein Interaction Prediction through Tertiary Structure http://speedy.embl-heidelberg.de/people/patrick/interprets/ Interactions protéine-protéine, Karsten Suhre, 18 Octobre 2004
Interactions protéine-protéine, Karsten Suhre, 18 Octobre 2004
Interactions protéine-protéine, Karsten Suhre, 18 Octobre 2004
PathBlast http://www.pathblast.org/bioc/pathblast/blastpathway.jsp Comparaison de voies Interactions protéine-protéine, Karsten Suhre, 18 Octobre 2004
Interactions protéine-protéine, Karsten Suhre, 18 Octobre 2004
Interactions protéine-protéine, Karsten Suhre, 18 Octobre 2004
STRING http://dag.embl-heidelberg.de/newstring_cgi/show_input_page.pl Génomique comparative Interactions protéine-protéine, Karsten Suhre, 18 Octobre 2004
Placer le gène dans son contexte phylogénomique Interactions protéine-protéine, Karsten Suhre, 18 Octobre 2004
STRING: Interactions protéine-protéine, Karsten Suhre, 18 Octobre 2004
1. Co-evolution profiling On dit que deux gènes ont co-évolué si ils sont tout les deux soit présents soit absents dans tous les génomes considérés. Exemples: Des gènes appartenant à une même voie métabolique Récepteurs et gènes de signalisation de chémotaxie + flagelles Systèmes de transport trans-membranaire / sécrétion Interactions protéine-protéine, Karsten Suhre, 18 Octobre 2004
bon mauvais Interactions protéine-protéine, Karsten Suhre, 18 Octobre 2004
2. Co-localization Des gènes appartenant à un même système fonctionnel sont souvent organisés en opéron (co-régulation). Des opérons ayant des fonctions liées sont souvent localisés à proximité sur le chromosome. Une conservation de la proximité de deux gènes à travers des génomes distants est un indice pour leur association fonctionnelle. Interactions protéine-protéine, Karsten Suhre, 18 Octobre 2004
Interactions protéine-protéine, Karsten Suhre, 18 Octobre 2004
3. Rosetta Stone « Deux » protéines codées par un seul transcrit Origine de la fusion de deux gènes réarrangement du chromosome mutation d’un codons STOP Des gènes appartenant à une même fonction sont souvent déjà proche sur le chromosome Interactions protéine-protéine, Karsten Suhre, 18 Octobre 2004
Pourquoi la fusion de gènes? Protéines formant des complexes: Enzymes d’une même voie métabolique: Co-expression / co-translation Interactions protéine-protéine, Karsten Suhre, 18 Octobre 2004
Interactions protéine-protéine, Karsten Suhre, 18 Octobre 2004
Interpréter les résultats Interactions protéine-protéine, Karsten Suhre, 18 Octobre 2004
Interactions protéine-protéine, Karsten Suhre, 18 Octobre 2004
PhydBac http://igs-server.cnrs-mrs.fr/phydbac/ Généralisation de la notion de distance phylogénétique entre deux gènes Interactions protéine-protéine, Karsten Suhre, 18 Octobre 2004
Profiles phylogénomique Génomes bactériens BLAST scores normalisés Co-évolution Interactions protéine-protéine, Karsten Suhre, 18 Octobre 2004
De la corrélation vers une « distance » Co-évolution ~ corrélation entre profiles phylogénomique Définition d’une « distance » d = 1 - |c| Attention: ceci n’est pas une véritable distance, car … |d1 – d2| + |d2 – d3| |d1-d3| Interactions protéine-protéine, Karsten Suhre, 18 Octobre 2004
Distances et « clustering » Gènes « Clustering » fonctionnel Matrice de distances « pairwise » Gènes unknown known Interactions protéine-protéine, Karsten Suhre, 18 Octobre 2004
Interactions protéine-protéine, Karsten Suhre, 18 Octobre 2004
Le système tol/pal TolA TolR TolB TolQ Pal YbgF YbgC Interactions protéine-protéine, Karsten Suhre, 18 Octobre 2004
Interactions protéine-protéine, Karsten Suhre, 18 Octobre 2004
Interactions protéine-protéine, Karsten Suhre, 18 Octobre 2004
Interactions protéine-protéine, Karsten Suhre, 18 Octobre 2004
Interactions protéine-protéine, Karsten Suhre, 18 Octobre 2004
Interactions protéine-protéine, Karsten Suhre, 18 Octobre 2004
Interactions protéine-protéine, Karsten Suhre, 18 Octobre 2004
Interactions protéine-protéine, Karsten Suhre, 18 Octobre 2004
Interactions protéine-protéine, Karsten Suhre, 18 Octobre 2004
Interactions protéine-protéine, Karsten Suhre, 18 Octobre 2004
Limitations de la co-évolution Identification claire de l’orthologie entre deux gènes par fois difficile Duplications de gènes (paralogie) ou de systèmes de gènes Existence d’iso-protéines (par ex. iso-enzymes) sans homologie entre elles ORFans: par définition pas de co-évolution détectable pour des gènes qui sont uniques à un génome Interactions protéine-protéine, Karsten Suhre, 18 Octobre 2004
FusionDB http://igs-server.cnrs-mrs.fr/FusionDB/ Interactions protéine-protéine, Karsten Suhre, 18 Octobre 2004
http://igs-server.cnrs-mrs.fr/FusionDB/ Interactions protéine-protéine, Karsten Suhre, 18 Octobre 2004
Limitations de la méthode Des évènements de fusions ne sont pas toujours clairement identifiables Gains ou pertes de domaines Insertion d’un gène dans un autre Interactions protéine-protéine, Karsten Suhre, 18 Octobre 2004
FusionDB: arbres phylogénomique N-terminal C-terminal Interactions protéine-protéine, Karsten Suhre, 18 Octobre 2004
Quelques remarques finales … > 50-100,000 interactions dans les bases de données Taux élevé de faux positives et négatives possible PB: nomenclature des gènes homologues ontologie de gènes Homogénéisation des bases de données en cours Prédiction d’interaction sur bases expérimentales et génomiques possible … Interactions protéine-protéine, Karsten Suhre, 18 Octobre 2004
BACKUP Interactions protéine-protéine, Karsten Suhre, 18 Octobre 2004
Intégrer les informations Combiner les informations données par les trois méthodes -> Scoring Réseaux d’interactions entre multiples protéines Interprétation biologique des résultats Interactions protéine-protéine, Karsten Suhre, 18 Octobre 2004
Une vue sommaire de la fusion Interactions protéine-protéine, Karsten Suhre, 18 Octobre 2004
Spécificité S = 0.003 N = 50 L’ensemble + s2 = 12 La sélection s1 = 15 x = 8 L’ensemble + La sélection Tous les Les trouvés Interactions protéine-protéine, Karsten Suhre, 18 Octobre 2004