Télécharger la présentation
La présentation est en train de télécharger. S'il vous plaît, attendez
Publié parGhislaine Chevalier Modifié depuis plus de 8 années
1
Qu’est-ce le Web sémantique? Ivan Herman, W3C
2
Copyright © 2008, W3C (2)(2) Organisons un voyage à Budapest en utilisant le Web!
3
Copyright © 2008, W3C (3)(3) On essaye de trouver un vol approprié avec …
4
Copyright © 2008, W3C (4)(4) … une grosse compagnie réputée, ou …
5
Copyright © 2008, W3C (5)(5) … la compagnie du pays de destination, ou …
6
Copyright © 2008, W3C (6)(6) … une compagnie low cost
7
Copyright © 2008, W3C (7)(7) Nous devons aussi trouver un hôtel, donc on essaye de trouver…
8
Copyright © 2008, W3C (8)(8) … un hôtel très bon marché, ou …
9
Copyright © 2008, W3C (9)(9) … un hôtel de luxe, ou …
10
Copyright © 2008, W3C ( 10 ) … un hôtel abordable mais correct …
11
Copyright © 2008, W3C ( 11 ) aïe, ce site pose un problème, c’est en Hongrois, une langue que presque personne ne comprend ; mais…
12
Copyright © 2008, W3C ( 12 ) … celui-ci devrait aller
13
Copyright © 2008, W3C ( 13 ) Naturellement, nous pouvons aussi nous fier à un site spécialisé…
14
Copyright © 2008, W3C ( 14 ) … comme celui-ci, ou…
15
Copyright © 2008, W3C ( 15 ) … celui-là
16
Copyright © 2008, W3C ( 16 ) Vous voudriez, peut-être, avoir une idée de Budapest avant d’y aller ; essayons de trouver des photos…
17
Copyright © 2008, W3C ( 17 ) … sur flickr …
18
Copyright © 2008, W3C ( 18 ) … sur Google …
19
Copyright © 2008, W3C ( 19 ) … vous pouvez aussi regarder mes photos
20
Copyright © 2008, W3C ( 20 ) …ou consulter un site (social) de voyages
21
Copyright © 2008, W3C ( 21 ) Qu’avons nous fait ? Nous avons consulté un nombre de sites de styles différents créés pour des utilisations différentes, peut- être même dans des langues différentes… Nous avons dû intégrer toutes ces informations pour arriver à notre but Nous savons tous que, dans certains cas, il s’agit là d’un processus long et fatigant !
22
Copyright © 2008, W3C ( 22 ) En fait, toutes ces pages ne sont que les parties visibles de l’iceberg ! En effet : les vrais données sont cachées dans des bases de données, des fichiers XML, des pages Excel… nous avons accès uniquement à ce que les concepteurs des sites nous laissent voir
23
Copyright © 2008, W3C ( 23 ) Les sites spécialisées (Expedia, TripAdvisor) font un peu plus : ils collectent et combinent des données de sources diverses mais ils continuent a contrôler ce que l’utilisateur peut voir Dans certains cas, vous voudriez personnaliser : c’est à dire, accéder aux données et les combiner vous-même !
24
Copyright © 2008, W3C ( 24 ) Voici un exemple…
25
Copyright © 2008, W3C ( 25 ) Des compagnies utilisatrices sont contraintes à embaucher des experts pour manier ce genres de bases de données !
26
Copyright © 2008, W3C ( 26 ) Un autre exemple : les sites sociaux. J’ai une liste « d’amis » sur…
27
Copyright © 2008, W3C ( 27 ) … Dopplr,
28
Copyright © 2008, W3C ( 28 ) … Twine,
29
Copyright © 2008, W3C ( 29 ) … LinkedIn,
30
Copyright © 2008, W3C ( 30 ) … et, naturellement, Facebook
31
Copyright © 2008, W3C ( 31 ) J’ai dû re-ajouter et re-contacter mes amis pour tous les sites, indépendamment l’un de l’autre Ceci est même pire qu’avant : c’est moi qui ajoute à l’iceberg, mais je n’ai pas nécessairement accès à mes propre données…
32
Copyright © 2008, W3C ( 32 ) Que voudrions-nous avoir ? Pouvoir utiliser les données sur le Web comme nous utilisons les documents : pouvoir créer des liens à des données (indépendamment de leur présentation) pouvoir utiliser les données comme nous le voulons sur nos sites et programmes sur le Web
33
Copyright © 2008, W3C ( 33 ) En d’autres termes… Nous voudrions élargir le Web actuel pour arriver à un « Web des données » permettre aux applications d’exploiter les données directement
34
Copyright © 2008, W3C ( 34 ) Une minute ! N’est-ce pas ce que les « mashups » font déjà ?
35
Copyright © 2008, W3C ( 35 ) Un exemple d’un « mashup » :
36
Copyright © 2008, W3C ( 36 ) D’un certain sens oui, et cela montre le potentiel énorme du Web des données Mais ces sites sont contraints à faire un travail ad- hoc : les données ne sont souvent accessibles que par le biais de services tous ont des APIs, des logiques, des structures différentes pour toutes nouvelles données, les sites doivent recommencer à zéro, parce qu’il n’existe aucun moyen standard pour accéder aux données
37
Copyright © 2008, W3C ( 37 ) En d’autre termes … Nous voudrions élargir le Web actuel pour arriver à un « Web des données » par des moyens standards
38
Copyright © 2008, W3C ( 38 ) Mais qu’est-ce que cela veut dire en pratique ? Comment fonctionne le Web actuel ? des document sont créés ils reçoivent une adresse (un URI) et ils sont mis à disposition sur le Web
39
Copyright © 2008, W3C ( 39 ) Un exemple : le site de Steven sur Amsterdam (créé pour des amis)
40
Copyright © 2008, W3C ( 40 ) Puis vient la magie… D’autres découvrent le site et ils s’y « lient » Plus il y a ce genre de liens, plus la page est importante, donc plus la page est connu c’est l’essentiel du fonctionnement de Google ! C’est « l’effet réseau » : certaines pages deviennent importants, sont exploitées par d’autres, souvent d’une manière inattendue même pour l’auteur de l’original
41
Copyright © 2008, W3C ( 41 ) Ceci n’était pas une surprise…
42
Copyright © 2008, W3C ( 42 ) mais celui-ci, provenant de l’autre bout du Globe, en était une…
43
Copyright © 2008, W3C ( 43 ) Que veut dire tout cela pour le Web des données? Nous devrions être capable de « publier » les données sur le Web par des moyens standards en analogie avec les documents : donnons des URI aux données créer des liens aux URI-s à partir d’autres données (documents ou autres) une solution générique et standard devrait être utilisée les applications ne devraient pas être forcées de développer des approches différentes pour toutes sources de données et laissons l’effet réseau agir …
44
Copyright © 2008, W3C ( 44 ) Exemple : combiner des données Une compagnie pharmaceutique a une quantité importante de données sur son intranet dans des formats différents (XML, BdD,…) Courtesy of Nigel Wilkinson, Lee Harland, Pfizer Ltd, Melliyal Annamalai, Oracle (SWEO Case Study)(SWEO Case Study) Pour les réutiliser : les informations essentielles sont mises sur le Web par des moyens standards un outil public est utilisé pour l’intégration, la visualisation, la recherche
45
Copyright © 2008, W3C ( 45 ) En pratique, c’est un peu plus compliqué Sur le Web traditionnel l’humain est implicitement pris en compte : un lien a aussi un « contexte » qu’une personne peut reconnaître et utiliser
46
Copyright © 2008, W3C ( 46 ) Par exemple, l’adresse sur ma page
47
Copyright © 2008, W3C ( 47 ) … mène a la page suivante :
48
Copyright © 2008, W3C ( 48 ) L’humain comprend que ceci est la page d’accueil de mon institution Il saura, plus ou moins, que cela signifie un institut de recherche à Amsterdam Sur le Web des données il y a donc quelque chose qui manque : en soi, la machine ne comprend pas la signification du lien
49
Copyright © 2008, W3C ( 49 ) Une nouvelle contrainte : un élément d’information doit être ajoutée au lien : « ceci est un lien vers mon institution, un institut de recherche » cette information doit être accessible par la machine Ceci est, en fait, une classification (caractérisation) aussi bien du lien que de la page qui est liée en certain cas, cette classification peut permettre un forme limitée de raisonnement
50
Copyright © 2008, W3C ( 50 ) Mettons tout ensemble ! Pour un Web des données, nous avons besoin : de l’utilisation des URI-s pour publier nos données de permettre de créer des liens à partir des données vers d’autres données de caractériser/classifier les données et les liens pour transmettre un peu plus d’information d’utiliser des moyens standards pour tout cela !
51
Copyright © 2008, W3C ( 51 ) Exemple : trouver les experts chez NASA Il y a presque 70,000 fonctionnaires chez la NASA, répartis sur tous les États Unis Leur expertise est décrite dans 6-7 bases de données différentes, réparties sur tout le territoire des USA, avec des schémas, des structures, etc. tous différents … Problème : trouver les experts requis pour une tâche spécifique au sein de la NASA! Michael Grove, Clark & Parsia, LLC, and Andrew Schain, NASA, (SWEO Case Study)(SWEO Case Study)
52
Copyright © 2008, W3C ( 52 ) Exemple : trouver les experts chez NASA L’approche choisie : intégration standard des données, description des données et des liens avec des vocabulaires génériques Michael Grove, Clark & Parsia, LLC, and Andrew Schain, NASA, (SWEO Case Study)(SWEO Case Study)
53
Copyright © 2008, W3C ( 53 ) Mais qu’est ce que c’est le Web sémantique ?
54
Copyright © 2008, W3C ( 54 ) Un ensemble de technologies standards pour réaliser le Web des données
55
Copyright © 2008, W3C ( 55 ) C’est aussi simple que cela… Naturellement, les détails peuvent être compliqués un modèle commun doit être défini pour une structure des liens et pour les classifications pour un domaine spécifique, la classifications des termes peut être très compliquée : c’est là où les ontologies, les vocabulaires, etc, entrent en jeu
56
Copyright © 2008, W3C ( 56 ) Exemple : eTourism à Zaragoza Service d’itinéraire personnalisé Intégration de bases de données à Zaragoza (utilisant des ontologies) Utilisation d’un moteur de raisonnement Courtesy of Jesús Fernández, Municipality of Zaragoza, and Antonio Campos, CTIC (SWEO Use Case)(SWEO Use Case)
57
Copyright © 2008, W3C ( 57 ) Une minute ! Dois-je convertir toute mes données pour pouvoir fonctionner sur un Web des données ?
58
Copyright © 2008, W3C ( 58 ) Pas nécessairement ; ça ne serait pas toujours possible Il y a des technologies pour accéder aux données par des moyens standards sans les convertir des « ponts » (par exemple, ré-écriture des requêtes) annotations des données existantes (par exemple, des pages XHTML) Ces techniques sont encore en développement
59
Copyright © 2008, W3C ( 59 ) Exemple : intégration des connaissances de la médecine chinoise traditionnelle Intégration de plus de 80 bases de données Utilisation d’ontologies spécifiques Génération des interrogation en SQL « on the fly » Courtesy of Huajun Chen, Zhejiang University, (SWEO Case Study)(SWEO Case Study)
60
Copyright © 2008, W3C ( 60 ) Groupe d’intérêt de W3C pour la santé et les sciences du vivant La communauté « HCLS » se trouve en face de problèmes majeurs d’intégration recherche pharmaceutique, données médicales des patients, processus pour approuver de nouveaux médicaments,… La communauté avait besoin d’un lieu neutre pour discuter des problèmes techniques d’un contact plus direct avec la communauté du Web sémantique W3C avait besoin des contacts avec une communauté d’utilisateurs majeure de pouvoir ajuster les choix techniques au besoins pratiques, de bénéficier des expériences
61
Copyright © 2008, W3C ( 61 ) Groupe HCLS Développe des « expérimentations », des démonstrations pour prouver la fiabilité de la technologie le groupe est divisé en « task forces » pour se concentrer sur des problèmes différents Publie des notes, des articles, etc, sur le sujet Développe des stratégies de communication vers l’industrie (réunions, conférences, rencontres industrielles) Offre un forum de discussion pour les experts
62
Copyright © 2008, W3C ( 62 ) Démonstration HCLS : cibles pour la maladie d’Alzheimer Signal transduction pathways are considered to be rich in proteins that might respond to chemical therapy CA1 Pyramidal Neurons are known to be particularly damaged in Alzheimer’s disease Can we find candidate genes known to be involved in signal transduction and active in Pyramidal Neurons?
63
Copyright © 2008, W3C ( 63 ) Pour la réponse : intégration de données W3C HCLS IG a intégré un nombre de bases de données et d’ontologies publiques assigner un URI aux entités biologiques conversion ou accès aux données avec des techniques du Web sémantique (400M de relations en mai 2007) utilisation d’un moteur d’inférence pour trouver des nouvelles relations utilisation d’un langage d’interrogation pour répondre aux questions spécifiques
64
Copyright © 2008, W3C ( 64 ) Les bases de données
65
Copyright © 2008, W3C ( 65 ) Utilisation du langage d’interrogation… prefix go: prefix rdfs: prefix owl: prefix mesh: prefix sc: prefix ro: select ?genename ?processname where { graph { ?paper ?p mesh:D017966. ?article sc:identified_by_pmid ?paper. ?gene sc:describes_gene_or_gene_product_mentioned_by ?article. } graph { ?protein rdfs:subClassOf ?res. ?res owl:onProperty ro:has_function. ?res owl:someValuesFrom ?res2. ?res2 owl:onProperty ro:realized_as. ?res2 owl:someValuesFrom ?process. graph {{?process go:GO_0007166} union {?process rdfs:subClassOf go:GO_0007166 }} ?protein rdfs:subClassOf ?parent. ?parent owl:equivalentClass ?res3. ?res3 owl:hasValue ?gene. } graph { ?gene rdfs:label ?genename } graph { ?process rdfs:label ?processname} } prefix go: prefix rdfs: prefix owl: prefix mesh: prefix sc: prefix ro: select ?genename ?processname where { graph { ?paper ?p mesh:D017966. ?article sc:identified_by_pmid ?paper. ?gene sc:describes_gene_or_gene_product_mentioned_by ?article. } graph { ?protein rdfs:subClassOf ?res. ?res owl:onProperty ro:has_function. ?res owl:someValuesFrom ?res2. ?res2 owl:onProperty ro:realized_as. ?res2 owl:someValuesFrom ?process. graph {{?process go:GO_0007166} union {?process rdfs:subClassOf go:GO_0007166 }} ?protein rdfs:subClassOf ?parent. ?parent owl:equivalentClass ?res3. ?res3 owl:hasValue ?gene. } graph { ?gene rdfs:label ?genename } graph { ?process rdfs:label ?processname} } Mesh: Pyramidal Neurons Pubmed: Journal Articles Entrez Gene: Genes GO: Signal Transduction Courtesy of Susie Stephens, Eli Lilly, Alan Ruttenberg, Science Commons, and the W3C HCLS IG
66
Copyright © 2008, W3C ( 66 ) Tout ceci produit des réponses… DRD1, 1812adenylate cyclase activation ADRB2, 154adenylate cyclase activation ADRB2, 154arrestin mediated desensitization of G-protein coupled receptor protein signaling pathway DRD1IP, 50632dopamine receptor signaling pathway DRD1, 1812dopamine receptor, adenylate cyclase activating pathway DRD2, 1813dopamine receptor, adenylate cyclase inhibiting pathway GRM7, 2917G-protein coupled receptor protein signaling pathway GNG3, 2785G-protein coupled receptor protein signaling pathway GNG12, 55970G-protein coupled receptor protein signaling pathway DRD2, 1813G-protein coupled receptor protein signaling pathway ADRB2, 154G-protein coupled receptor protein signaling pathway CALM3, 808G-protein coupled receptor protein signaling pathway HTR2A, 3356G-protein coupled receptor protein signaling pathway DRD1, 1812G-protein signaling, coupled to cyclic nucleotide second messenger SSTR5, 6755G-protein signaling, coupled to cyclic nucleotide second messenger MTNR1A, 4543G-protein signaling, coupled to cyclic nucleotide second messenger CNR2, 1269G-protein signaling, coupled to cyclic nucleotide second messenger HTR6, 3362G-protein signaling, coupled to cyclic nucleotide second messenger GRIK2, 2898glutamate signaling pathway GRIN1, 2902glutamate signaling pathway GRIN2A, 2903glutamate signaling pathway GRIN2B, 2904glutamate signaling pathway ADAM10, 102integrin-mediated signaling pathway GRM7, 2917negative regulation of adenylate cyclase activity LRP1, 4035negative regulation of Wnt receptor signaling pathway ADAM10, 102Notch receptor processing ASCL1, 429Notch signaling pathway HTR2A, 3356serotonin receptor signaling pathway ADRB2, 154transmembrane receptor protein tyrosine kinase activation (dimerization) PTPRG, 5793transmembrane receptor protein tyrosine kinase signaling pathway EPHA4, 2043transmembrane receptor protein tyrosine kinase signaling pathway NRTN, 4902transmembrane receptor protein tyrosine kinase signaling pathway CTNND1, 1500Wnt receptor signaling pathway DRD1, 1812adenylate cyclase activation ADRB2, 154adenylate cyclase activation ADRB2, 154arrestin mediated desensitization of G-protein coupled receptor protein signaling pathway DRD1IP, 50632dopamine receptor signaling pathway DRD1, 1812dopamine receptor, adenylate cyclase activating pathway DRD2, 1813dopamine receptor, adenylate cyclase inhibiting pathway GRM7, 2917G-protein coupled receptor protein signaling pathway GNG3, 2785G-protein coupled receptor protein signaling pathway GNG12, 55970G-protein coupled receptor protein signaling pathway DRD2, 1813G-protein coupled receptor protein signaling pathway ADRB2, 154G-protein coupled receptor protein signaling pathway CALM3, 808G-protein coupled receptor protein signaling pathway HTR2A, 3356G-protein coupled receptor protein signaling pathway DRD1, 1812G-protein signaling, coupled to cyclic nucleotide second messenger SSTR5, 6755G-protein signaling, coupled to cyclic nucleotide second messenger MTNR1A, 4543G-protein signaling, coupled to cyclic nucleotide second messenger CNR2, 1269G-protein signaling, coupled to cyclic nucleotide second messenger HTR6, 3362G-protein signaling, coupled to cyclic nucleotide second messenger GRIK2, 2898glutamate signaling pathway GRIN1, 2902glutamate signaling pathway GRIN2A, 2903glutamate signaling pathway GRIN2B, 2904glutamate signaling pathway ADAM10, 102integrin-mediated signaling pathway GRM7, 2917negative regulation of adenylate cyclase activity LRP1, 4035negative regulation of Wnt receptor signaling pathway ADAM10, 102Notch receptor processing ASCL1, 429Notch signaling pathway HTR2A, 3356serotonin receptor signaling pathway ADRB2, 154transmembrane receptor protein tyrosine kinase activation (dimerization) PTPRG, 5793transmembrane receptor protein tyrosine kinase signaling pathway EPHA4, 2043transmembrane receptor protein tyrosine kinase signaling pathway NRTN, 4902transmembrane receptor protein tyrosine kinase signaling pathway CTNND1, 1500Wnt receptor signaling pathway Many of the genes are indeed related to Alzheimer’s Disease through gamma secretase (presenilin) activity Courtesy of Susie Stephens, Eli Lilly, Alan Ruttenberg, Science Commons, and the W3C HCLS IG
67
Copyright © 2008, W3C ( 67 ) L’essentiel… L’essentiel de la démonstration était l’accès et l’intégration des données publiques par le biais du Web sémantique
Présentations similaires
© 2024 SlidePlayer.fr Inc.
All rights reserved.