Qu’est-ce le Web sémantique? Ivan Herman, W3C. Copyright © 2008, W3C ‏ (2)(2) Organisons un voyage à Budapest en utilisant le Web!

Slides:



Advertisements
Présentations similaires
Bibliothèque Centrale de l’École Polytechnique Session pratique Recherches documentaires en sciences dures PSC 2011 septembre/octobre 2011 Denis Roura,
Advertisements

AID - Recherches - Stéphanie Vial & Patrick Johner Page 1 Journée 6 Pour une veille documentaire ou bibliographique.
Les systèmes d'information 1- Une pratique quotidienne 2- Les données 3- Approche conceptuelle 4- Notion de serveur 5- Conception d'un système d'information.
Formation web sémantique J.M. Vanel RDF, RDF Schema, SPARQL, OWL, Modélisation, moteurs de règles Licence Creative Commons.
Le système Raid 5 Table des matières Qu'est ce que le RAID ? Les objectifs Le raid 5 Les avantages et les inconvénients Les composants d’un Raid.
Qu'est-ce que c'est pour vous la veille informationnelle ?
Les outils de veille Par Andrée-Anne Bernier. Whole food Market J’ai choisi Whole Food Market, une entreprise d’alimentation biologique, végétalienne,
Eléments clés à prendre en considération
Téléchargement de fichiers
Rechercher des articles et des sites web
Faites le bilan Après la lecture d’un long texte qui était accompagné de divers exercices pour vous préparer à des contrôles ou même au bac, vous devriez.
SAVOIRS 2.0 Ouverture du savoir scientifique et du terrain pour une didactique de collaboration E. Duplàa, M.J. Berger.
Bases de données multimédia
COLLEGE LES GORGUETTES CASSIS
Initiation aux bases de données et à la programmation événementielle
Se connecter toujours depuis TecfaMoodle
Monsieur Jourdain du Web de données
Présentation du site
Forum des Industries de la Langue, 17 mars 2010
OWL-S.
Chiffrement de bout en bout
Informatique et Sciences du Numérique
Socle commun et livret personnel de compétences
Clients riches RIA (Rich Internet Application) / RDA
Interaction avec une base de données
BFFA – M 4-5 Lausanne - David Savoy
Technologies de l’intelligence d’affaires
BTN SERVICE ET COMMERCIALISATON – PRESENTATION DES EPREUVES PRATIQUES 2 ateliers oraux et 1 service d’une table au restaurant.
Site Internet du Minizap
Créez votre entreprise
Réalisation d’une application web sous le thème: «Mon vétérinaire » par : Benzineb Asmaa et Meftahi Oualid Présentation à Université Saad Dahlab Blida.
Août 2009.
Socle commun et livret personnel de compétences
REVUE DE LITTERATURE. Introduction Première partie majeure dans la rédaction du mémoire, la réalisation d’une revue de littérature consiste à effectuer.
Présentation initiale
Démystifier le marché caché Natalie Bourgeois et Sasha Kennedy.
Structuration du contenu
Maladie d’Alzheimer et maladies apparentées - Éducation pour la santé du patient - Formation de soignants Module 3 Construire des projets ensemble : principes.
Chapitre2: SGBD et Datawarehouse. On pourrait se demander pourquoi ne pas utiliser un SGBD pour réaliser cette structure d'informatique décisionnelle.
Education & Sensibilisation dans les Sanctuaires PASA
« Remplir les connaissances dans une tête vide »
SUMEHR 20 septembre 2017.
Socle commun et livret personnel de compétences
Linked Data – les données sur le web pourquoi et comment?
La gestion des habilitations par le partenaire
Socle commun et livret personnel de compétences
Socle commun et livret personnel de compétences
Socle commun et livret personnel de compétences
Socle commun et livret personnel de compétences
SOIREE THEMATIQUE + Synthèse du débat
Sujet: Communication externe et ses outils. PLAN INTRODUCTION CHAPITRE I: Communication externe 1. Définition et types de com. externe 2. objectifs de.
Internet : Informations personnelles et identité numérique
La collecte d’informations Présenté par: Boudries. S.
3- Nouvelles pages d’accueil
Socle commun et livret personnel de compétences
Socle commun et livret personnel de compétences
ATELIER DE FORMATION DES UTILISATEURS DE STATISTIQUES
Socle commun et livret personnel de compétences
Formation: Paramétrage pour l’accès du patient à ses données de santé
Notions d'architecture client-serveur. Présentation de l'architecture d'un système client/serveur Des machines clientes contactent un serveur qui leur.
Préparation à la Certification du PMP® (Project Management Professional) Référence du Corpus des connaissances en Management de Projet 5 eme Edition Quelques.
Tableau de bord d’un système de recommandation
Caractéristiques d‘un projet Espace Alpin de qualité
TELIERS NUMERIQUES.
Utilisation des arts visuels à des fins d’enseignement scolaire
ScienceDirect Guide d’utilisation de la base de données : ScienceDirect Pr R. EL OUAHBI.
2.5. La réorientation des prospects Textes de référence Exigence de la norme AFNOR NF X §3.2 « c) Assurer un accueil physique et/ou téléphonique.
Socle commun et livret personnel de compétences
Transcription de la présentation:

Qu’est-ce le Web sémantique? Ivan Herman, W3C

Copyright © 2008, W3C ‏ (2)(2) Organisons un voyage à Budapest en utilisant le Web!

Copyright © 2008, W3C ‏ (3)(3) On essaye de trouver un vol approprié avec …

Copyright © 2008, W3C ‏ (4)(4) … une grosse compagnie réputée, ou …

Copyright © 2008, W3C ‏ (5)(5) … la compagnie du pays de destination, ou …

Copyright © 2008, W3C ‏ (6)(6) … une compagnie low cost

Copyright © 2008, W3C ‏ (7)(7) Nous devons aussi trouver un hôtel, donc on essaye de trouver…

Copyright © 2008, W3C ‏ (8)(8) … un hôtel très bon marché, ou …

Copyright © 2008, W3C ‏ (9)(9) … un hôtel de luxe, ou …

Copyright © 2008, W3C ‏ ( 10 ) … un hôtel abordable mais correct …

Copyright © 2008, W3C ‏ ( 11 ) aïe, ce site pose un problème, c’est en Hongrois, une langue que presque personne ne comprend ; mais…

Copyright © 2008, W3C ‏ ( 12 ) … celui-ci devrait aller

Copyright © 2008, W3C ‏ ( 13 ) Naturellement, nous pouvons aussi nous fier à un site spécialisé…

Copyright © 2008, W3C ‏ ( 14 ) … comme celui-ci, ou…

Copyright © 2008, W3C ‏ ( 15 ) … celui-là

Copyright © 2008, W3C ‏ ( 16 ) Vous voudriez, peut-être, avoir une idée de Budapest avant d’y aller ; essayons de trouver des photos…

Copyright © 2008, W3C ‏ ( 17 ) … sur flickr …

Copyright © 2008, W3C ‏ ( 18 ) … sur Google …

Copyright © 2008, W3C ‏ ( 19 ) … vous pouvez aussi regarder mes photos

Copyright © 2008, W3C ‏ ( 20 ) …ou consulter un site (social) de voyages

Copyright © 2008, W3C ‏ ( 21 ) Qu’avons nous fait ? Nous avons consulté un nombre de sites de styles différents créés pour des utilisations différentes, peut- être même dans des langues différentes… Nous avons dû intégrer toutes ces informations pour arriver à notre but Nous savons tous que, dans certains cas, il s’agit là d’un processus long et fatigant !

Copyright © 2008, W3C ‏ ( 22 ) En fait, toutes ces pages ne sont que les parties visibles de l’iceberg ! En effet : les vrais données sont cachées dans des bases de données, des fichiers XML, des pages Excel… nous avons accès uniquement à ce que les concepteurs des sites nous laissent voir

Copyright © 2008, W3C ‏ ( 23 ) Les sites spécialisées (Expedia, TripAdvisor) font un peu plus : ils collectent et combinent des données de sources diverses mais ils continuent a contrôler ce que l’utilisateur peut voir Dans certains cas, vous voudriez personnaliser : c’est à dire, accéder aux données et les combiner vous-même !

Copyright © 2008, W3C ‏ ( 24 ) Voici un exemple…

Copyright © 2008, W3C ‏ ( 25 ) Des compagnies utilisatrices sont contraintes à embaucher des experts pour manier ce genres de bases de données !

Copyright © 2008, W3C ‏ ( 26 ) Un autre exemple : les sites sociaux. J’ai une liste « d’amis » sur…

Copyright © 2008, W3C ‏ ( 27 ) … Dopplr,

Copyright © 2008, W3C ‏ ( 28 ) … Twine,

Copyright © 2008, W3C ‏ ( 29 ) … LinkedIn,

Copyright © 2008, W3C ‏ ( 30 ) … et, naturellement, Facebook

Copyright © 2008, W3C ‏ ( 31 ) J’ai dû re-ajouter et re-contacter mes amis pour tous les sites, indépendamment l’un de l’autre Ceci est même pire qu’avant : c’est moi qui ajoute à l’iceberg, mais je n’ai pas nécessairement accès à mes propre données…

Copyright © 2008, W3C ‏ ( 32 ) Que voudrions-nous avoir ? Pouvoir utiliser les données sur le Web comme nous utilisons les documents : pouvoir créer des liens à des données (indépendamment de leur présentation) pouvoir utiliser les données comme nous le voulons sur nos sites et programmes sur le Web

Copyright © 2008, W3C ‏ ( 33 ) En d’autres termes… Nous voudrions élargir le Web actuel pour arriver à un « Web des données » permettre aux applications d’exploiter les données directement

Copyright © 2008, W3C ‏ ( 34 ) Une minute ! N’est-ce pas ce que les « mashups » font déjà ?

Copyright © 2008, W3C ‏ ( 35 ) Un exemple d’un « mashup » :

Copyright © 2008, W3C ‏ ( 36 ) D’un certain sens oui, et cela montre le potentiel énorme du Web des données Mais ces sites sont contraints à faire un travail ad- hoc : les données ne sont souvent accessibles que par le biais de services tous ont des APIs, des logiques, des structures différentes pour toutes nouvelles données, les sites doivent recommencer à zéro, parce qu’il n’existe aucun moyen standard pour accéder aux données

Copyright © 2008, W3C ‏ ( 37 ) En d’autre termes … Nous voudrions élargir le Web actuel pour arriver à un « Web des données » par des moyens standards

Copyright © 2008, W3C ‏ ( 38 ) Mais qu’est-ce que cela veut dire en pratique ? Comment fonctionne le Web actuel ? des document sont créés ils reçoivent une adresse (un URI) et ils sont mis à disposition sur le Web

Copyright © 2008, W3C ‏ ( 39 ) Un exemple : le site de Steven sur Amsterdam (créé pour des amis)

Copyright © 2008, W3C ‏ ( 40 ) Puis vient la magie… D’autres découvrent le site et ils s’y « lient » Plus il y a ce genre de liens, plus la page est importante, donc plus la page est connu c’est l’essentiel du fonctionnement de Google ! C’est « l’effet réseau » : certaines pages deviennent importants, sont exploitées par d’autres, souvent d’une manière inattendue même pour l’auteur de l’original

Copyright © 2008, W3C ‏ ( 41 ) Ceci n’était pas une surprise…

Copyright © 2008, W3C ‏ ( 42 ) mais celui-ci, provenant de l’autre bout du Globe, en était une…

Copyright © 2008, W3C ‏ ( 43 ) Que veut dire tout cela pour le Web des données? Nous devrions être capable de « publier » les données sur le Web par des moyens standards en analogie avec les documents : donnons des URI aux données créer des liens aux URI-s à partir d’autres données (documents ou autres) une solution générique et standard devrait être utilisée les applications ne devraient pas être forcées de développer des approches différentes pour toutes sources de données et laissons l’effet réseau agir …

Copyright © 2008, W3C ‏ ( 44 ) Exemple : combiner des données Une compagnie pharmaceutique a une quantité importante de données sur son intranet dans des formats différents (XML, BdD,…) Courtesy of Nigel Wilkinson, Lee Harland, Pfizer Ltd, Melliyal Annamalai, Oracle (SWEO Case Study)(SWEO Case Study) Pour les réutiliser : les informations essentielles sont mises sur le Web par des moyens standards un outil public est utilisé pour l’intégration, la visualisation, la recherche

Copyright © 2008, W3C ‏ ( 45 ) En pratique, c’est un peu plus compliqué Sur le Web traditionnel l’humain est implicitement pris en compte : un lien a aussi un « contexte » qu’une personne peut reconnaître et utiliser

Copyright © 2008, W3C ‏ ( 46 ) Par exemple, l’adresse sur ma page

Copyright © 2008, W3C ‏ ( 47 ) … mène a la page suivante :

Copyright © 2008, W3C ‏ ( 48 ) L’humain comprend que ceci est la page d’accueil de mon institution Il saura, plus ou moins, que cela signifie un institut de recherche à Amsterdam Sur le Web des données il y a donc quelque chose qui manque : en soi, la machine ne comprend pas la signification du lien

Copyright © 2008, W3C ‏ ( 49 ) Une nouvelle contrainte : un élément d’information doit être ajoutée au lien : « ceci est un lien vers mon institution, un institut de recherche » cette information doit être accessible par la machine Ceci est, en fait, une classification (caractérisation) aussi bien du lien que de la page qui est liée en certain cas, cette classification peut permettre un forme limitée de raisonnement

Copyright © 2008, W3C ‏ ( 50 ) Mettons tout ensemble ! Pour un Web des données, nous avons besoin : de l’utilisation des URI-s pour publier nos données de permettre de créer des liens à partir des données vers d’autres données de caractériser/classifier les données et les liens pour transmettre un peu plus d’information d’utiliser des moyens standards pour tout cela !

Copyright © 2008, W3C ‏ ( 51 ) Exemple : trouver les experts chez NASA Il y a presque 70,000 fonctionnaires chez la NASA, répartis sur tous les États Unis Leur expertise est décrite dans 6-7 bases de données différentes, réparties sur tout le territoire des USA, avec des schémas, des structures, etc. tous différents … Problème : trouver les experts requis pour une tâche spécifique au sein de la NASA! Michael Grove, Clark & Parsia, LLC, and Andrew Schain, NASA, (SWEO Case Study)(SWEO Case Study)

Copyright © 2008, W3C ‏ ( 52 ) Exemple : trouver les experts chez NASA L’approche choisie : intégration standard des données, description des données et des liens avec des vocabulaires génériques Michael Grove, Clark & Parsia, LLC, and Andrew Schain, NASA, (SWEO Case Study)(SWEO Case Study)

Copyright © 2008, W3C ‏ ( 53 ) Mais qu’est ce que c’est le Web sémantique ?

Copyright © 2008, W3C ‏ ( 54 ) Un ensemble de technologies standards pour réaliser le Web des données

Copyright © 2008, W3C ‏ ( 55 ) C’est aussi simple que cela… Naturellement, les détails peuvent être compliqués un modèle commun doit être défini pour une structure des liens et pour les classifications pour un domaine spécifique, la classifications des termes peut être très compliquée : c’est là où les ontologies, les vocabulaires, etc, entrent en jeu

Copyright © 2008, W3C ‏ ( 56 ) Exemple : eTourism à Zaragoza Service d’itinéraire personnalisé Intégration de bases de données à Zaragoza (utilisant des ontologies) Utilisation d’un moteur de raisonnement Courtesy of Jesús Fernández, Municipality of Zaragoza, and Antonio Campos, CTIC (SWEO Use Case)(SWEO Use Case)

Copyright © 2008, W3C ‏ ( 57 ) Une minute ! Dois-je convertir toute mes données pour pouvoir fonctionner sur un Web des données ?

Copyright © 2008, W3C ‏ ( 58 ) Pas nécessairement ; ça ne serait pas toujours possible Il y a des technologies pour accéder aux données par des moyens standards sans les convertir des « ponts » (par exemple, ré-écriture des requêtes) annotations des données existantes (par exemple, des pages XHTML) Ces techniques sont encore en développement

Copyright © 2008, W3C ‏ ( 59 ) Exemple : intégration des connaissances de la médecine chinoise traditionnelle Intégration de plus de 80 bases de données Utilisation d’ontologies spécifiques Génération des interrogation en SQL « on the fly » Courtesy of Huajun Chen, Zhejiang University, (SWEO Case Study)(SWEO Case Study)

Copyright © 2008, W3C ‏ ( 60 ) Groupe d’intérêt de W3C pour la santé et les sciences du vivant La communauté « HCLS » se trouve en face de problèmes majeurs d’intégration recherche pharmaceutique, données médicales des patients, processus pour approuver de nouveaux médicaments,… La communauté avait besoin d’un lieu neutre pour discuter des problèmes techniques d’un contact plus direct avec la communauté du Web sémantique W3C avait besoin des contacts avec une communauté d’utilisateurs majeure de pouvoir ajuster les choix techniques au besoins pratiques, de bénéficier des expériences

Copyright © 2008, W3C ‏ ( 61 ) Groupe HCLS Développe des « expérimentations », des démonstrations pour prouver la fiabilité de la technologie le groupe est divisé en « task forces » pour se concentrer sur des problèmes différents Publie des notes, des articles, etc, sur le sujet Développe des stratégies de communication vers l’industrie (réunions, conférences, rencontres industrielles) Offre un forum de discussion pour les experts

Copyright © 2008, W3C ‏ ( 62 ) Démonstration HCLS : cibles pour la maladie d’Alzheimer Signal transduction pathways are considered to be rich in proteins that might respond to chemical therapy CA1 Pyramidal Neurons are known to be particularly damaged in Alzheimer’s disease Can we find candidate genes known to be involved in signal transduction and active in Pyramidal Neurons?

Copyright © 2008, W3C ‏ ( 63 ) Pour la réponse : intégration de données W3C HCLS IG a intégré un nombre de bases de données et d’ontologies publiques assigner un URI aux entités biologiques conversion ou accès aux données avec des techniques du Web sémantique (400M de relations en mai 2007) utilisation d’un moteur d’inférence pour trouver des nouvelles relations utilisation d’un langage d’interrogation pour répondre aux questions spécifiques

Copyright © 2008, W3C ‏ ( 64 ) Les bases de données

Copyright © 2008, W3C ‏ ( 65 ) Utilisation du langage d’interrogation… prefix go: prefix rdfs: prefix owl: prefix mesh: prefix sc: prefix ro: select ?genename ?processname where { graph { ?paper ?p mesh:D ?article sc:identified_by_pmid ?paper. ?gene sc:describes_gene_or_gene_product_mentioned_by ?article. } graph { ?protein rdfs:subClassOf ?res. ?res owl:onProperty ro:has_function. ?res owl:someValuesFrom ?res2. ?res2 owl:onProperty ro:realized_as. ?res2 owl:someValuesFrom ?process. graph {{?process go:GO_ } union {?process rdfs:subClassOf go:GO_ }} ?protein rdfs:subClassOf ?parent. ?parent owl:equivalentClass ?res3. ?res3 owl:hasValue ?gene. } graph { ?gene rdfs:label ?genename } graph { ?process rdfs:label ?processname} } prefix go: prefix rdfs: prefix owl: prefix mesh: prefix sc: prefix ro: select ?genename ?processname where { graph { ?paper ?p mesh:D ?article sc:identified_by_pmid ?paper. ?gene sc:describes_gene_or_gene_product_mentioned_by ?article. } graph { ?protein rdfs:subClassOf ?res. ?res owl:onProperty ro:has_function. ?res owl:someValuesFrom ?res2. ?res2 owl:onProperty ro:realized_as. ?res2 owl:someValuesFrom ?process. graph {{?process go:GO_ } union {?process rdfs:subClassOf go:GO_ }} ?protein rdfs:subClassOf ?parent. ?parent owl:equivalentClass ?res3. ?res3 owl:hasValue ?gene. } graph { ?gene rdfs:label ?genename } graph { ?process rdfs:label ?processname} } Mesh: Pyramidal Neurons Pubmed: Journal Articles Entrez Gene: Genes GO: Signal Transduction Courtesy of Susie Stephens, Eli Lilly, Alan Ruttenberg, Science Commons, and the W3C HCLS IG

Copyright © 2008, W3C ‏ ( 66 ) Tout ceci produit des réponses… DRD1, 1812adenylate cyclase activation ADRB2, 154adenylate cyclase activation ADRB2, 154arrestin mediated desensitization of G-protein coupled receptor protein signaling pathway DRD1IP, 50632dopamine receptor signaling pathway DRD1, 1812dopamine receptor, adenylate cyclase activating pathway DRD2, 1813dopamine receptor, adenylate cyclase inhibiting pathway GRM7, 2917G-protein coupled receptor protein signaling pathway GNG3, 2785G-protein coupled receptor protein signaling pathway GNG12, 55970G-protein coupled receptor protein signaling pathway DRD2, 1813G-protein coupled receptor protein signaling pathway ADRB2, 154G-protein coupled receptor protein signaling pathway CALM3, 808G-protein coupled receptor protein signaling pathway HTR2A, 3356G-protein coupled receptor protein signaling pathway DRD1, 1812G-protein signaling, coupled to cyclic nucleotide second messenger SSTR5, 6755G-protein signaling, coupled to cyclic nucleotide second messenger MTNR1A, 4543G-protein signaling, coupled to cyclic nucleotide second messenger CNR2, 1269G-protein signaling, coupled to cyclic nucleotide second messenger HTR6, 3362G-protein signaling, coupled to cyclic nucleotide second messenger GRIK2, 2898glutamate signaling pathway GRIN1, 2902glutamate signaling pathway GRIN2A, 2903glutamate signaling pathway GRIN2B, 2904glutamate signaling pathway ADAM10, 102integrin-mediated signaling pathway GRM7, 2917negative regulation of adenylate cyclase activity LRP1, 4035negative regulation of Wnt receptor signaling pathway ADAM10, 102Notch receptor processing ASCL1, 429Notch signaling pathway HTR2A, 3356serotonin receptor signaling pathway ADRB2, 154transmembrane receptor protein tyrosine kinase activation (dimerization) PTPRG, 5793transmembrane receptor protein tyrosine kinase signaling pathway EPHA4, 2043transmembrane receptor protein tyrosine kinase signaling pathway NRTN, 4902transmembrane receptor protein tyrosine kinase signaling pathway CTNND1, 1500Wnt receptor signaling pathway DRD1, 1812adenylate cyclase activation ADRB2, 154adenylate cyclase activation ADRB2, 154arrestin mediated desensitization of G-protein coupled receptor protein signaling pathway DRD1IP, 50632dopamine receptor signaling pathway DRD1, 1812dopamine receptor, adenylate cyclase activating pathway DRD2, 1813dopamine receptor, adenylate cyclase inhibiting pathway GRM7, 2917G-protein coupled receptor protein signaling pathway GNG3, 2785G-protein coupled receptor protein signaling pathway GNG12, 55970G-protein coupled receptor protein signaling pathway DRD2, 1813G-protein coupled receptor protein signaling pathway ADRB2, 154G-protein coupled receptor protein signaling pathway CALM3, 808G-protein coupled receptor protein signaling pathway HTR2A, 3356G-protein coupled receptor protein signaling pathway DRD1, 1812G-protein signaling, coupled to cyclic nucleotide second messenger SSTR5, 6755G-protein signaling, coupled to cyclic nucleotide second messenger MTNR1A, 4543G-protein signaling, coupled to cyclic nucleotide second messenger CNR2, 1269G-protein signaling, coupled to cyclic nucleotide second messenger HTR6, 3362G-protein signaling, coupled to cyclic nucleotide second messenger GRIK2, 2898glutamate signaling pathway GRIN1, 2902glutamate signaling pathway GRIN2A, 2903glutamate signaling pathway GRIN2B, 2904glutamate signaling pathway ADAM10, 102integrin-mediated signaling pathway GRM7, 2917negative regulation of adenylate cyclase activity LRP1, 4035negative regulation of Wnt receptor signaling pathway ADAM10, 102Notch receptor processing ASCL1, 429Notch signaling pathway HTR2A, 3356serotonin receptor signaling pathway ADRB2, 154transmembrane receptor protein tyrosine kinase activation (dimerization) PTPRG, 5793transmembrane receptor protein tyrosine kinase signaling pathway EPHA4, 2043transmembrane receptor protein tyrosine kinase signaling pathway NRTN, 4902transmembrane receptor protein tyrosine kinase signaling pathway CTNND1, 1500Wnt receptor signaling pathway Many of the genes are indeed related to Alzheimer’s Disease through gamma secretase (presenilin) activity Courtesy of Susie Stephens, Eli Lilly, Alan Ruttenberg, Science Commons, and the W3C HCLS IG

Copyright © 2008, W3C ‏ ( 67 ) L’essentiel… L’essentiel de la démonstration était l’accès et l’intégration des données publiques par le biais du Web sémantique