La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

LUSSI Department Les Métadonnées S. Garlatti. LUSSI Department PLAN Introduction Méta-data before SW Purpose of Metadata? Why is metadata important? Metadata.

Présentations similaires


Présentation au sujet: "LUSSI Department Les Métadonnées S. Garlatti. LUSSI Department PLAN Introduction Méta-data before SW Purpose of Metadata? Why is metadata important? Metadata."— Transcription de la présentation:

1 LUSSI Department Les Métadonnées S. Garlatti

2 LUSSI Department PLAN Introduction Méta-data before SW Purpose of Metadata? Why is metadata important? Metadata Categories Metadata Features Examples of Metadata Schema Enhancement of Metadata Approach

3 LUSSI Department Problématique Recherche dinformation sur Internet Internet est une immense source dinformation en constante évolution. Il est très difficile, voire même impossible de trouver linformation pertinente, à laide des moteurs de recherche classique – type Google. Contexte: recherche dinformation par des utilisateurs, non par des machines Cest lutilisateur qui interprète les résultas et reconnaît les documents pertinents. Cest lui qui leur associe un SENS !

4 LUSSI Department Problématique Mesures en recherche dinformation Précision = |R P| |R| Rappel = |R P| |P| Documents retrouvés notés R Documents pertinents notés P

5 LUSSI Department Problématique Si lon manque de nombreuses informations pertinentes, on obtient un rappel faible. Rappel = |R P| |P| Si lon est submergé par de très nombreuses information, on obtient une faible précision. Précision = |R P| |R| R P R P

6 LUSSI Department Problématique Dans certains cas, il est nécessaire davoir un très bon critère de rappel : recherche de brevets par exemple. Dans dautres cas, lutilisateur désire obtenir un faible nombre de documents pertinents. Il est prêt à parcourir une douzaine de résultats pour les identifier. Des facteurs de 10-20% pour le rappel et la précision sont acceptables dans de nombreux cas

7 LUSSI Department Problématique Moteur de recherche sur Internet Le facteur précision est bien souvent inférieur à 1% Moteur de recherche ANZWERS sur lacronyme "IETF" (Internet Engineering Task Force) retrouvait 896,354 résultats au début Août Toutes les pages qui contenaient « IETF » de manière accidentelle étaient inclues dans les résultats. Moteur Google : « Course » & « metadata » produits toutes les pages qui contiennent « of course » avec ou sans « metadata » Aucun moyen de faire la différence entre les mots importants et les autres qui ne sont pas représentatif de la ressource pour lobjectif courant de lutilisateur.

8 LUSSI Department Rôles des métadonnées Recherche dinformation Dans un contexte traditionnel ou sur Internet, un point clé des métadonnées est de faciliter et daméliorer la recherche dinformation. Les métadonnées sont un moyen pour rendre la recherche dinformation plus efficace et plus ciblée. Elles permettent un contrôle plus précis des outils de recherche dinformation. Les métadonnées fournissent aux moteurs de recherche des informations spécialisées et structurées sur les sites.

9 LUSSI Department Rôles des métadonnées Réutilisation, partage et échange Les métadonnées doivent fournir les informations nécessaires à la réutilisation des informations Elles déterminent les conditions et les contextes pour cette réutilisation Par des utilisateurs, cest eux qui assurent linterprétation de ces données Par des machines, cest elles qui assurent linterprétation et qui automatisent partiellement ou totalement cette réutilisation Par les deux, certains champs de méta données seront dédiés à lutilisateur ou à la machine.

10 LUSSI Department Rôles des métadonnées Faciliter la gestion et larchivage Informer sur le cycle de vie des documents Gérer des collections de ressources Gérer des archivages électroniques Gérer et protéger les droits Les droits de propriété intellectuelle Les droits daccès à des pages web (restriction de consultation) Authentifier un document : signature électronique

11 LUSSI Department Rôles des métadonnées En effet, c'est en 1841 que Sir Anthony Panizzi (Antonio pour ses intimes) publia ses fameuses 91 règles pour les besoins du catalogue du British Museum. Cette publication marque l'acte de naissance du catalogage moderne.

12 LUSSI Department Définition « Données sur des Données » Ambiguë: compris de manière différente par différentes communautés qui conçoivent, créent, décrivent, préservent et utilisent des systèmes dinformation et des ressources Jusquen 1995, métadonnées était un terme surtout utilisé par des communautés impliquées dans la gestion et linteropérabilité de données géo spatiales et dans la gestion de données et la conception et la maintenance de systèmes

13 LUSSI Department Définition « Tout ce qui peut être dit sur un objet dinformation quelque soit le niveau dagrégation. » Un objet dinformation est toute entité qui peut être adressée et manipulée par un système ou une personne comme un objet discret. Objet simple ou atomique ou un agrégat dentités « Métadonnées » peut aussi être compris comme une extension des pratiques de catalogage bibliographique traditionnel.

14 LUSSI Department Définition Projet britannique DESIRE, « Ce sont des données associées à des objets qui libèrent les usagers potentiels de la nécessité de connaître à l'avance leur existence et leurs caractéristiques » En bref, les métadonnées sont des informations bibliographiques, des résumés, des termes d'indexation, des abstracts, des propriétés spécifiques, tout ce qui peut être un substitut au document original

15 LUSSI Department

16

17

18

19 Définition Associer une information exploitable à une ressource signifie deux choses essentielles. Information structur é e – utilisable – et descriptive – de la ressource, de son utilisation – afin de faciliter et d en am é liorer l acc è s La ressource existe et peut être exploit é e sur le Web ind é pendamment des informations qui lui sont associ é es dans le cadre du Web s é mantique : celles-ci sont utiles, mais non n é cessaires pour acc é der et utiliser la ressource, la page Web ou le service

20 LUSSI Department Définition Indexation : m é tadonn é es et annotations. Une m é tadonn é e est « une donn é e sur une donn é e ». Cette d é finition est un peu vague voire même ambigu ë, et elle est comprise de mani è re diff é rente par diff é rentes communaut é s qui con ç oivent, cr é ent, d é crivent, pr é servent et utilisent des syst è mes d information et des ressources. Une annotation est à la base une note critique ou explicative accompagnant un texte, et par extension, une quelconque marque de lecture port é e sur un document, que celui-ci soit textuel ou image.

21 LUSSI Department Définition Nous proposons ce distinguo : Une m é tadonn é e sera plutôt attach é e à une ressource identifi é e en tant que telle sur le web – aura plutôt une pertinence a priori et sera plutôt saisie suivant un sch é ma. Par exemple, la description normalis é e d un service web, l auteur d un document, qui permettront de mettre en place des inf é rences. Une annotation sera plus situ é e au sein de cette ressource et é crite au cours d un processus d annotation/lecture. Par exemple, un commentaire libre associ é à un fragment d une page web – quelques mots, un paragraphe – d é termin é au besoin.

22 LUSSI Department Définition Consid é rer les diff é rents types de m é tadonn é es (annotations) en fonction : Des types de ressources qu elles concernent, plus ou moins fragment é es, De la structuration plus ou moins forte de leur « sch é ma », Des tâches qu elles soutiennent (ou sous-tendent), De l automatisation plus ou moins marqu é e de leur mise en place, De l utilisation qui en est faite par les agents logiciels, plus ou moins « intelligente » ou par des utilisateurs.

23 LUSSI Department Définition Ressources Métadonnées Tâches utilisateurs

24 LUSSI Department Définition Composition de résumés vidéo à la demande Composition Résumé vidéo de 20 mn Films originaux......

25 LUSSI Department Définition Principes fondamentaux Contraintes utilisateur : durée du résumé Moteur de composition Espace dinformation : un seul évènement, plusieurs, Segmentation des films : choix, taille, etc. Indexation des fragments : choix et rôle des indexes Principes de sélection des fragments, Principes dorganisation des fragments Principes dassemblage des fragments Comment maintenir la cohérence de lensemble produit ?

26 LUSSI Department Définition Principes fondamentaux Espace dinformation : un spectacle, fragments de taille fixes : 2 mn. Sélection : les fragments les plus importants, critère qualitatif, un index « importance » muni de trois valeurs (faible, moyenne, forte) Filtrage : utilisation dun autre critère pour éliminer certains fragments afin de respecter la contrainte de temps Organisation: ordre chronologique des fragments Règle dassemblage pour obtenir une vidéo fluide de tous les fragments

27 LUSSI Department Définition Choix des m é tadonn é es ou annotations : Fonctionnalit é s et Objectifs utilisateur Type des ressources Remarquons que pour le Web s é mantique, on parlera le plus souvent de M é tadonn é es ou annotations s é mantiques. Deux possibilit é s d interpr é tation sont ici disponibles : « s é mantique » au sens de « s é mantique formelle », et puis au sens plus vague de « faisant sens dans le cadre d une tâche pour un utilisateur ».

28 LUSSI Department Métadonnées et recherche dinformation Amélioration de la qualité de la recherche Une métadonnée contient un ensemble dindexes structurés Un rôle et une fonction sont associés à chaque index Elle ne permet donc que laccès aux critères importants pour la ou les tâches de lutilisateur (recherche, réutilisation, protection, etc.) Auteur = Jules Ferry, date = 02/08/1880, format = pdf, taille = 1M0, sujet = république, laïque,

29 LUSSI Department Métadonnées et recherche dinformation Amélioration de la qualité de la recherche Les ressources hétérogènes peuvent être recherchées et traitées Les ressources complexes peuvent aussi être recherchées et traitées, dès quon leur associe des métadonnées Les ressources non « visibles » peuvent être accessibles dès que leurs métadonnées sont accessibles Protégées par des mots de passe, contenu dans des ressources complexes, etc.

30 LUSSI Department Quelques catégories de métadonnées Donner des exemples LOM ICCARS

31 LUSSI Department Quelques catégories de métadonnées Trois vues principales pour tout objet (A.J. Gilliland) Contenu : lié à ce que lobjet contient, intrinsèque à lobjet Contexte : indique qui, quoi, pourquoi, où, comment; aspects liés à la création de lobjet, extrinsèque à un objet Structure : liées aux associations à lintérieur où parmi les objets individuels, peut être intrinsèque ou extrinsèque à lobjet Musés, librairie, etc. ont utilisés intensivement des métadonnées pour améliorer laccès aux informations Musés: beaucoup travaillés sur le contexte

32 LUSSI Department Quelques catégories de métadonnées Trois catégories fonctionnelles (Wendler 99) Descriptive: facilitant la découverte de ressources et lidentification Administrative: supportant la gestion de ressources dans une collection Structurelle: liant ensemble des composants complexes dobjets dinformation Dautres catégorisations existent ou peuvent exister Dublin Core Metadata : descriptive

33 LUSSI Department Quelques catégories de métadonnées Administrative : utilisées pour la gestion et ladministration des ressources Acquisition de linformation Droits et reproduction Documentation des conditions daccès légaux Localisation de linformation Etc.

34 LUSSI Department Quelques catégories de métadonnées Descriptive : utilisée pour décrire ou identifier les ressources dinformation Enregistrement des entrées de « catalogage » Aides à la recherche Indexes spécialisés Hyperliens et relations entre les ressources Annotations (commentaires) par les utilisateurs Etc.

35 LUSSI Department Quelques catégories de métadonnées Technique : description du comportement du système et/ou des métadonnées Documentation sur le matériel et le logiciel Information de numérisation : formats, taux de compression, etc. Suivi des temps de réponse du système Données dauthentification et de sécurité : clés de cryptage, mots de passe.

36 LUSSI Department Quelques propriétés des métadonnées Les métadonnées peuvent être aussi des ressources dinformation. Une métadonnées peut être à la fois une description et une donnée : dépend de lusage qui en est fait Une critique de film: à un niveau, cest une métadonnée sur le film, elle se substitue à celui-ci ; à une autre niveau, cest une travail de littérature avec son auteur et ses propriétés intellectuelle. Une métadonnée nest pas nécessairement numérique.

37 LUSSI Department Quelques propriétés des métadonnées Niveau de granularité Métadonnée pour un objet atomique Une image, un texte, une vidéo Métadonnée pour un objet complexe Un site web, un livre électronique Métadonnée pour une partie dune ressource Un hyperlien, un paragraphe, une expression, une partie dimage, etc.

38 LUSSI Department Quelques propriétés des métadonnées Structure Standardisée MARC TEI et EAD LOOM, ARIADNE, Dublin Core, Local database formats Non standardisée Champs de textes libres

39 LUSSI Department Quelques propriétés des métadonnées Création Un humain (a créateur, professionnel de linformation, un utilisateur, etc.), en général lauteur de la ressource Un expert dun domaine ou un spécialiste de linformation, généralement pas le créateur de la ressource Lordinateur, peut remplir automatiquement certaines métadonnées Mots clés, version, date, droits, etc. Ou les trois, ou encore deux dentre eux

40 LUSSI Department Quelques propriétés des métadonnées Cycle de vie des métadonnées Elles continues à saccumuler tout au long de la vie dune ressource ou dun système. Elles peuvent être crées, modifiées et même détruites pendant le vie dune ressource. Certaines ne changent jamais pendant toute la vie de la ressource Titre, provenance, date de création, Métadonnées dynamiques qui changent avec lusage ou la manipulation de la ressource Log de transaction des utilisateurs; résolution des images

41 LUSSI Department Quelques propriétés des métadonnées Cycle de vie des métadonnées Métadonnées à long terme, nécessaires assurer et guarantir laccès à la ressource Format technique et de traitement des informations, Droites daccès Métadonnées à cours termes, principalement de nature transactionnelle

42 LUSSI Department Quelques propriétés des métadonnées Sémantique Métadonnées conformes à un vocabulaire standardisé ou une autorité de contrôle AAT; ULAN; AACR2 Classifications Ontologies Métadonnées libres Notes de texte libre Balise « méta » dHTML

43 LUSSI Department Quelques propriétés des métadonnées Stockage Lassociation entre des métadonnées et la ressource quelles décrivent est inhérent au concept de métadonnées. Dans la ressource A lextérieur de la ressource Les deux

44 LUSSI Department Quelques propriétés des métadonnées Les Normes Définition officielle ISO : "Document établi par un consensus et approuvé par un organisme reconnu, qui fournit, pour des usages communs et repérés, des règles, des lignes directrices ou des caractéristiques, pour des activités ou leurs résultats, garantissant un niveau d'ordre optimal dans un contexte donné." Les Standards Ensemble de recommandations développées et préconisées par un groupe représentatif dutilisateurs.

45 LUSSI Department Quelques propriétés des métadonnées Les normes et standards : enjeux Accessibilité : permettre la recherche, l'identification, l'accès et la livraison de ressources (contenus et composantes) en ligne de façon distribuée. Interopérabilité : permettre l'utilisation de contenus et composantes développés par une organisation sur une plate- forme donnée par d'autres organisations sur d'autres plateformes. Réutilisabilité : permettre aux contenus et composantes à différentes fins, dans différents produits, dans différents contextes et par différents modes d'accès.

46 LUSSI Department Quelques propriétés des métadonnées Les normes et standards : enjeux Durabilité : permettre aux contenus et composantes d'affronter les changements technologiques sans la nécessité d'une réingénierie ou d'un redéveloppement. Adaptabilité : permettre la modulation sur mesure des contenus et des composantes.

47 LUSSI Department Quelques propriétés des métadonnées La qualité des métadonnées Définition officielle : "L'ensemble des caractéristiques d'une entité qui lui confèrent l'aptitude à satisfaire des besoins explicites et implicites" Nécessite de mettre en place des procédures de validation des métadonnées saisies Nécessite de mettre en place des procédures de validation des modifications des schéma de métadonnées, donc de lévolution des métadonnées Dossier métadonnées, normes et standards

48 LUSSI Department Les métadonnées a.html a.html

49 LUSSI Department Exemples de métadonnées Dublin Core : LOM in Education IMS Project Version final specification IMS Learning resource Meta-data XML Binding IMS Learning resource Meta-data Information Model IMS Learning resource Meta-data Best practice and Implementation guide Etc.

50 LUSSI Department Learning Object Model, IMS Project Elements

51 LUSSI Department

52

53

54

55

56

57

58

59 Problèmes non traités Il ny a bien souvent pas de sémantique formelle associée aux métadonnées, donc pas dinterprétation possible par les machines Aller plus loin : Le « Semantic Web » Ontologies + mécanismes dinférence XML + RDF + RDFS Etc.


Télécharger ppt "LUSSI Department Les Métadonnées S. Garlatti. LUSSI Department PLAN Introduction Méta-data before SW Purpose of Metadata? Why is metadata important? Metadata."

Présentations similaires


Annonces Google