La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Cours n°3L2. Nancy2 (S. Sidhom) UE 404.a 2006/07 Complémentaire en Documentation Représentation des connaissances : approches de représentation des connaissances.

Présentations similaires


Présentation au sujet: "Cours n°3L2. Nancy2 (S. Sidhom) UE 404.a 2006/07 Complémentaire en Documentation Représentation des connaissances : approches de représentation des connaissances."— Transcription de la présentation:

1 cours n°3L2. Nancy2 (S. Sidhom) UE 404.a 2006/07 Complémentaire en Documentation Représentation des connaissances : approches de représentation des connaissances : classification, thésaurus, ontologie Par : Sahbi SIDHOM MCF. Université Nancy 2 Équipe de recherche SITE – LORIA sahbi.sidhom@loria.fr

2 cours n°3L2. Nancy2 (S. Sidhom)2 Plan  Introduction générale représentation des connaissances  Principes théoriques : Réseaux sémantiques Graphes conceptuels Systèmes à base de règles  Grandes approches : Classification Thésaurus Ontologie  Applications pratiques : évaluations

3 cours n°3L2. Nancy2 (S. Sidhom)3 III. Grandes approches Classification, Thésaurus, Ontologie

4 cours n°3L2. Nancy2 (S. Sidhom)4 1. Classifications  Approches  Outils  Applications

5 cours n°3L2. Nancy2 (S. Sidhom)5 Définition 1 :  Les langages documentaires ont été définis par plusieurs spécialistes et organismes de normalisation.  La définition, de l’AFNOR, précise pour les langages documentaires qu’il s’agit : « des langages artificiels constitués de représentation des notions et de relations entre ces notions, et qui sont destinés aux systèmes documentaires, pour formaliser les données contenues dans les documents et dans les demandes des utilisateurs ».  Référence : C. Guinchat et Y. Skouri.- Guide pratique des techniques documentaires.- Paris : OPELF, 1989.- vol 2, p.113

6 cours n°3L2. Nancy2 (S. Sidhom)6 Définition 2 :  J. Chaumier, définie dans son lexique des termes spécialisés en documentation, que : « le langage documentaire, est un ensemble organisé de termes normalisés utilisés pour représenter le contenu des documents à des fins de mémorisation pour une recherche ultérieure. On distingue essentiellement dans les langages documentaires : les classifications et les thesauri ».  Référence : J. Chaumier. Travail et méthodes du Documentaliste. Paris : Entreprise Moderne d’édition, 1984. p.87

7 cours n°3L2. Nancy2 (S. Sidhom)7 Définition 3 & Synthèse : On définie les langages documentaires, selon deux aspects: aspect fonctionnel et aspect structurel.  D'un point de vue fonctionnel, un langage documentaire est un outil terminologique conventionnel (ou normalisé) dont les fonctionnalités servent : 1.en amont de la chaîne documentaire, pour l’analyse des contenus et 2.en aval de cette chaîne, pour la recherche et l'accès à l'information.  Dans ce cadre, la fonction d'un langage documentaire se résume donc, « à la représentation intellectuelle du document » à des fins de mémorisation et de diffusion de l'information documentaire.

8 cours n°3L2. Nancy2 (S. Sidhom)8  D'un point de vue structurel, un langage documentaire – et particulièrement les langages à structure combinatoire (liste d’autorité et thesauri…) – se présente comme une liste contrôlée de termes (simples ou composés). Ici le terme “ contrôlé ” veut dire que les éléments sémantiques constituants le langage, sont réduits à des formes grammaticales uniques et invariables (généralement le substantif / singulier).  Par ailleurs, ces termes appelés descripteurs, sont reliés entre eux par des relations sémantiques de trois types : - Relation d'équivalence, - Relation hiérarchique, - Relation associative ou de voisinage. Ces relations ont pour objet de regrouper les notions sous un seul terme générique, d'élargir ou de préciser une recherche d’information.

9 cours n°3L2. Nancy2 (S. Sidhom)9 Évolution des langages doc.  Les langages documentaires ont considérablement évolué dans le temps : Cherchant à perfectionner la recherche documentaire pour plus d’efficacité, de précision et de convivialité, Développant des outils qui ont tous connus de véritables développement, que ce soit sur le plan sémantique, thématique que structurel.  Cette évolution a été en partie à l’origine de leur dispersion et donc de leur hétérogénéité. Ce qui revient à dire que lorsque ces derniers sont en relation, le phénomène de leurs incompatibilités apparaît.

10 cours n°3L2. Nancy2 (S. Sidhom)10 1. Le modèle des classifications hiérarchiques  Evolution sur le plan structurel : Partant de l’intérêt de mise en ordre générale des connaissances, c’est-à-dire du besoin de passer d’une mémoire scientifique non structurée de l’humanité à l’organisation structurée du savoir ne s’est faite véritablement sentir qu’à la fin du 19eme siècle. A cette époque les bibliothèques constituaient les principaux gisements du savoir.  Les documents étaient regroupés physiquement en fonction de leurs contenus. C’est pour répondre à ce besoin d’organisation, qu’ont été inventées les classifications universelles.

11 cours n°3L2. Nancy2 (S. Sidhom)11  Tous les grands systèmes de classifications encyclopédiques (Dewey, CDU, LCC, …) aussi bien que spécialisées selon leurs auteurs (S. Von Frauendorfer, Vickery, Barnard, … ) sont des langages documentaires entièrement codifiés, qui imbriquent deux sous-systèmes : 1.une liste hiérarchisée de tous les sujets prévisibles et 2.un codage significatif (un indice qui peut être fait de chiffres, de lettres, ou d’une combinaison des deux) de chaque sujet.  Ce modèle se base sur la précoordination des concepts, et adopte une organisation hiérarchique allant du général au particulier.

12 cours n°3L2. Nancy2 (S. Sidhom)12 Avantages Ces langages documentaires, présentent des avantages. Nous nous contenterons d’en citer quelques uns : Système universel pouvant couvrir toutes les notions du savoir, système de codification des classifications est avantageux pour l’informatisation de celles-ci, système utile dans le cadre d’un échange documentaire, où les bibliothèques utilisant la même classification, indexent leurs documents une seule fois, Regroupement des notions sous un indice précis Classement des documents sur des rayonnages suivant le classement des fiches …

13 cours n°3L2. Nancy2 (S. Sidhom)13 Inconvénients  Par ailleurs, ces classifications présentent également des inconvénients, en voici quelques uns : Les classifications universelles doivent couvrir toutes les disciplines et sont donc extrêmement volumineuses, donc difficiles à manipuler. Leur tenue à jour pose des problèmes énormes : elle repose, notamment pour la CDU, sur le travail des commissions permanentes par pays, par discipline et par langue. Il faut une procédure longue et laborieuse pour y introduire des modifications. Les classifications universelles, étudiées pour l’ensemble des usagers ne sont pas adaptées à chaque service de documentation. Elles s’appliquent bien à un domaine limité et stable.

14 cours n°3L2. Nancy2 (S. Sidhom)14 Bien que l’on puisse laisser des “ cases ” vides, il est assez difficile de les mettre à jour ou de les transformer pour tenir compte des changements importants dans la discipline ou dans le domaine d’activité (le plus souvent pour décrire le sujet principal d’un document et de façon unique). Elles se prêtent mal à la description des sujets précis, car les indices deviennent alors très complexes / longueur. Manque de rationalité et de rigueur dans leurs syntaxes. Par exemple la CDU, bien qu’elle permet de décrire des sujets complexes avec précision, elle reste une classification hiérarchisée et énumérative qui ne permet pas de faire apparaître les relations entre les sujets.

15 cours n°3L2. Nancy2 (S. Sidhom)15 2. Le modèle des Classifications à facettes  Evolution : Après 1945, les insuffisances des classifications traditionnelles hiérarchiques deviennent de plus en plus évidentes. Même s’il n’est pas encore question d’ordinateurs, une gestion plus rationnelle de fonds documentaires croissants s’impose dans les pays industrialisés. - La classification n’est plus considérée seulement comme un outil de rangement des livres sur des rayons, mais comme un authentique langage dont le but est la recherche documentaire. - C’est ainsi, qu’a été développé un autre modèle de classification basé sur le principe de la structuration à facettes.  Principe : “ Les classifications à facettes ordonnent les concepts et objets en classes mais elles sont multidimentionnelles, c’est à dire que les concepts sont ordonnés à l’intérieur de chaque classe en fonction de différents points de vue ”.

16 cours n°3L2. Nancy2 (S. Sidhom)16 Historique : - Ce système de classification a été développé par le bibliothécaire indien Shiyali Ramanrita Ranganathan à la suite des travaux de l’Américain Bliss. Ranganathan a produit en 1933 une classification universelle appelée la Colon Classification (CC), qui a été fondée sur le principe de la structuration à facettes. - Pour cette classification les facettes relèvent de cinq catégories fondamentales: *Personnalité, *Matière, *Energie, *Espace, *Temps Ces divisions ou traits à cinq aspects de la réalité : la Personnalité (sujet ou objet), la Matière (moyen ou manière), l'Énergie (action), l'Espace (lieu), le Temps (chrono.), - Elle se base donc sur une méthode analyticosynthétique qui consiste à analyser le sujet en différents points de vue ou facettes, puis à le resynthétiser par l’arrangement des facettes obtenues. L’arrangement se fait selon une séquence canonique appelée PMEST, formule représentant les initiales des facettes : (P)ersonality, (M)atter, (E)nergy, (S)pace et (T)ime.

17 cours n°3L2. Nancy2 (S. Sidhom)17 Avantages : Les classifications, quelles soient de type énumératives ou à facettes restent utiles là où l’indexation ne demande pas à être opérée en profondeur. C’est le cas des bibliothèques encyclopédiques, universitaires, publiques…etc. Cependant, le monde de l’information et de la documentation a connu vers le milieu du 19eme siècle de véritables mutations que ce soit par rapport à: - L’accroissement des fonds documentaires causé par une prolifération massive des publications et notamment les articles de périodiques. - La ramification des sciences et des technologies - Aux exigences des interrogateurs/utilisateurs devenant encore plus exigeants avec des profils de plus en plus spécialisés.

18 cours n°3L2. Nancy2 (S. Sidhom)18 Liste de quelques classifications :  Dewey (DC) La classification Dewey (DC) est l'oeuvre de l'Américain Melvil Dewey qui la mit sur pied à la fin du XIXe siècle. L'originalité de la DC tient, d'une part, dans l'utilisation du système décimal pour subdiviser chacune des classes établies en sous-classes et pour la notation; elle tient, d'autre part, dans l'adjonction, aux tables de classification, d'un index alphabétique très développé.  Library of Congress (LC) La classification de la Bibliothèque du Congrès (LC) est une autre classification qui est apparue aux États-Unis à la fin du XIXe siècle. Elle a été conçue, comme son nom l'indique, pour satisfaire seulement aux besoins du fonds documentaire considérable, d'un million de documents à l'époque, de cette immense bibliothèque nationale qui est celle du Congrès américain.  Classification décimale universelle (CDU) Mise sur pied, en Europe, également à la fin du XIXe siècle, par l'Institut international de bibliographie, la Classification décimale universelle (CDU) se voulait un catalogue classificatoire pouvant recenser le contenu des documents du monde entier. S'inspirant de la DC, elle reprend ses classes principales et sa notation décimale. Elle y apporte, toutefois, les modifications suivantes : un système de subdivisions beaucoup plus poussé permettant une analyse en profondeur des sujets, une importance accrue de la syntaxe, des innovations dans la subdivision et la notation.

19 cours n°3L2. Nancy2 (S. Sidhom)19  Colon (CC) L'apport le plus original des années 30, au XXe siècle, est celui de l'Indien S.R. Ranganathan qui repose sur une classification d'un type particulier, celui de la classification à facettes appelée «Colon Classification». Contrairement aux autres classifications qui sont monohiérarchiques, la classification à facettes s'appuie sur des principes de division applicables à l'ensemble des objets à classer. On parle alors de «divisions analytiques», de «divisions communes» ou de «traits universels». Ranganathan a ramené ces divisions ou traits à cinq aspects de la réalité d'où la formule anglaise PMEST.  Bliss (BC) La Classification bibliographique de Bliss (BC) est apparue à New York en 1936. Elle se fonde sur les principes suivants : 1) le consensus des spécialistes (savants/savantes et universitaires) qui doit être à la base d'une classification du savoir adaptée à son époque; 2) l'ordre des disciplines qui respecte une savante gradation telle que chaque nouvelle discipline dérive, par subordination, de la précédente; 3) les localisations alternatives qui permettent à un sujet, ex. l'Histoire économique, de se rattacher soit à l'Histoire, soit à l'Économie; 4) la brièveté de la notation par lettres; 5) la structure à facettes.

20 cours n°3L2. Nancy2 (S. Sidhom)20 2. Thésaurus  Approches  Outils  Applications

21 cours n°3L2. Nancy2 (S. Sidhom)21 3. (suite) Les langages d’indexation analytique  Face aux changements, les langages classificatoires ont perdu de leur intérêt en faveur d’une autre génération de langages documentaire basée sur le principe de l’indexation coordonnée. Il s’agit bien évidemment des langages analytiques ou de langages à structure combinatoire. Dans cette grande catégorie se range une typologie très variée d’outils.  A cette nouvelle situation correspond un nouveau modèle d’indexation, dit “ indexation coordonnée ”.

22 cours n°3L2. Nancy2 (S. Sidhom)22  Principes : Le langage documentaire « idéal » devient alors un répertoire de concepts, dits “ descripteurs ”, une sorte de dictionnaire conceptuel appliqué à un domaine particulier du savoir et assorti, le cas échéant, de règles de syntaxe. Le sujet n’est plus formulé globalement mais par une suite de termes élémentaires. Ici l’élément de base n’est plus le sujet mais le concept.

23 cours n°3L2. Nancy2 (S. Sidhom)23  Les avantages de ces langages sont considérables : A partir d’un nombre limité de concepts on pourra combiner tous les aspects du sujet. La formule d’indexation peut comporter autant de concepts que l’indexeur le juge nécessaire. Il n’est plus indispensable d’affecter à chaque descripteur un codage artificiel, les langages analytiques étant proche du langage naturel (utilisables par l’interrogateur et par l’indexeur). Pour la recherche, la comparaison de la formule d’indexation et de la formule d’interrogation devient beaucoup plus souple (non nécessaire que les deux formules soient rigoureusement identiques). il suffit que les descripteurs de la question se retrouvent dans la formule d’indexation pour que le document soit réputé pertinent : c’est le principe de la postcoordination.

24 cours n°3L2. Nancy2 (S. Sidhom)24 3.1. Les Listes d’autorités  Dans la catégorie des listes d’autorités, sont apparues la “ List of subject headings for use in dictionnary catalog ” de l’American Library Association en 1895, et la “ List of subject headings ” de la Library of Congress en 1911.  En France “ Dés août 1978, la norme : principes généraux pour l’indexation des documents – NF Z 47 – 102 – recommandait de disposer d’outils d’indexation permettant de représenter l’information selon un certain nombre de règles ”.  Principe : Les listes d’autorités sont des outils documentaires qui assurent l’uniformité des éléments d’entrée à une notice bibliographique. Autrement dit, ils contrôlent les points d’accès aux notices bibliographiques. Ces points d’accès doivent être normalisés et uniformes, respectant ainsi, la même orthographe et les mêmes formes grammaticales.

25 cours n°3L2. Nancy2 (S. Sidhom)25  Exemple : “ Langage documentaire ” voir aussi “ Classification ” “ Documentation ” “ Linguistique ” On peut utiliser une ou plusieurs vedettes-matières pour décrire un document. L’ordre des mots dans les vedettes est souvent inversé par rapport au langage naturel. Cette façon de structurer les vedettes matières a pour but de faciliter leur regroupement alphabétique.  Par rapport au thesauri, les listes d’autorités se caractérisent par une structuration sémantique pas très développée.

26 cours n°3L2. Nancy2 (S. Sidhom)26 3.2. Thesaurus  Les thesauri ont introduit dans les techniques documentaires un concept nouveau : celui des langages à post coordination.  Le thésaurus représente un mode d’organisation d’un langage documentaire combinatoire très utilisé : plus de 70% des systèmes documentaires fonctionnent actuellement en utilisant ce type d’outil linguistique.  Principe : C’est un ensemble contrôlé de termes entre lesquels les relations hiérarchiques et de voisinage ont été établies. Et pour lesquels les relations de synonymie avec les mots du langage naturel sont réalisés le cas échéant.  Les thesauri s’appliquent dans la plupart des cas à un domaine particulier de la connaissance.

27 cours n°3L2. Nancy2 (S. Sidhom)27 Thésaurus : définitions (Michel Hudon, 1995)  « une liste de mots simples ou d’expression ayant une valeur de terme dans un domaine limité de connaissance, le terme ayant définit comme la représentation linguistique (symbolique) d’un concept unique ». (Van Slype, 1987)  « une liste structurée de concepts, destinée à représenter d’une manière univoque le contenu des documents et des questions dans un système documentaire déterminé, et à assister l’utilisateur dans l’indexation des document et des questions ». (AFNOR, 1981)  « une liste d’autorité organisée de descripteurs et de non descripteurs obéissant à des règles terminologiques propres et reliés entre eux par des relations sémantiques (hiérarchiques, associatives, ou d’équivalence). Cette liste sert à traduire en un langage artificiel dépourvu d’ambiguïté des notion exprimé en langage naturel ».

28 cours n°3L2. Nancy2 (S. Sidhom)28 Composants d’un thésaurus  Un lexique (ou vocabulaires d’entrée, ensemble de mots d’une langue) descripteurs et non descripteurs  Un sous-ensemble de définitions et de notes d’application Notes historiques et notes d’application pratique  Une structure classificatoire exprimée par des relations sémantiques entre les termes du lexique, et parfois traduits par une notation symboliques relation d’équivalence intra linguistique relation d’équivalence inter linguistique relation hiérarchique relation d’association

29 cours n°3L2. Nancy2 (S. Sidhom)29 Rôle et fonction d’un thésaurus  Faciliter la recherche documentaire et d’en augmenter l’efficacité  Permettre un repérage exhaustif en liant les concepts et les termes proches  Réduire l’impact des problèmes causés par la synonymie présente dans le langage naturel

30 cours n°3L2. Nancy2 (S. Sidhom)30 Aspects comparatifs : thésaurus et autre sources  Thésaurus de description vs. dictionnaire  différence d’acception: concepts / Mots  Thésaurus de description vs. thésaurus littéraire  différence dans le rôle: définition / référence  Thésaurus de description vs. banque terminologique  différence d’interprétation: relations sémantiques  Thésaurus de description vs. vedette-matière  différence d’organisation: structure / hiérarchie

31 cours n°3L2. Nancy2 (S. Sidhom)31 La structure sémantique d’un thésaurus  Relation d’équivalence intra-linguistique entre des synonymes qui expriment la même idée, on distingue le mono-équivalent et le pluri-équivalent. On utilise la notation EM et le EP  Relation hiérarchique relation d’inclusion et de supériorité, on distingue entre terme spécifique et terme générique. On utilise la notation TS/ TG  Relation d’association analogie et lien de signification entre descripteurs. Moins définit et subjective. On utilise la notation TA  Relation inter-linguistique relation symétrique entre deux descripteurs de deux ou plusieurs langues. on distingue entre équivalence complète et équivalence partielle. On utilise le notation An/ FR/ ES

32 cours n°3L2. Nancy2 (S. Sidhom)32 Création d’un thésaurus  Pour créer un nouveau thésaurus, il faut une: 1.Évaluation des vocabulaires disponibles 2.Analyse des besoins particuliers à l’environnement  Domaine à couvrir,  type et nombre de documents à traiter,  besoin des usagers, … 3.Évaluation des ressources 4.Sélection des caractéristiques essentielles du thésaurus  Profondeur et structure du thésaurus, …

33 cours n°3L2. Nancy2 (S. Sidhom)33 Processus de construction : collecte du vocabulaire  Diverses sources terminologiques peuvent contribuer à l’exploitation : Un langage documentaire existant Un thésaurus extérieur au service Une Banque de données terminologiques Une indexation intellectuelle Une indexation automatique …

34 cours n°3L2. Nancy2 (S. Sidhom)34 Processus de construction : listage des micro-disciplines  établir une liste provisoire des grands thèmes : Le nombre de groupes à retenir est fonction du volume thésaurial  la liste de micro-disciplines a pour objet de : faciliter la manipulation et la prise de décision  le groupement se fait par : thème ou par facette

35 cours n°3L2. Nancy2 (S. Sidhom)35 Processus de construction : réduction du langage documentaire  Cette phase comporte les étapes suivantes établissement de la structure d’équivalence sémantique établissement de la structure hiérarchique traitement des doubles emplois recherche des équivalents inter-linguistiques établissement des relations associatives  Élaboration de la structure d’équivalence sémantique Établir la liste des termes synonymes ou quasi-synonymes Choisir dans chaque liste les termes qui auront le statut de non descripteur et les rattacher au descripteur/ on choisi le plus neutre, le plus utilisé dans la profession

36 cours n°3L2. Nancy2 (S. Sidhom)36 Synonymie véritable  La forme complète d’un nom et son abréviation Ex : IMA (institut de monde Arabe)  Le nom populaire et le nom scientifique Ex : Vitamine C (Acide Ascorbique)  Le nom scientifique et le nom commercial Ex : Acide Acétylsalicylique (Asprine)  Les variantes orthographiques d’un même mot Ex : clef (clé)  L’appellation ancienne et l’appellation moderne d’un même concept Ex : pays sous développé (pays en développement)  Les termes d’origine linguistique différents Ex : Marketing (mercatique)  Les termes d’origine culturelle différents Ex : Parking (de stationnement)

37 cours n°3L2. Nancy2 (S. Sidhom)37 Élaboration de la structure hiérarchique  Construire des chaînes hiérarchiques par micro-discipline. Toutes les hiérarchies ne possèdent pas un nombre égal de niveaux. Mais il y a une logique comparable entre concepts qu’il faut respecter.  On identifie les relations hiérarchiques par plusieurs moyens comme l’emploie des énoncés suivants: Certain A sont des B. Tous les B sont dans A (relation d’inclusion). Ex: animaux / Rongeurs animaux familiers / Rongeurs X (spécifique) est toujours et nécessairement un Y (générique) Ex: la discrimination religieuse est toujours et nécessairement un type de discrimination (TG) ; discrimination religieuse (TG) / discrimination (TG)

38 cours n°3L2. Nancy2 (S. Sidhom)38 Traitement des doubles emplois  Traitement de la poly-hiérarchies: le même concepts exprimés dans deux ou plusieurs micro-thésaurus  Traitement des anomalies : Descripteurs identiques désignant des concepts différents: ajouter un qualificateurs ; Non descripteurs identiques liés à des descripteurs différents: Ajouter un qualificateur Termes retenus à la fois comme descripteurs dans un champs et non descripteurs dans un autre: élimination dans l’un ou l’autre champs Relation hiérarchique entre descripteurs et non descripteurs : à exclure

39 cours n°3L2. Nancy2 (S. Sidhom)39 Recherche des équivalents inter-linguistiques  La recherche des équivalents linguistiques ne peut se faire qu’à partir du moment où le contenu sémantique des descripteurs de la langue de base est fixé, grâce à des relations d’appartenance et d’équivalence.  on trouve les situations suivantes: Équivalence certaine. Ex: route / Road Léger décalage de sens. Ex: centre de documentation/ bibliothèque Pas d’équivalence de tout. Utilisation d’une périphrase ou adoption de terme étrangers Ex: services de documentation/ special library

40 cours n°3L2. Nancy2 (S. Sidhom)40 Établissement des relations associatives  Seuls les termes qui ont été choisis comme descripteurs peuvent être associés : L’association se fait à un niveau inter-hiérarchique  Plusieurs types d’association possibles : la cause et l’effet  Ex : infection et Maladie le tout et sa partie  Ex : livre et reliure l’action et son agent  Ex : économie et économiste l’action et le lieu d’action  Ex : enseignement et école la science et son objet  Ex : documentation et document l’objet et sa propriété  Ex : Poison et Toxicité l’objet et son application  Ex : Ordinateur et traitement de données

41 cours n°3L2. Nancy2 (S. Sidhom)41 Derniers étapes de construction  Réalisation de l’édition expérimentale  Formation des « indexeurs »  Tester le thésaurus ajout de descripteurs modification des structures explication des descripteurs (encore ambigus)  Révision finale et réalisation de l’édition opérationnelle

42 cours n°3L2. Nancy2 (S. Sidhom)42 Relations types & explications Consulter : thésaurus de l’UNESCO URL :http://databases.unesco.org/thesfr/

43 cours n°3L2. Nancy2 (S. Sidhom)43 Relations d’équivalence : EM, EP ( élimine la synonymie ) EM /EMP : Employer Déf. : non DES  DES Ex. : Calculateur  Ordinateur EP : Employer Pour Déf. : DES  non DES Ex. : Ecologie  Étude du milieu/ environnement A B EM EP

44 cours n°3L2. Nancy2 (S. Sidhom)44 Relations hiérarchiques : TS, TG ( rapports de supériorité / subordination ) TS : (terme spécifique) Déf. : relation qui va du générique au spécifique Ex. : Oiseau  Rapace  Aigle TG : (terme générique) Déf. : relation qui va du spécifique au générique Ex. : Aigle  Rapace diurne Chouette  Rapace nocturne A B TS TG

45 cours n°3L2. Nancy2 (S. Sidhom)45 Relations associatives : TA ( pour exprimer des analogies de signification ) 1.Antonymie (sens contraire) Ex. : imperméabilité  perméabilité 2. Cause et effet Ex. : enseignement  instruction 3. Rapport instrumental Ex. : écriture  crayon A B TA

46 cours n°3L2. Nancy2 (S. Sidhom)46 Notes d’application : NA Brèves explications, définitions : 1.ce qui explique les modalités d’emploi d’un terme DES (descripteur) 2. pour éviter les ambiguïtés (la polysémie) Exemples : mémoire (=RAM/ROM/support …)  informatique mémoire (=mém. du cerveau/conscient/inconscient )  psychologie mémoire (=thèse/livre/…)  études A B NA C

47 cours n°3L2. Nancy2 (S. Sidhom)47 3. Ontologies  Approches  Outils  Applications

48 cours n°3L2. Nancy2 (S. Sidhom)48 Approche : ontologie in Le Robert : Depuis 1646, le terme « ontologie » désigne la « Partie de la métaphysique qui s’applique à l’être en tant qu’être, indépendamment de ses déterminations particulières ». On prête aux philosophes de la Grèce ancienne le début de ce type de réflexion. Un chercheur a désigné par le terme « ontologie formelle » ce qui se nommait alors, « système de classification », « taxinomie » ou « taxonomie », « thesaurus ».

49 cours n°3L2. Nancy2 (S. Sidhom)49 Historique :  L’étymologie de ce terme est la "théorie de l’existence", c’est à dire la théorie qui tente d’expliquer les concepts qui existent dans le monde et comment ces concepts s’imbriquent et s’organisent.  En Intelligence Artificielle, la définition communément admise d’une ontologie est énoncée par T. Gruber [GRUBER, 93] comme la "spécification explicite d’une conceptualisation".GRUBER, 93  Cette définition fait suite à un premier essai en 1991 [GRUBER, 91] : "An ontology defines the basic terms and relations comprising the vocabulary of a topic area, as well as the rules for combining terms and relations to define extensions to the vocabulary".GRUBER, 91  Cette définition a également été récemment précisée [STUDER, 98] pour devenir: "La spécification formelle et explicite d’une conceptualisation partagée".STUDER, 98

50 cours n°3L2. Nancy2 (S. Sidhom)50 [GRUBER, 93]GRUBER, 93 T. Gruber, « A translation Approach to portable ontology specifications », Knowledge Acquisition, Vol. 5, 1993, 199-220. [GRUBER, 91]GRUBER, 91 R. Neches ; R. Fikes ; T. Finin ; T. Gruber ; R. Patil ; T. Senator ; W. R. Swartout, « Enabling Technology for Knowledge Sharing », AI Magazine. Winter 1991, 36-56. [STUDER, 98]STUDER, 98 Studer Benjamins Fensel, « Knowledge Engeeneering : Principles and Methods », Data and Knowledge Engineering 25, 1998, 161-197.

51 cours n°3L2. Nancy2 (S. Sidhom)51 Interprétations :

52 Etude de cas : Ontologie &relations syntagmatiques versus relations ontologiques

53 cours n°3L2. Nancy2 (S. Sidhom)53 Ontologie Etude de ce qui ‘est’ / être Terme emprunté à la philosophie Pour nous : formalisation d’une conceptualisation pour identifier/filtrer/inférer une connaissance

54 cours n°3L2. Nancy2 (S. Sidhom)54 Ontologie Se mettre d'accord sur le sens des termes employés dans une organisation, une communauté, un métier ; Faire en sorte que les personnes et les logiciels se comprennent de l’usage ontologique ; Utile pour des applications distribuées telles que le Web.

55 cours n°3L2. Nancy2 (S. Sidhom)55 Ambiguïté Mot ? /Idée ? /Terme ? /Concept ? du ‘placard’ : placard placard de cuisine placard de chambre placard de pharmacie placard de rangement placard frigorifique placard coulissant placard à B.D. …

56 cours n°3L2. Nancy2 (S. Sidhom)56 Ontologie  Identifier, modéliser les concepts d'un domaine, pertinents pour une application donnée ;  Se mettre d'accord, au sein d'une communauté/d’un domaine donné, sur les termes employés pour se référer à ces concepts

57 cours n°3L2. Nancy2 (S. Sidhom)57 Terme Distinguer :  Mots de la langue naturelle qu’on emploi pour désigner un concept : placard, chat, chien, notaire, greffier, …  Termes qui désignent le concept en question “…X, Y, Z”  synonymie : plusieurs termes dénotent le même concept  ambiguïté : plusieurs concepts dénotés par le même terme

58 cours n°3L2. Nancy2 (S. Sidhom)58 Ontologie  Identifier/MODELISER les concepts et les relations conceptuelles  formaliser la conceptualisation, et le vocabulaire correspondant  Formalisation pour lever toute ambiguïté

59 cours n°3L2. Nancy2 (S. Sidhom)59 Pour quoi faire ?  base de connaissances  système d’annotation  système d’indexation documentaire,  système de recherche d’information  Commerce électronique  Etc.

60 cours n°3L2. Nancy2 (S. Sidhom)60 Ontologie  Différentes acceptions du mot ontologie :  Vocabulaire technique,  Référentiel métier,  Terminologie/thesaurus,  Syst è me de classes d’une représentation (par objet : UML,…)  Base de connaissances terminologique

61 cours n°3L2. Nancy2 (S. Sidhom)61 Conception  Identifier TALN /modéliser ONTOLOGIE les concepts et les termes pertinents  Identifier les relations pertinentes : subClassOf (sous classe), isA (est un), part of(partie de), hasPart(avoir une partie en commun), closeTo (proche de), over, under, contain, connected, etc. SN (groupe nominal), SP (gp. Prépositionnel), EP (expansion prépositionnelle, SA (gp. adjéctival), SV (gp. verbal), etc.  Règles pour combiner les concepts et les relations : partOf (transitivité), isA (bijection), … grammaire ( SN  D’ + N’, D’  D, N’  N + EP, …)

62 cours n°3L2. Nancy2 (S. Sidhom)62 Modéliser  Une ontologie est une modélisation des connaissances  Au sens où une théorie physique est un modèle de la réalité  Il peut y avoir plusieurs modèles d’une m ême r éalité : expérience de la chute des corps théorie de la gravitation de Newton relativité générale d’Einstein

63 cours n°3L2. Nancy2 (S. Sidhom)63 Connaissance  Continuum : donnée, information, connaissance donnée : T°> 103°C et P > 60bar information : ALERT niv. 3 connaissance : en cas d’alerte de niveau 3, il faut déclencher le système de refroidissement canal A.  La connaissance permet de produire de nouvelles données, informations, connaissances: pouvoir d’inférer.

64 cours n°3L2. Nancy2 (S. Sidhom)64 Types de connaissances  Connaissances de résolution de probl è me : conception, diagnostic, évaluation, planification t âches, inf érences  Connaissances du domaine e.g. électronique, mécanique, médecine, etc.  ontologie : réutilisable  mod è les de domaine : fonctionnel, causal, structurel, exprimés dans le vocabulaire de l’ontologie ou du TALN.

65 cours n°3L2. Nancy2 (S. Sidhom)65 Mod èles de domaine Structurel : Moteur m1:- part of, Vehicule v2 Grammaire(SN)+ Grammare(SV):- Phrase Causal : Moteur:[cassé] => Vehicule:[stop] Mot1:[D]+ Mot2:[?]+ Mot3:[N] => Mot2:[ADJ]

66 cours n°3L2. Nancy2 (S. Sidhom)66 Mod èles de tâ che Conception : sp ecify, design, assess Diagnostic : identifier des sympt ômes, choisir un modèle causal, émettre des hypoth èses, imaginer des cons équences, les tester, etc.

67 cours n°3L2. Nancy2 (S. Sidhom)67 Ontologie  L ’ accent est mis sur les concepts et les relations du domaine  Orienté modélisation, spécification, réutilisation, partage, standardisation.  Relations spécifiques du domaine considéré

68 cours n°3L2. Nancy2 (S. Sidhom)68 Objets  L'accent est mis sur le coté opérationnel.  Opérations rendues possibles par le modèle objet : classification, évolution, simulation, calcul.  Orienté résolution de problème

69 cours n°3L2. Nancy2 (S. Sidhom)69 Terminologie/Thesaurus  L'accent est mis sur les termes utilisés pour dénoter les concepts du domaine (linguistique, langue naturelle).  Les relations entre termes sont linguistiques.  Orienté indexation.

70 cours n°3L2. Nancy2 (S. Sidhom)70 Thesaurus (2) Recueil documentaire alphabétique de termes servant de descripteur pour :  analyser un corpus  indexer des documents  Relations prédéfinies standardisées pour les thésaurus

71 cours n°3L2. Nancy2 (S. Sidhom)71 Relations linguistiques  BT : Broader Term  NT : Narrower Term  TT : Top Term  RT : Related Term (other than BT, NT, TT, etc.)

72 cours n°3L2. Nancy2 (S. Sidhom)72 Relations (2)  USE : Prefered Term  UF : Use for, non preferred synonym, quasi synonym  SN : Scope Note, Une note pour expliquer un terme

73 cours n°3L2. Nancy2 (S. Sidhom)73 Combiner les principaux modes d’interaction homme-machine ( Romain Zeiliger, CNRS-GATE, 2000 ) EXEMPLE : approche NESTOR Fournir en permanence une double représentation : hypertextuelle et graphique. De la même maniére qu’un lien hypertexte est contextualisé (dans un document), un document est contextualisé dans une carte (carte conceptuelle). Approche :

74 cours n°3L2. Nancy2 (S. Sidhom)74 Usages : Exemple de carte NESTOR Une carte collective sur le thème “Histoire des Sciences Informatiques”

75 cours n°3L2. Nancy2 (S. Sidhom)75 IV. Applications pratiques

76 cours n°3L2. Nancy2 (S. Sidhom)76 Conception de thésaurus : relations sémantiques

77 cours n°3L2. Nancy2 (S. Sidhom)77 Relations TS et TG TGTS T1 T2 T6 T2 T6 T33 T5 T7 T1 T2T6 T33 T7 T5

78 cours n°3L2. Nancy2 (S. Sidhom)78 Relation : synonymes TermeSynonyme T1 T2 T5 S1 S2 S3 S4 S5 T1 T2T6 T33 T7 T5 S1, S2 S3, S4 S5

79 cours n°3L2. Nancy2 (S. Sidhom)79 Relations : EM et EP Terme DTerme nD T1 T2 T6 T33 D1 D2 D6 D7 D3 T1 T2T6 T33 T7 T5 S1, S2 S3, S4 S5 D1 D2 D6, D7 D3

80 cours n°3L2. Nancy2 (S. Sidhom)80 Relations : EN et AL FREN T1 T2 T6 T33 T5 E1 E2 E6 E33 E5 T1 T2T6 T33 T7 T5 S1, S2 S3, S4 S5 D1 D2 D6, D7 D3 AL D1 D2 D6 D33 D5 T7E7D7

81 cours n°3L2. Nancy2 (S. Sidhom)81 FREN T1 T2 E1 E2 AL D1 D2 Table 3 : rel. Inter- linguistiques Terme DTerme nD T1 T2 T6 D1 D2 D6 Table 2 : relation EM/EP TermeSynonyme T1 T2 S1 S2 S3 Table 4 : rel. synonymies TGTS T1 T2 T6 T33 Table 1 :relation TG/TS Schéma conceptuel

82 cours n°3L2. Nancy2 (S. Sidhom)82 Exemple : Végétaux - Relations TS et TG TGTS légume fruit arbre carotte poivron banane pomme pin végétal arbrefruit pin banane pomme légume poivron carotte

83 cours n°3L2. Nancy2 (S. Sidhom)83 Végétaux - Relation synonyme TermeSynonyme végétal fruit arbre légume carotte plante organe Plante ligneuse Daucus carota végétal arbrefruit pin banane pomme légume poivron carotte

84 cours n°3L2. Nancy2 (S. Sidhom)84 Conception d’une ontologie : relations sémantiques

85 cours n°3L2. Nancy2 (S. Sidhom)85 ontologie : réseau de transport Véhicule voiture camion personne marchandise périssable non périssable est_un(e) transporter est comporte

86 cours n°3L2. Nancy2 (S. Sidhom)86 Relations sémantiques Concept_sourceRelation_sem véhicule voiture camion est-un(e) transporter Concept_cible voiture camion personne voiture personne camion transporter marchandise camion transporter camion marchandise est-un(e) périssable marchandise est-un(e) non périssable

87 cours n°3L2. Nancy2 (S. Sidhom)87 À expliciter une relation sémantique Relation_sem est-un(e) Primitive Is_a(X) Objectif X Interprétation Définition transporterTrans(X,Y) X, YRelation binaire comporteComp(X,Y) X, Y Relation d’appartenance On peut également expliciter : primitive, objectif, interprétation ou Compléter par des règles programmées

88 cours n°3L2. Nancy2 (S. Sidhom)88  À réaliser les tables dans une BDD  Une relation sémantique est : Soit une table Soit un attribut (champs) d’une table  Relations entre les tables : Requête en SQL (SELECT…)


Télécharger ppt "Cours n°3L2. Nancy2 (S. Sidhom) UE 404.a 2006/07 Complémentaire en Documentation Représentation des connaissances : approches de représentation des connaissances."

Présentations similaires


Annonces Google