© M. Hudon 2002 1 De l'utilité des contrôles lexical et sémantique des accès- sujets sur Internet et en Intranets Michèle Hudon, Ph.D. Professeure adjointe.

Slides:



Advertisements
Présentations similaires
Définitions Analyse documentaire
Advertisements

ORTHOGRAM PM 3 ou 4 Ecrire: « a » ou « à » Référentiel page 6
LES NOMBRES PREMIERS ET COMPOSÉS
[number 1-100].
Qualité du Premier Billot. 2 3 Défauts reliés à labattage.
1. Résumé 2 Présentation du créateur 3 Présentation du projet 4.
Vocabulaire 6.2 Français II Bon voyage ! 1.
Clément Massé – Université Charles de Gaulle Lille3.
Proposition de recherches sur ABI (Pro Quest) Lise Herzhaft (Urfist de Lyon) et MH Prévoteau (Bibliothèque Université Paris 2) Mise en forme par Nolwenn.
Classe : …………… Nom : …………………………………… Date : ………………..
BCDI UTILISER LE THESAURUS POUR FAIRE UNE RECHERCHE
Enseignants en groupe Les apprenants en groupe Enseignant ou Apprenant.
Sud Ouest Est Nord Individuel 36 joueurs
Les Prepositions.
Cours MIAGE « Architectures Orientées Services » Henry Boccon-Gibod 1 Architectures Orientées Services Composants de Service Exemple pratique de développement.
PLAN DU COURS Outils de traitement des risques
Le Modèle Logique de Données
Architecture de réseaux
La diapo suivante pour faire des algorithmes (colorier les ampoules …à varier pour éviter le « copiage ») et dénombrer (Entoure dans la bande numérique.
Indexation textuelle : Systèmes de recherche d’informations
ESIEE Paris © Denis BUREAU I N Initiation à la programmation avec le langage Java.
Journée détude régionale du 23 mai Lévaluation interne des établissements et services sociaux et médico-sociaux : Où en sommes-nous ? 1 Résultats.
ETAPES DE LA RECHERCHE DOCUMENTAIRE
Minimisation Techniques 1 Assimilation Algorithms: Minimisation Techniques Yannick Trémolet ECMWF Data Assimilation Training Course March 2006.
2 1. Vos droits en tant quusagers 3 1. Vos droits en tant quusagers (suite) 4.
User management pour les entreprises et les organisations Auteur / section: Gestion des accès.
PARTENARIAT ÉDUCATIF GRUNDTVIG PARTENARIAT ÉDUCATIF GRUNDTVIG REPERES COHESION CULTURELLE ET EXPANSION DES IDEES SUR LE TERRITOIRE EUROPEEN.
Caroline Patenaude Bibliothécaire – responsable informatique et Web Bibliothèque des lettres et sciences humaines, Université de Montréal 4 novembre 2010.
Mr: Lamloum Med LES NOMBRES PREMIERS ET COMPOSÉS Mr: Lamloum Med.
Français I Leçon 2B Une semaine au lycée Au Debut #7 (for the dates of November 5 and 6) Please Translate the Following: 1. I love the math course. (Adorer.
1 Bienvenue! Ministère de lEmploi et de la Solidarité sociale Direction des ressources humaines La conduite dun projet de refonte dun intranet Pascale.
Développement d’applications web
1 Cours numéro 3 Graphes et informatique Définitions Exemple de modélisation Utilisation de ce document strictement réservée aux étudiants de l IFSIC.
Practice for uses of: Je sais OU Je connais.
Vuibert Systèmes dinformation et management des organisations 6 e édition R. Reix – B. Fallery – M. Kalika – F. Rowe Chapitre 1 : La notion de système.
Vuibert Systèmes dinformation et management des organisations 6 e édition R. Reix – B. Fallery – M. Kalika – F. Rowe Chapitre 2 : Les applications fonctionnelles.
Web Sémantique: Le Relief Actuel
1 Guide de lenseignant-concepteur Vincent Riff 27 mai 2003.
Traitements &Suppléments
Le Travail Collaboratif ...
Recherche Documentaire et traitement de l’information
Académie de Créteil - B.C Quest-ce quune Inscription 1)1 action + 1 stagiaire + 1 client 2)Parcours individuel (avec son Prix de Vente) 3)Un financement.
LES NOMBRES PREMIERS ET COMPOSÉS
VOC 1 CE2 Je sais utiliser des mots de la vie quotidienne.
SCIENCES DE L ’INGENIEUR
OIL & UPML DREVET - HUMBERT Introduction OIL : un langage de description dontologies UPML : un langage de description de systèmes à base.
GPA789 Analyse et conception orientées objet 1 Professeur: Tony Wong, Ph.D., ing. Chapitre 6 Correspondance UML et C++
1.1 LES VECTEURS GÉOMÉTRIQUES
Tournoi de Flyball Bouin-Plumoison 2008 Tournoi de Flyball
Notre calendrier français MARS 2014
Web sémantique : Web de demain
Comment choisir un métier…
Chapitre 3 Syntaxe et sémantique.
Recherche, évaluation et utilisation de linformation Martine Mottet www1.sites.fse.ulaval.ca/martine.mottet.
Les nombres.
Initiation à la conception des systèmes d'informations
Thésaurus de lactivité gouvernementale Richard Parent 17 novembre 2006 Ressource de soutien à linteropérabilité sémantique.
F L T R Université catholique de Louvain-la-Neuve Faculté de philosophie et lettres FLTR Faculté de Philosophie et Lettres Présentation décembre 2002 Réalisation:
LA GESTION COLLABORATIVE DE PROJETS Grâce aux outils du Web /03/2011 Académie de Créteil - Nadine DUDRAGNE 1.
ECOLE DES HAUTES ETUDES COMMERCIALES MARKETING FONDAMENTAL
Traitement de différentes préoccupations Le 28 octobre et 4 novembre 2010.
ECOLE DES HAUTES ETUDES COMMERCIALES MARKETING FONDAMENTAL
Nom:____________ Prénom: ___________
Quelle heure est-il? What time is it ?.
CALENDRIER-PLAYBOY 2020.
LES PILES ET FILES.
Ressources Internet liées à la CIB
Les Chiffres Prêts?
To practice: Quantities Un, une, des, de Du, de la, de l’, de Le, la, l’, les.
Transcription de la présentation:

© M. Hudon De l'utilité des contrôles lexical et sémantique des accès- sujets sur Internet et en Intranets Michèle Hudon, Ph.D. Professeure adjointe Université de Montréal

© M. Hudon Présenter divers modes dorganisation documentaire qui permettent et même facilitent le repérage dinformation pertinente Objectif …

© M. Hudon Mots-clés Utilisateur / Demandeur Information Document Organisation Contrôle Recherche et repérage Système de transfert dinformation

© M. Hudon À distinguer Information « récréative » Information « requise » Information factuelle Information discursive / textuelle

© M. Hudon À distinguer aussi … Lutilisateur qui connaît déjà la source qui lui procurera linformation requise Lutilisateur qui sait ce quil cherche mais ne connaît pas la ou les sources qui lui procureront linformation requise Lutilisateur qui ne sait pas ce dont il a besoin

© M. Hudon Description des documents Contenant Titre Créateur de la ressource Date de publication / mise à jour Nombre de pages / de méga-octets Contenu Sujet(s)

© M. Hudon Accès sujet Permet le repérage de sources dinformation pertinentes dont on ne connaît pas encore lexistence par la voie de leur contenu plutôt que par lutilisation déléments descriptifs externes caractérisant lobjet document

© M. Hudon Description du contenu Titres, Sous-titres, Titres alternatifs, etc. Classement dans une catégorie particulière Mots-clés Résumé Texte dans son entier

© M. Hudon Contexte quand on cherche de linformation sur un sujet, on ne peut examiner tout ce qui se trouve dans une collection un document est souvent trop volumineux pour être utilisé dans son entier, na pas besoin dêtre utilisé dans son entier le créateur et lutilisateur dun document nemploient pas forcément le même vocabulaire pour représenter les mêmes concepts la coïncidence entre la formulation des questions et la représentation du contenu est indispensable pour quun système de transfert dinformation fonctionne correctement

© M. Hudon Multiplicité des langues naturelles Variations nationales et régionales Niveaux de langue Code / Signe Problèmes liés à lutilisation de la langue naturelle

© M. Hudon Plus précisément Synonymie : SILENCE – Mots de même sens ou de sens assez voisins pour être interchangeables (Ex. société multinationale, société transnationale, entreprise internationale, multinationale) Polysémie :BRUIT – Un mot, plusieurs sens (Ex. Architecture, Kiwi)

© M. Hudon Une solution possible : normaliser purifier contrôler « artificialiser » la langue naturelle

© M. Hudon Le langage documentaire Tout système de signes qui permet de représenter le contenu de documents dans le but den faciliter le repérage. Le langage documentaire se compose au minimum – d'un lexique : ensemble des mots et des expressions utilisables pour la représentation et pour la recherche dinformation – d'une syntaxe : règles d'utilisation et de combinaison de ces mots et expressions.

© M. Hudon Contrôle lexical contrôle morphologique et flexionnel : nature et forme du terme contrôle syntaxique : ordre des mots qui composent un terme

© M. Hudon Contrôle sémantique contrôle sémantique : signification du terme – un terme ne doit représenter qu'un seul concept et donc n'avoir qu'un seul sens (bi-univocité) et chaque concept ne doit être représenté que par un seul terme

© M. Hudon Étapes du contrôle sémantique réduction du langage naturel par identification des synonymes et quasi-synonymes et établissement de relations d'équivalence clarification du sens d'un terme par son intégration dans une structure hiérarchique ou création de définitions construction d'un réseau d'associations formant contexte et précisant encore davantage la signification d'un terme

© M. Hudon Instruments de contrôle de la langue naturelle Cadres ou Schémas de classification Répertoires de vedettes-matières Thésaurus Liste de mots-clés Taxonomies et ontologies

© M. Hudon Schéma de classification Langage documentaire fondé sur la structuration en classes des sujets dun ou plusieurs domaines de la connaissance et dans lequel les classes et leurs relations peuvent être représentées par les indices dune notation

© M. Hudon Structure hiérarchique Technologie (Sciences appliquées) Sciences médicales. Médecine Physiologie humaine Système sanguin Globules blancs

© M. Hudon

© M. Hudon

© M. Hudon

© M. Hudon

© M. Hudon Vedettes-matière et Répertoire de vedettes-matière Terme (mot ou expression) résultant de la pré- coordination de plusieurs concepts distincts, exprimant un sujet de façon normalisée Outil lexical qui présente lensemble des vedettes-matières développées et qui montre les relations d'équivalence, de hiérarchie et dassociations qui existent entre elles.

© M. Hudon Exemple Documentalistes – Formation – France – – Bibliographie Musique country – Histoire – 1970 Québec (Province). Ministère de lÉducation – Rapport annuel – 2001

© M. Hudon Descripteurs et Thésaurus Descripteur = Terme (ou symbole) choisi pour représenter sans ambiguïté un concept particulier et dont lénoncé et la forme ont fait lobjet dun processus de normalisation Thésaurus = Langage documentaire fondé sur une structuration hiérarchisée dun ou plusieurs domaines de la connaissance et dans lequel les concepts sont représentés par des termes dune ou plusieurs langues naturelles et les relations entre concepts par des signes conventionnels

© M. Hudon

© M. Hudon

© M. Hudon

© M. Hudon

© M. Hudon

© M. Hudon

© M. Hudon Mots clés et Listes de mots-clés Mot choisi dans le titre ou le texte dun document. On parle de mot-clé libre si on ne fait aucune consultation dun outil lexical. On parle dun mot-clé contrôlé sil y a consultation dun outil lexical (un thésaurus, par exemple) Liste de mots-clés présentés en ordre alphabétique, sans structure logique et sans relations entre eux

© M. Hudon Taxonomie et Ontologie À mi-chemin entre les schémas de classification et les thésaurus, taxonomies et ontologies en contexte réseau sont des outils qui se cherchent encore une personnalité propre Souvent créés plus ou moins automatiquement par manipulation de la langue naturelle

© M. Hudon

© M. Hudon

© M. Hudon

© M. Hudon Libre versus contrôlé 1 Peu prévisible Dispersion des différentes représentations verbales d'un même concept Stratégie de recherche complexe et coûteuse pour le chercheur Bruit au repérage Très prévisible Regroupement des différentes représentations verbales d'un même concept Stratégie de recherche compacte et efficace Peu de bruit au repérage

© M. Hudon Libre versus contrôlé 2 Très grande spécificité Plus dynamique Investissement minimal (formation des indexeurs, préparation des outils, etc.) Grande flexibilité au niveau de la traduction des concepts Plus général Moins dynamique Investissement important (formation des indexeurs, préparation des outils, contrôle de qualité, etc.) Limites imposées au niveau de la traduction des concepts

© M. Hudon Pourquoi organiser et contrôler ? Some users come to a search for information knowing exactly what they want. But other users do not quite know or are unable to articulate the object of their search, and yet they are able to recognize it immediately when they find it. Such users expect guidance. An example is the guidance provided by a classification used to order books that are stored on the shelves of a library. Walking through library stacks and browsing, a user may suddenly come across just the right book and credit his luck with serendipity. But such a finding would be serendipitous only if the books were shelved in random order, whereas in fact they are ordered according to a rigorous system of semantic relationships, which like an invisible hand guides the seeker to his lucky find (Svenonius 2000, 19).