23 Nov. 2005Colloque Médiathèques1 Nouvelles méthodes d’accès assisté à l’information Approches sémantiques Documents textuels et multimédia Patrice Enjalbert - GREYC - Université de Caen Mauro Gaio - LUPPA - Université de Pau et Pays de l ’Adour
23 Nov. 2005Colloque Médiathèques2 Caractéristiques de la Recherche d ’Information « courante » –Centrées sur le texte. –Centrées sur la forme (chaînes de caractères : méthodes « de surface ») –Retour de listes de documents –Méthodes de type « statistiques » pour améliorer la pertinence des réponses. Nouvelles tendances « sémantiques » –Améliorer le « matching » entre requêtes et documents en exploitant peu ou prou le sens des textes –Proposer de nouveaux modes d’accès (passages, navigation, résumés de différents types…) –Accéder aux documents multimédia (image / audio / vidéo) également par « le contenu »
23 Nov. 2005Colloque Médiathèques3 Accès à l ’information textuelle : 3 aspects — 3 exemples p Expansion de requête : exploiter des relations lexicales (= entre mots) p Indexation spatiale et temporelle : analyse de syntagmes (micro syntaxe) p Résumé, navigation : capter l ’organisation des textes
23 Nov. 2005Colloque Médiathèques4 1. Expansion de requêtes Exploiter les relations lexicales pEtendre la requête à des mots sémantiquement proches : synonymes, hyperonyme (sur- classe), hyponymes (sous-classes), méronymes (parties de) p Désambiguïser la requête et le texte pExtension : exploitation d’ontologies spécifiques d’un domaine
23 Nov. 2005Colloque Médiathèques5 ttt voilier uuu … comparaison bateau navire voilier cargo Porte cochère xxx yyy zzz ttt … ttt xxx uuu … comparaison xxx vv blah zzz tt blah Recherche par la forme Recherche par le sens navire yyy zzz ttt …
23 Nov. 2005Colloque Médiathèques6 pRessources lexicales –Généralistes : Wordnet Eurowordnet Balkanet Sémiographe (Mémodata) –Spécialisées : expansions de ces ressources généralistes pour un domaine technique –Dictionnaires de terminologie, Dictionnaires de synonyme, Dictionnaires de langue –…
23 Nov. 2005Colloque Médiathèques7 pSpécificités du document géographique Relier un phénomène (Quoi) à une localisation spatiale (Où) et temporelle (Quand) analyses de l ’expression de l’espace et du temps Document composite : Texte / Cartes pApplications Intelligence Territoriale : Document socio-économiques ancrés dans un territoire et une histoire Domaine Culturel : Fonds documentaires régionaux multimédia, Tourisme culturel… 2. Requêtes spatiales et temporelles : projet Géosem Exploiter une syntaxe « locale »
23 Nov. 2005Colloque Médiathèques8 pRequêtes multicritère : Retour de passages dans les documents qui « matchent référentiellement » (+ ontologie thématique) : - échec scolaire en 1986 dans l ’Orne, - développement des ZEP dans les années 80 dans l ’Ouest…
23 Nov. 2005Colloque Médiathèques9 pAnalyse thématique –Repérage de segments thématiquement homogènes –Combinaison de méthodes d’indexation documentaire (type tf.idf) et d’indices linguistiques : « en ce qui concerne… », « quant à… », segments spatio- temporels… –Visualisation / navigation dans le corpus. –Exemples : projet Régal, projet GéoSem 3. Nouveaux modes d’accès Exploiter l’organisation du document
23 Nov. 2005Colloque Médiathèques10 pAutres aspects, autres méthodes : –Résumé automatique = même type de techniques, présentation différente ou complémentaire –Structuration des documents techniques : Constitution automatique d’index de termes ou d ’entités, pose de liens hypertextuels… –…
23 Nov. 2005Colloque Médiathèques11
23 Nov. 2005Colloque Médiathèques12 Niveau 2: l’utilisateur considère les documents en liaison avec ses centres d’intérêts ThèmesÉpoques Types de documents Votre intérêt porte sur 1325 documents répartis comme suit: documents en relation avec le thème "églises" documents en relation avec le thèmes "châteaux" - … documents sur la période documents sur la période … documents sur Pau - 95 documents sur Orthez - … cartes postales textes issus de revues - ….. Lieux Navigation spatiale Navigation documentaire Vue documentaire Zone d'interprétation Vous vous intéressez à un ensemble de documents relatifs au Béarn. Vous vous intéressez à un ensemble de documents évoquant Orthez, Lescar, Pau, Gan, Oloron Ste-Marie, Lurbe St Christau, Sarrance, Accous, Etsaut, Col du Somport. Églises ………142 doc. Châteaux ……425 doc. Forêts ……… 341 doc. Faune ………238 doc. Flore ……… 198 doc. Recherche libre Agriculture ………489 doc. Climat ……………259 doc. Population …….…642 doc. Villages …………. 787 doc. Fleuves …………..241 doc. Requête libreOk Ok