La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

23 Nov. 2005Colloque Médiathèques1 Nouvelles méthodes d’accès assisté à l’information Approches sémantiques Documents textuels et multimédia Patrice Enjalbert.

Présentations similaires


Présentation au sujet: "23 Nov. 2005Colloque Médiathèques1 Nouvelles méthodes d’accès assisté à l’information Approches sémantiques Documents textuels et multimédia Patrice Enjalbert."— Transcription de la présentation:

1 23 Nov. 2005Colloque Médiathèques1 Nouvelles méthodes d’accès assisté à l’information Approches sémantiques Documents textuels et multimédia Patrice Enjalbert - GREYC - Université de Caen Mauro Gaio - LUPPA - Université de Pau et Pays de l ’Adour

2 23 Nov. 2005Colloque Médiathèques2 Caractéristiques de la Recherche d ’Information « courante » –Centrées sur le texte. –Centrées sur la forme (chaînes de caractères : méthodes « de surface ») –Retour de listes de documents –Méthodes de type « statistiques » pour améliorer la pertinence des réponses. Nouvelles tendances « sémantiques » –Améliorer le « matching » entre requêtes et documents en exploitant peu ou prou le sens des textes –Proposer de nouveaux modes d’accès (passages, navigation, résumés de différents types…) –Accéder aux documents multimédia (image / audio / vidéo) également par « le contenu »

3 23 Nov. 2005Colloque Médiathèques3 Accès à l ’information textuelle : 3 aspects — 3 exemples p Expansion de requête : exploiter des relations lexicales (= entre mots) p Indexation spatiale et temporelle : analyse de syntagmes (micro syntaxe) p Résumé, navigation : capter l ’organisation des textes

4 23 Nov. 2005Colloque Médiathèques4 1. Expansion de requêtes Exploiter les relations lexicales pEtendre la requête à des mots sémantiquement proches : synonymes, hyperonyme (sur- classe), hyponymes (sous-classes), méronymes (parties de) p Désambiguïser la requête et le texte pExtension : exploitation d’ontologies spécifiques d’un domaine

5 23 Nov. 2005Colloque Médiathèques5 ttt voilier uuu … comparaison bateau navire voilier cargo Porte cochère xxx yyy zzz ttt … ttt xxx uuu … comparaison xxx vv blah zzz tt blah Recherche par la forme Recherche par le sens navire yyy zzz ttt …

6 23 Nov. 2005Colloque Médiathèques6 pRessources lexicales –Généralistes : Wordnet http://www.cogsci.princeton.edu/~wn/ Eurowordnet http://www.illc.uva.nl/EuroWordNet/ Balkanet http://www.ceid.upatras.gr/Balkanet/ Sémiographe (Mémodata) http://www.memodata.com –Spécialisées : expansions de ces ressources généralistes pour un domaine technique –Dictionnaires de terminologie, Dictionnaires de synonyme, Dictionnaires de langue –…

7 23 Nov. 2005Colloque Médiathèques7 pSpécificités du document géographique  Relier un phénomène (Quoi) à une localisation spatiale (Où) et temporelle (Quand)  analyses de l ’expression de l’espace et du temps  Document composite : Texte / Cartes pApplications  Intelligence Territoriale : Document socio-économiques ancrés dans un territoire et une histoire  Domaine Culturel : Fonds documentaires régionaux multimédia, Tourisme culturel… 2. Requêtes spatiales et temporelles : projet Géosem Exploiter une syntaxe « locale »

8 23 Nov. 2005Colloque Médiathèques8 pRequêtes multicritère : Retour de passages dans les documents qui « matchent référentiellement » (+ ontologie thématique) : - échec scolaire en 1986 dans l ’Orne, - développement des ZEP dans les années 80 dans l ’Ouest…

9 23 Nov. 2005Colloque Médiathèques9 pAnalyse thématique –Repérage de segments thématiquement homogènes –Combinaison de méthodes d’indexation documentaire (type tf.idf) et d’indices linguistiques : « en ce qui concerne… », « quant à… », segments spatio- temporels… –Visualisation / navigation dans le corpus. –Exemples : projet Régal, projet GéoSem 3. Nouveaux modes d’accès Exploiter l’organisation du document

10 23 Nov. 2005Colloque Médiathèques10 pAutres aspects, autres méthodes : –Résumé automatique = même type de techniques, présentation différente ou complémentaire –Structuration des documents techniques : Constitution automatique d’index de termes ou d ’entités, pose de liens hypertextuels… –…

11 23 Nov. 2005Colloque Médiathèques11

12 23 Nov. 2005Colloque Médiathèques12 Niveau 2: l’utilisateur considère les documents en liaison avec ses centres d’intérêts ThèmesÉpoques Types de documents Votre intérêt porte sur 1325 documents répartis comme suit: - 142 documents en relation avec le thème "églises" - 425 documents en relation avec le thèmes "châteaux" - ….. - 143 documents sur la période 1700-1750 - 104 documents sur la période 1751-1800 - ….. - 158 documents sur Pau - 95 documents sur Orthez - ….. - 84 cartes postales - 459 textes issus de revues - ….. Lieux Navigation spatiale Navigation documentaire Vue documentaire Zone d'interprétation Vous vous intéressez à un ensemble de documents relatifs au Béarn. Vous vous intéressez à un ensemble de documents évoquant Orthez, Lescar, Pau, Gan, Oloron Ste-Marie, Lurbe St Christau, Sarrance, Accous, Etsaut, Col du Somport. Églises ………142 doc. Châteaux ……425 doc. Forêts ……… 341 doc. Faune ………238 doc. Flore ……… 198 doc. Recherche libre Agriculture ………489 doc. Climat ……………259 doc. Population …….…642 doc. Villages …………. 787 doc. Fleuves …………..241 doc. Requête libreOk Ok


Télécharger ppt "23 Nov. 2005Colloque Médiathèques1 Nouvelles méthodes d’accès assisté à l’information Approches sémantiques Documents textuels et multimédia Patrice Enjalbert."

Présentations similaires


Annonces Google