La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Saïd RADHOUANI Directeurs de thèse : Jean-Pierre CHEVALLET, UJF

Présentations similaires


Présentation au sujet: "Saïd RADHOUANI Directeurs de thèse : Jean-Pierre CHEVALLET, UJF"— Transcription de la présentation:

1 Un modèle de Recherche d’Information orienté précision fondé sur les dimensions de domaine
Saïd RADHOUANI Directeurs de thèse : Jean-Pierre CHEVALLET, UJF Yves CHIARAMELLA, UJF Gilles FALQUET, UniGe 18 juillet 2008

2 Langage d’interrogation
Contexte Objectif : Sélectionner les documents pertinents qui traitent du thème de la requête. Requête Indexation Interrogation Correspondance Langage d’indexation Langage d’interrogation ----- Documents ordonnés 18 juillet 2008 © S. Radhouani

3 Contexte Contexte de recherche : utilisateur décrit un besoin précis
Milieux professionnels (médecine, physique, etc.) Requête précise Terminologie spécifique ex. "Un compte-rendu sur le type de traitements à effectuer en cas d’un cancer du sein de stade M0" Structure sémantique complexe Relations sémantiques ex. "Les documents qui parlent du général français responsable de la création de la zone de sécurité pendant le conflit des Balkans" Opérateurs ex. "Des images de la peau de la main sans aucune pathologie" Quantificateurs ex. "Une image qui contient Zinedine Zidane tout seul" 18 juillet 2008 © S. Radhouani

4 Document Requête [CLEF05] Problématique … pendant la guerre civile qui a eu lieu en ex-Yougoslavie, les Nations Unies ont chargé Philippe Morillon de créer une zone de sécurité. Celle-ci couvre la Serbie, la Slovénie … Donne-moi les documents qui parlent du général français responsable de la création de la zone de sécurité pendant le conflit des Balkans. Personne Lieu Géographique Evénement Philippe Morillon Ex-Yougoslavie Zone de sécurité Serbie Slovénie Guerre civile d’Ex-Yougoslavie Général Français Balkans Conflit des Balkans Conflit des Balkans est_un créé_pendant Balkans partie_de Zone de sécurité Ex-Yougoslavie Général originaire_de Philippe Morillon France a_lieu_à Guerre civile d’Ex-Yougoslavie Guerre civile d’Ex-Yougoslavie Conflit des Balkans Philippe Morillon Ex-Yougoslavie Zone de sécurité Serbie Slovénie Général Français Balkans Le SRI a besoin de connaissances, autres que celles présentes dans le texte. Y a-t-il des éléments, autres que les descripteurs, qu’un document doit partager avec la requête pour qu’il soit considéré pertinent ? 18 juillet 2008 © S. Radhouani

5 Vers une RI basée sur les dimensions
ex. Politique : personne, lieu géographique, époque, événement, etc. Médecine : anatomie, pathologie, stade de la maladie, etc. Une dimension d’un domaine est un concept utilisé pour exprimer des thèmes dans ce domaine Idée de notre approche Domaine : un thème peut être développé en faisant référence à un ensemble de dimensions de ce domaine Auteur  domaine  thème  dimensions  termes  document Médecin  médecine  image médicale  anatomie  fémur  compte rendu 18 juillet 2008 © S. Radhouani

6 Objectifs et besoins Résoudre des requêtes précises
Interpréter le contenu sémantique véhiculé par la structure extraite des documents et des requêtes Tenir compte de la complexité de la structure sémantique des requêtes Tenir compte des dimensions de domaine Ressources externes (ontologie, thésaurus, taxonomie, etc.) Définition des dimensions Terminologie spécifique Relations sémantiques Langage de document expressif Indexation précise du contenu sémantique (dimensions, relations) Langage de requête expressif Expression de besoin précis (opérateurs, relations, etc.) 18 juillet 2008 © S. Radhouani

7 Plan Introduction État de l’art : ressources externes & dimensions
Indexation Interrogation Dimensions Synthèse Modèle de RI fondé sur les dimensions de domaine Formalisme de représentation de connaissances Modèle de connaissances Unité d’indexation Modèle de document Modèle de requête Expérimentations Conclusion 18 juillet 2008 © S. Radhouani

8 Langage d’interrogation
Introduction Etat de l’art Modèle Expérimentations Conclusions Indexation Interrogation Dimensions Synthèse Ressources externes & dimensions Ressources externes Requête Indexation Interrogation Correspondance Langage d’indexation Langage d’interrogation ----- Documents ordonnés 18 juillet 2008 © S. Radhouani

9 Indexation conceptuelle
Introduction Etat de l’art Modèle Expérimentations Conclusions Indexation Interrogation Dimensions Synthèse Indexation conceptuelle Un concept est un objet mental défini comme une abstraction généralisée à partir de propriétés communes à des objets concrets. Général C01 Officier de l’armée C02 Chef d’un ordre religieux C03 Ce qui concerne le tout Représentation par des concepts au lieu de mots ambigus [Baziz05, Biemann05, Vallet05, Maisonnasse08] Représentation : sac de concepts Correspondance : partage de concepts entre document et requête Relations sémantiques non exploitées Utilisation des relations seulement pour la désambiguïsation [Baziz05] 18 juillet 2008 © S. Radhouani

10 Langage d’interrogation
Introduction Etat de l’art Modèle Expérimentations Conclusions Indexation Interrogation Dimensions Synthèse Ressources externes & dimensions Ressources externes Requête Indexation Interrogation Correspondance Langage d’indexation Langage d’interrogation ----- Documents ordonnés 18 juillet 2008 © S. Radhouani

11 Introduction Etat de l’art Modèle Expérimentations Conclusions Indexation Interrogation Dimensions Synthèse Expansion de requêtes Relations Exemples Généralisation/spécialisation {voiture} est_un {véhicule à moteur} Composition {voiture} est_composé_de {{porte}, {moteur}} Utiliser les relations  enrichir le contenu de la requête [Voorhees94, Mihalcea00, Baziz et al.03] Représentation de la requête étendue : sac de concepts Correspondance : partage de concepts entre document et requête étendue Utilisation des relations seulement pour l’expansion 18 juillet 2008 © S. Radhouani

12 Langage d’interrogation
Introduction Etat de l’art Modèle Expérimentations Conclusions Indexation Interrogation Dimensions Synthèse Ressources externes & dimensions Ressources externes Requête Indexation Interrogation Correspondance Langage d’indexation Langage d’interrogation ----- Documents ordonnés 18 juillet 2008 © S. Radhouani

13 RI & dimensions de domaine
Introduction Etat de l’art Modèle Expérimentations Conclusions Indexation Interrogation Dimensions Synthèse RI & dimensions de domaine Paradigme de recherche multi-facette [S. R. Ranganathan 1931] Interface pour la navigation dans une collection [Yee 03, Hearst 06, Mäkelä 06] Construction manuelle des facettes/dimensions : hiérarchies de concepts Pas d’évaluation en termes de performance de recherche Tests d’utilisabilité : approches prometteuses mais limitées à petite échelle [Yee 03, Diederich 06] Annotée manuellement Statique, de petite taille Difficulté à résoudre des requêtes précises Structure sémantique complexe (opérateurs) Terminologie spécialisée : navigation profonde dans les hiérarchies de concepts  lourde surcharge cognitive 18 juillet 2008 © S. Radhouani

14 Introduction Etat de l’art Modèle Expérimentations Conclusions Indexation Interrogation Dimensions Synthèse Synthèse Approches existantes : insuffisantes devant les exigences présentées Résoudre des requêtes précises Interpréter la sémantique véhiculée par la structure extraite des documents et des requêtes Tenir compte des dimensions Utiliser les relations sémantiques Besoin de ressources externes Représentation uniforme des documents, requêtes, et ressources externes => Formalisme de représentation de connaissances commun à ces trois éléments Opération de comparaison  fonction de correspondance Prendre en compte les exigences des utilisateurs en termes d’opérateurs (booléens, quantificateurs, etc.) 18 juillet 2008 © S. Radhouani

15 Plan Introduction État de l’art : ressources externes & dimensions
Indexation Interrogation Dimensions Synthèse Modèle de RI fondé sur les dimensions de domaine Formalisme de représentation de connaissances Modèle de connaissances Unité d’indexation Modèle de document Modèle de requête Expérimentations Conclusion 18 juillet 2008 © S. Radhouani

16 La logique descriptive
Introduction Etat de l’art Modèle Expérimentations Conclusions Formalisme Connaissances Unité d’indexation Document Requête La logique descriptive Logique Descriptive (DL) = Logique Terminologique ALCQ : Attribute Language with Complements and Qualified number restriction Modéliser les connaissances d’un domaine (concepts et relations) Satisfait les exigences de notre modèle (opérateurs : ⊓, ⊔ ; quantificateurs : ∃, ≥) T(erminological)-Box : ensemble d’axiomes terminologiques de la forme C ≡ D ou C ⊑ D Algorithme de calcul de subsomption : déduire des connaissances implicites Général ⊑ Personne Philippe Morillon ⊑ Général => Philippe Morillon ⊑ Personne 18 juillet 2008 © S. Radhouani

17 Logique descriptive & RI
Introduction Etat de l’art Modèle Expérimentations Conclusions Formalisme Connaissances Unité d’indexation Document Requête Logique descriptive & RI DL Rdoc Rq ⊑T Physical document Physical document Physical document Physical document Physical document Physical document Physical document Physical query correspondance q : une requête doc : un document RI 18 juillet 2008 © S. Radhouani

18 Langage d’interrogation
Introduction Etat de l’art Modèle Expérimentations Conclusions Formalisme Connaissances Unité d’indexation Document Requête Modèle de connaissances Ressources externes Requête Indexation Interrogation Correspondance Langage d’indexation Langage d’interrogation ----- Documents ordonnés 18 juillet 2008 © S. Radhouani

19 Modèle de connaissances
Introduction Etat de l’art Modèle Expérimentations Conclusions Formalisme Connaissances Unité d’indexation Document Requête Modèle de connaissances Ressource externe : K = (C, R, Dim, T) Concepts : C ={c1, …, cnc} Rôles : R = {R1, …, Rnr} Dimensions : Dim = {dim1, …, dimnd} dimi = (rac_dimi, Ci ) rac_dimi  C : racine de la hiérarchie définissant dimi Ci = {c  C | c ⊑ rac_dimi} T-Box : T (connaissances du domaine) 18 juillet 2008 © S. Radhouani

20 Modèle de connaissances : exemple
Introduction Etat de l’art Modèle Expérimentations Conclusions Formalisme Connaissances Unité d’indexation Document Requête Modèle de connaissances : exemple Événement ⊑ T Conflit des Balkans ⊑ Evénement Guerre civile d’Ex-Yougoslavie ⊑ Conflit des Balkans Conflit des Balkans ≡ ∃a_lieu_à.Balkans Lieu géographique ⊑ T France ⊑ Lieu géographique Balkans ⊑ Lieu géographique Ex-Yougoslavie ⊑ Lieu géographique Ex-Yougoslavie ≡ ∃partie_de.Balkans Zone de sécurité ⊑ Lieu géographique Serbie ⊑ Ex-Yougoslavie Slovénie ⊑ Ex-Yougoslavie Zone de sécurité ≡ ∃créé_pendant.Conflit des Balkans Personne ⊑ T Général ⊑ Personne Philippe Morillon ⊑ Général Philippe Morillon ≡ ∃originaire_de.France C = {Evénement, Personne, etc.} R = {originaire_de, partie_de, etc.} Dim = {Événement, Lieu géographique, Personne} dimPersonne = (Personne, {Général, Philippe Morillon, …}) T-Box 18 juillet 2008 © S. Radhouani

21 Introduction Etat de l’art Modèle Expérimentations Conclusions Formalisme Connaissances Unité d’indexation Document Requête Unité d’indexation Produire une représentation précise du contenu sémantique des documents (requêtes) Interpréter la sémantique véhiculée par la structure extraite des documents (requêtes) Se détacher de l’aspect sac de concepts Utiliser les dimensions, concepts, et relations ex. Interprétation de "Général français" élément de la dimension "Personne" est "Général" originaire de "France" 18 juillet 2008 © S. Radhouani

22 Unité d’indexation : élément de dimension
Introduction Etat de l’art Modèle Expérimentations Conclusions Formalisme Connaissances Unité d’indexation Document Requête Unité d’indexation : élément de dimension Un élément d’une dimension dim est une expression ALCQ qui cherche à correspondre le plus précisément possible au concept de dim auquel il est fait référence dans un document ou une requête. Tout concept d’une dimension est susceptible de constituer un élément de cette dimension lorsqu’il est utilisé dans un document ou une requête edim ≡ cidf_1 ⊓ … ⊓ cidf_n ⊓ ∃décrit_par.cdes_1 ⊓ … ⊓ ∃décrit_par.cdes_m cidf  dim : identifier edim cdes  dim : décrire edim décrit_par : relation générique pour la modélisation ex. edim ≡ Général ⊓ ∃originaire_de.France 18 juillet 2008 © S. Radhouani

23 Langage d’interrogation
Introduction Etat de l’art Modèle Expérimentations Conclusions Formalisme Connaissances Unité d’indexation Document Requête Représentation des documents Ressources externes Requête Indexation Interrogation Correspondance Langage d’indexation Langage d’interrogation ----- Documents ordonnés 18 juillet 2008 © S. Radhouani

24 Représentation des documents
Introduction Etat de l’art Modèle Expérimentations Conclusions Formalisme Connaissances Unité d’indexation Document Requête Représentation des documents document : doc  représenté par des éléments de dimension Rdoc : expression ALCQ = conjonction d’éléments de dimension indexé_par : rôle pour associer un élément de dimension à un document Rdoc ≡ ∃indexé_par.edim1 ⊓ … ⊓ ∃indexé_par.edimn Un élément de dimension peut être pondéré (ne fait pas partie de la DL) Rdoc est ajouté à la T-Box 18 juillet 2008 © S. Radhouani

25 Exemple T-Box edim1 ≡ Philippe Morillon
Introduction Etat de l’art Modèle Expérimentations Conclusions Formalisme Connaissances Unité d’indexation Document Requête Exemple T-Box Rdoc Événement ⊑ T Conflit des Balkans ⊑ Evénement Guerre civile d’Ex-Yougoslavie ⊑ Conflit des Balkans Conflit des Balkans ≡ ∃a_lieu_à.Balkans Lieu géographique ⊑ T France ⊑ Lieu géographique Balkans ⊑ Lieu géographique Ex-Yougoslavie ⊑ Lieu géographique Ex-Yougoslavie ≡ ∃partie_de.Balkans Zone de sécurité ⊑ Lieu géographique Serbie ⊑ Ex-Yougoslavie Slovénie ⊑ Ex-Yougoslavie Zone de sécurité ≡ ∃créé_pendant.Conflit des Balkans Personne ⊑ T Général ⊑ Personne Philippe Morillon ⊑ Général Philippe Morillon ≡ ∃originaire_de.France edim1 ≡ Philippe Morillon edim2 ≡ Zone_de_Sécurité ⊓ ∃créé_pendant.Guerre civile d’Ex-Yougoslavie edim3 ≡ Ex-Yougoslavie edim4 ≡ Serbie edim5 ≡ Slovénie edim6 ≡ Guerre civile d’Ex-Yougoslavie Rdoc ≡ ∃indexé_par.edim1 ⊓ ∃indexé_par.edim2 ⊓ ∃indexé_par.edim3 ⊓ ∃indexé_par.edim4 ⊓ ∃indexé_par.edim5 ⊓ ∃indexé_par.edim6 18 juillet 2008 © S. Radhouani

26 Langage d’interrogation
Introduction Etat de l’art Modèle Expérimentations Conclusions Formalisme Connaissances Unité d’indexation Document Requête Représentation des requêtes Ressources externes Requête Indexation Interrogation Correspondance Langage d’indexation Langage d’interrogation ----- Documents ordonnés 18 juillet 2008 © S. Radhouani

27 Représentation des requêtes
Introduction Etat de l’art Modèle Expérimentations Conclusions Formalisme Connaissances Unité d’indexation Document Requête Représentation des requêtes requête : q  représentée par des éléments de dimension Rq : expression ALCQ = combinaison d’éléments de dimensions et d’opérateurs indexé_par : rôle pour associer un élément de dimension à une requête Rq ≡ ∃indexé_par.edim1 ⊓ … ⊓ ∃indexé_par.edimn Un élément de dimension peut être pondéré (ne fait pas partie de la DL) Rq est ajouté à la T-Box 18 juillet 2008 © S. Radhouani

28 Rq ≡ ∃indexé_par.edim7 ⊓ ∃indexé_par.edim8 ⊓ ∃indexé_par.edim9
Introduction Etat de l’art Modèle Expérimentations Conclusions Formalisme Connaissances Unité d’indexation Document Requête Exemple T-Box Rdoc Événement ⊑ T Conflit des Balkans ⊑ Evénement Guerre civile d’Ex-Yougoslavie ⊑ Conflit des Balkans Conflit des Balkans ≡ ∃a_lieu_à.Balkans Lieu géographique ⊑ T France ⊑ Lieu géographique Balkans ⊑ Lieu géographique Ex-Yougoslavie ⊑ Lieu géographique Ex-Yougoslavie ≡ ∃partie_de.Balkans Zone de sécurité ⊑ Lieu géographique Serbie ⊑ Ex-Yougoslavie Slovénie ⊑ Ex-Yougoslavie Zone de sécurité ≡ ∃créé_pendant.Conflit des Balkans Personne ⊑ T Général ⊑ Personne Philippe Morillon ⊑ Général Philippe Morillon ≡ ∃originaire_de.France Rq edim7 ≡ Général ⊓ ∃orginaire_de.France edim8 ≡ Zone de Sécurité ⊓ ∃créé_pendant.Conflit des Balkans edim9 ≡ Conflit des Balkans Rq ≡ ∃indexé_par.edim7 ⊓ ∃indexé_par.edim8 ⊓ ∃indexé_par.edim9 18 juillet 2008 © S. Radhouani

29 Langage d’interrogation
Introduction Etat de l’art Modèle Expérimentations Conclusions Formalisme Connaissances Unité d’indexation Document Requête Correspondance Ressources externes Requête Indexation Interrogation Correspondance Langage d’indexation Langage d’interrogation ----- Documents ordonnés 18 juillet 2008 © S. Radhouani

30 La fonction de correspondance fSel
Introduction Etat de l’art Modèle Expérimentations Conclusions Formalisme Connaissances Unité d’indexation Document Requête La fonction de correspondance fSel Événement ⊑ T Conflit des Balkans ⊑ Evénement Guerre civile d’Ex-Yougoslavie ⊑ Conflit des Balkans Conflit des Balkans ≡ ∃a_lieu_à.Balkans Lieu géographique ⊑ T France ⊑ Lieu géographique Balkans ⊑ Lieu géographique Ex-Yougoslavie ⊑ Lieu géographique Ex-Yougoslavie ≡ ∃partie_de.Balkans Zone de sécurité ⊑ Lieu géographique Serbie ⊑ Ex-Yougoslavie Slovénie ⊑ Ex-Yougoslavie Zone de sécurité ≡ ∃créé_pendant.Conflit des Balkans Personne ⊑ T Général ⊑ Personne Philippe Morillon ⊑ Général Philippe Morillon ≡ ∃originaire_de.France fSel(doc, q) : respecter les contraintes imposées par l’utilisateur Calcul de la subsomption dans la T-Box Dpert = {doc | Rdoc ⊑T Rq} Philippe Morillon Zone de sécurité ⊓ ∃créé_pendant.Guerre civile d’Ex-Yougoslavie Général ⊓ ∃originaire_de.France Conflit des Balkans Guerre civile d’Ex-Yougoslavie ∃créé_pendant.Conflit des Balkans Rdoc ⊑T Rq Rdoc Rq Rdoc ⊑T Rq Philippe Morillon ⊑ Général Zone de sécurité ≡ ∃créé_pendant.Conflit des Balkans Philippe Morillon ≡ ∃originaire_de.France Guerre civile d’Ex-Yougoslavie ⊑ Conflit des Balkans Physical document Physical document Physical document Physical document Physical document Physical document Physical document Physical document Physical query correspondance q : une requête doc : un document T-Box 18 juillet 2008 © S. Radhouani

31 La fonction d’ordonnancement fOrd
Introduction Etat de l’art Modèle Expérimentations Conclusions Formalisme Connaissances Unité d’indexation Document Requête La fonction d’ordonnancement fOrd fOrd(doc, q) : classer les documents dans leur ordre de pertinence par rapport à q Les poids des éléments de dimension dans doc Les poids des éléments de dimension dans q Les valeurs de priorité des éléments de dimension dans q N’est pas modélisée en DL Utiliser une métrique existante Notre expérience : modèle vectoriel 18 juillet 2008 © S. Radhouani

32 Plan Introduction État de l’art : ressources externes & dimensions
Indexation Interrogation Dimensions Synthèse Modèle de RI fondé sur les dimensions de domaine Formalisme de représentation de connaissances Modèle de connaissances Unité d’indexation Modèle de document Modèle de requête Expérimentations Conclusion 18 juillet 2008 © S. Radhouani

33 Introduction Etat de l’art Modèle Expérimentations Conclusions Objectifs Données Réalisations Résultats Expériences Résoudre des requêtes précises  évaluer l’apport de l’usage des dimensions Performances de recherche Résultat de référence : modèle vectoriel sans dimensions Mise en œuvre du modèle basé sur la DL Tester la faisabilité de notre approche Évaluer les limites du modèle 18 juillet 2008 © S. Radhouani

34 ex. "show me x-ray images with fracture of the femur"
Introduction Etat de l’art Modèle Expérimentations Conclusions Objectifs Données Réalisations Résultats Données et ressources Collection ImageCLEFmed-2005 50,026 documents (Anglais, Français, Allemand) 25 requêtes ex. "show me x-ray images with fracture of the femur" Dimensions : Modalité, Pathologie, Anatomie Ressource externe : UMLS Meta thésaurus (≥ 1 million d’entrées) Réseau sémantique (135 Types sémantiques) 18 juillet 2008 © S. Radhouani

35 Indexation Construction manuelle des dimensions
Introduction Etat de l’art Modèle Expérimentations Conclusions Objectifs Données Réalisations Résultats Indexation Construction manuelle des dimensions Anatomie : "Anatomical Structure" + "Body System" + "Body Space or Junction" + "Body Location or Region" ; Pathologie : "Pathologic Function" + "Finding" + "Injury or Poisoning" ; Modalité : "Diagnostic Procedure" + "Manufactured Object". Indexation conceptuelle Outil adapté aux documents en anglais Identification des éléments de dimension Défini par un concept Si c  dim, alors c est un élément de la dimension dim Pondération des éléments de dimension Modèle vectoriel : variante du tf*idf (LTC) 18 juillet 2008 © S. Radhouani

36 Introduction Etat de l’art Modèle Expérimentations Conclusions Objectifs Données Réalisations Résultats Interrogation T1: Un document est considéré pertinent s'il contient les trois dimensions présentes dans la requête Anatomie ⊓ Pathologie ⊓ Modalité T2 : Un document est considéré pertinent s'il contient au moins une des dimensions de la requête Anatomie ⊔ Pathologie ⊔ Modalité T3 : Un document pertinent doit contenir l'anatomie, sinon la pathologie, sinon la modalité AnatomiePriorité=1 PathologiePriorité=2 ModalitéPriorité=3 T4 : Un document est considéré pertinent s'il contient les dimensions anatomie et pathologie (Anatomie ⊓ Pathologie) ⊔ Modalité 18 juillet 2008 © S. Radhouani

37 Apport de l’usage des dimensions
Introduction Etat de l’art Modèle Expérimentations Conclusions Objectifs Données Réalisations Résultats Apport de l’usage des dimensions Baseline : modèle vectoriel Variante du tf*idf (LTC) Sac de concepts Précision Test Moyenne à 5 docs à 10 docs Baseline 0.1451 0.2720 0.2440 Notre approche Précision Test à 10 docs Moyenne % à 5 docs % % T1 0.1428 -1.61 0.3524 +29.55 0.3333 +36.59 T2 0.1534 +5.72 0.3360 +23.52 0.3120 +27.86 T3 0.1579 +8.82 0.3520 +29.41 0.3240 +32.78 T4 0.1742 +20.05 0.3920 +44.11 0.3920 +60.65 18 juillet 2008 © S. Radhouani

38 Mise en œuvre du modèle Identification des éléments de dimension
Introduction Etat de l’art Modèle Expérimentations Conclusions Objectifs Données Réalisations Résultats Mise en œuvre du modèle Identification des éléments de dimension document  Traitement Automatique des Langues requête  interface Construction de la T-Box être humain  DL vs. Machine  langage adéquat (OWL) outil basé sur des heuristiques Fonction de Correspondance  calcul de la subsomption raisonneur existant Pellet [Sirin et al. 04] Ordonnancement des documents modèle vectoriel 18 juillet 2008 © S. Radhouani

39 Plan Introduction État de l’art : ressources externes & dimensions
Indexation Interrogation Dimensions Synthèse Modèle de RI fondé sur les dimensions de domaine Formalisme de représentation de connaissances Modèle de connaissances Unité d’indexation Modèle de document Modèle de requête Expérimentations Conclusion 18 juillet 2008 © S. Radhouani

40 Conclusion Modèle de RI capable de résoudre des requêtes précises
Introduction Etat de l’art Modèle Expérimentations Conclusions Bilan Perspectives Conclusion Modèle de RI capable de résoudre des requêtes précises Fondé sur les dimensions de domaine Mettre en exergue les éléments pertinents dans un domaine particulier Nouvelle unité d’indexation : l’élément de dimension Définie par des dimensions, concepts, et relations Langages de document et de requête expressifs Représenter la sémantique véhiculée par la structure extraite des documents (requêtes) 18 juillet 2008 © S. Radhouani

41 Conclusion Modélisation à base de la Logique Descriptive
Introduction Etat de l’art Modèle Expérimentations Conclusions Bilan Perspectives Conclusion Modélisation à base de la Logique Descriptive Représentation uniforme des documents, requêtes, et connaissances Fonction de correspondance Correspondance entre un document et une requête qui ne partagent pas les mêmes termes La subsomption n’est pas suffisante  définir des propriétés transitives Flexibilité : utiliser n’importe quelle relation … mais Résultats expérimentaux Prise en compte des dimensions  améliore les performances de recherche 18 juillet 2008 © S. Radhouani

42 Introduction Etat de l’art Modèle Expérimentations Conclusions Bilan Perspectives Perspectives Quantifier l’apport de l’approche  mise en œuvre de l’intégralité du modèle Extraction des éléments de dimension Traitement automatique de la langue Fonction d'ordonnancement adéquate au contexte de RI orientée précision Étudier la notion de pertinence Collaboration avec des utilisateurs professionnels (ex. médecins) Intégrer les pondérations dans le modèle Construction automatique des dimensions [Radhouani 07] Évaluation [Dakka et al.06, Stoica et al.06] Développement d’une interface interactive Test d’utilisabilité 18 juillet 2008 © S. Radhouani

43 Un modèle de Recherche d’Information orienté précision fondé sur les dimensions de domaine
Saïd RADHOUANI Directeurs de thèse : Jean-Pierre CHEVALLET, UJF Yves CHIARAMELLA, UJF Gilles FALQUET, UniGe 18 juillet 2008


Télécharger ppt "Saïd RADHOUANI Directeurs de thèse : Jean-Pierre CHEVALLET, UJF"

Présentations similaires


Annonces Google