La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Université Mouloud Mammeri de Tizi-Ouzou

Présentations similaires


Présentation au sujet: "Université Mouloud Mammeri de Tizi-Ouzou"— Transcription de la présentation:

1 Université Mouloud Mammeri de Tizi-Ouzou
R2I Juin 2011 Modèle de Recherche d’Information Personnalisée Basé sur les Réseaux Bayésiens Mme Farida Achemoukh - Adouane Mr Rachid Ahmed-Ouamer Laboratoire LARI Université Mouloud Mammeri de Tizi-Ouzou Monsieur les membres de jury, l’honorable assistance Bonjour, j’ai l’honneur de vous présenter mon travail intitulé modèle de recherche d’information personnalisée basé sur les réseaux bayésiens

2 Plan de la présentation
Introduction Problématique Accès Personnalisé à l’ Information Contribution Conclusion & perspectives Les points a développer consiste on une introduction, problématique, l’accès personnalisée à l’information, la contribution et enfin une concluction avec les perspectives envisagées R2I juin 2011

3 C’est l’expression d’un besoin en information
Introduction La vocation d’un système de recherche d’information est de fournir à l’utilisateur des informations utiles Virus biologique Virus informatique Q=‘virus’ Q=‘virus’ Collection documents Requête C’est l’expression d’un besoin en information Le problème des systèmes classique repose sur le fait que la pluparts des requêtes soumissent par des utilisateurs ne ciblent pas précisément leur besoin en informations Nous prenons l’exemple de Deux utilisateurs de profession différentes (un informaticien et un biologiste)soumettent la même requête (virus) , auront exactement les même résultats par le SRI. Il faut donc une meilleure connaissance de l’utilisateur pour composer le manque de précision de la requête, D’où l’idée de prise en compte de l’utilisateur dans la recherche d’information SRI Doc 1 Doc 1 Doc N Doc N 12/06/2011 R2I juin 2011

4 Introduction Le système tiens compte de la requête utilisateur et des informations qui le décrivent Virus informatique Q=‘virus’ Profil utilisateur Domaine d’intérêt : informatique Collection documents SRI Dans ce cas l’utilisateur soumet sa requête et le système prend en compte des informations qui le décrivent (domaine d’intérêt) ce qui permet d’obtenir des résultats adaptés a son besoin Profil utilisateur informations décrivant ses centres d’intérêts et ses préférences Doc 1 Doc M Personnalisation de l’information 12/06/2011jz 12/06/2011 R2I juin 2011

5 Problématique Comment modélisation l'utilisateur ?
Comment inclure l’utilisateur dans le processus d'accès à l'information ? La problématique majeure de la personnalisation de l'accès à l'information est liée principalement au choix du modèle a utiliser pour représenté et construire l’utilisateur ainsi que son exploitation dans le processus de recherche 12/06/2011 R2I juin 2011

6 Accès Personnalisé à l’ Information
Modèlisation de l’utilisateur Representation du Profil Vectorielle (Gowan 2003) Hiérarchique (Micarelli et al.2004) Multidimensionnlle (Kostadinov 2003) Construction du Profil Explicite (Kraft et al.2005) Implicite (Gauch et al.2003) Plusieurs approches on été développées pour modéliser l'utilisateur ; cependant elles diffèrent dans la manière de représenter, et de construire son profil . La représentation du profil utilisateur peur être : 1. vectorielle: dans ce cas le profil est constitué d’un ou de plusieurs vecteurs définis dans un espace de termes. exemple systèmes : Alipes, WebMate et Surfagent 2 hiérarchique : les caractéristiques utilisateur sont organisées dans une structure hiérarchique de concepts (catégorie) représentant les domaines d'intérêt Exemple system dans le système OBIWAN. SmartPush 3. oubien multidimensionnelle : LE profil est représenté dans ce cas par un modèle structuré de dimensions (ou catégorie) prédéfinis . Une fois effectué le choix de la représentation, la construction du profil consiste à la collecte des informations qui le représentent et cela d’une manière explicite, en se basant sur les informations fournies directement par l’utilisateur, Ou Implicitement à partir des documents consultés et de comportement de l’utilisateur (temps de lecture d’un document ,sauvrade , impression) 12/06/2011 R2I juin 2011

7 Accès Personnalisé à l’ Information
Exploitation du Profil Utilisateur dans le processus de recherche Reformulation de la requête (Sieg et al. 2004), (Koutrika et al.2005) augmentation de la requête par des termes issus du profil utilisateur Appariement Requête- Documents (Haveliwala et al.2002), (Zemirli et al. 2008) compte tenu de la requête et du profil utilisateur dans le calcul de pertinence de documents Présentation des résultats de recherche (Gowan 2003),(Liu et al.2004) Le score final est la combinaison de score de similarité entre le document et le profil avec le score d’appariement initial du document La personnalisation d’accès à l’information consiste a intégrer le profil utilisateur dans au moins l’une des phases du processus de recherche. telles que: la reformulation de requête ou la requête initiale est augmenter par des termes issus du profil l’appariement requête-document le profil est intégré dans le calcul de pertinence du document ’ pour la phase d’ ordonnancement des résultats de recherche cela consiste à associer le profil utilisateur dans les résultats finaux de recherche 12/06/2011 R2I juin 2011

8 Contribution Idée directrice
Les Réseaux Bayésiens constituent un outil puissant pour la représentation des connaissances Les utiliser pour la présentation des différentes informations participantes à la définition du modèle de recherche Définition d’un module d’appariement intégrant le profil utilisateur Notre contribution consiste à présenter le profil utilisateur, comme composante à part , au même titre que la requête et les documents participants à la définition d’un modèle de recherche en utilisant Les Réseaux Bayésiens, ces derniers constituent un outil puissant pour la représentation des connaissances ensuite on intègre ce même profil dans le module d’appariement du système de RI. 12/06/2011 R2I juin 2011

9 Contribution Démarche adoptée
Définition de la librairie des centres d’intérêts chaque centre d’intérêt ck est défini comme un vecteur de termes ti pondérés selon la formule BM25 (Kassab R et al. 2005) N :le nombre total de documents de la collection ; n : le nombre de documents de la collection contenant le terme ti ; R : le nombre de documents pertinents face à une requête utilisateur ; r : le nombre de documents pertinents contenant le terme ti. En premier nous définissons une librairie des centres d’intérêts, nous supposons un ensemble de requêtes utilisateurs, pour chacune on définit le centre d’intérêt correspondent (profil correspondant) Qui sera représenté comme un vecteur de termes pondérés issus des documents pertinents selon le SRI classique face à la même requête BM25 permet la distribution des termes dans les documents pertinents et les non pertinents (un terme important pour le centre est celui qui apparais dans les docs pertinents et apparais peu dans les non pertinents) Remarque: un profil = un centre d’interet En essaye de trouver le profil de chaque utilisateur dans la libraire de centres ( profils) 12/06/2011 R2I juin 2011

10 Contribution 2. Présentation du modèle
Le modèle consiste en un graphe G= (V, E) acyclique orienté Nœuds V englobent la requête, les documents de la collection et la librairie de centres d’intérêts Arcs E orientés des termes constituant l’espace d’indexation, vers les documents, les requêtes et les centres d’intérêts. requête Termes Documents Centres d’intérêts Notre modèle consiste en un graphe acyclique orienté, il permet en plus de la représentation des termes d’indexation, des documents et de la requête utilisateur, la représentation de la librairie des centres d’intérêts qui constituent la dimension principale de la personnalisation de l’information. Le son des arcs représentent les relations de dépendances entre les différentes dimensions avec l’espace de termes. Les trois dimensions (requete, document, centre d’intérêt) sont représentés dans l’espace des termes d’indaxation d’où l’orientation des arcs 12/06/2011 R2I juin 2011

11 Contribution 3. Calcul de la Pertinence
(1) U : l’ensemble des configurations u possibles de termes. P(u) : la probabilité à priori associée à une configuration de termes L’espace de termes est réduit à la configuration couverte par la requête q P(q/u)= si q=u 0 sinon Le calcul de la pertinence revient à instancier chaque document de la collection et un à un chacun des centres d'intérêts utilisateur. L’ equation (1) calcul le degré de couverture des trois concepts (requête ,document, centre) pour l’espace des termes d’indexation pour minimiser les calcul on prend seule la configuration qui couvre la requête utilisateur la probabilité de satisfaire la requête étant donnés le document et le centre d'intérêt instanciés et alors estimer comme degré de convergence des trois concepts. Pour Le calcul des probabilités P (ck/uq) et P (dj/uq) on utilise leurs correspondances en mesure vectorielle de cosinus (cosinus d’angle entre les trois vecteurs) Nous avons utilisé la mesure cosinus vectorielle.(elle a largement prouver son efficacité) Le modèle « réseau bayésien » généralise « le modèle vectoriel » l’équation (1) peut être écrite 12/06/2011 R2I juin 2011

12 Table 1. Librairie de centres d’intérêts
Contribution 4. Exemple illustratif Soit une collection= {d1, d2, d3, d4, d5} d1= {10t1, 2t2, 4t3, 5t5}, d2= {4t1, 9t2, 7t6}, d3= {5t2, 7t3, 12t4, 9t6} d4= {2t1, 11t4, 3t5, 7t6} , d5= {10t2, 15t3, 5t4, 8t5, 14t6} Libraire des centres d’intérêts Requêtes Q= {q1, q2, q3, q4, q5 } q1= {t1} ,q2= {t2} , q3= {t3} , q4= {t4}, q5= {t5} Comme exemple, Nous supposons une collection de cinq document et un ensemble de cinq requête utilisateur pour lesquelles nous définissons les documents pertinents retournés par un système de recherche classique Pour le choix des documents pertinents face à toute requête, nons avons fixe un seuil de pertinence à une valeur de 0.4 défini par rapport a notre exemple et elle correspond à la valeur medium des moyennes de pertinences de documents correspondantes a chaque requête (0.54, 0.25, 041, 0.53,0.36) pour la validé il faut une expérimentation)) Table 1. Librairie de centres d’intérêts 12/06/2011 R2I juin 2011

13 Contribution Architecture du modèle ordre de pertinence
Centres d’intérêts Collection documents Termes d’indexation t1 t2 t6 t3 t4 t5 d1 d2 d3 d4 d5 C1 C2 c3 c4 c5 ordre de pertinence Avec intégration du profil + D5 D2 D3 D4 - D1 + D2 D5 D4 D3 - D1 c4 Le modèle est illustré par le schéma suivant Supposons maintenant une nouvelle requête utilisateur q= {t6} pour laquelle on cherche le centre d’intérêt adéquat et les documents pertinents associés. Le résultat de la recherche classique à donné L‘l’ordre de pertinence suivantsd5, d2, ces résultats obtenue selon notre modèle montre que le centre d’intérêt correspondant à la requête q= {t6} est c4, combiné avec les documents présentés selon un ordre décroissant de pertinence : d2, d5, d4, d3.d1 Effectivement d’après la distribution des termes dans les centres d’intérêts (cf. table 3), le terme t6 figure dans le centre d’intérêt c4 avec la plus grande valeur de pondération et il figure aussi dans les quatre documents (cf. table 1). La fréquence d’apparition du terme t6 est plus élevée dans le document d5 mais le document le plus pertinent est le document d2 (cela est du à la prise en compte de la distribution des termes dans toute la collection de documents). Q Requête utilisateur 12/06/2011 R2I juin 2011

14 Conclusion Le modèle proposé mesure la pertinence comme un degrés de convergence des trois concepts document, requête utilisateur et centre d’intérêt La prise en compte du profil utilisateur modélisé par son centre d’intérêt dans le module d’appariement permet un bon ordonnancement des résultats. Pour conclure nous estimons que La prise en compte du profil utilisateur modélisé par son centre d’intérêt dans le module d’appariement à permet un bon ordonnancement des résultats. 12/06/2011 R2I juin 2011

15 Perspectives personnalisée Prise en compte de l’évolution du profil
Validation du modèle proposé sur une collection personnalisée Prise en compte de l’évolution du profil utilisateur dans le modèle proposé Comme perspectives nous envisageons la Validation du modèle sur la collection personnalisée Ainsi que la Prise en compte de l’évolution du profil utilisateur dans le modèle proposé . 12/06/2011 R2I juin 2011

16 Merci de votre attention!
12/06/2011 R2I juin 2011


Télécharger ppt "Université Mouloud Mammeri de Tizi-Ouzou"

Présentations similaires


Annonces Google