Université Mouloud Mammeri de Tizi-Ouzou

Slides:



Advertisements
Présentations similaires
© maxime moulins
Advertisements

Fabrice Lauri, François Charpillet, Daniel Szer
Présentation du référentiel CAP « PROELEC »
UE 102 (M1.CE) Communication d’entreprise
Module 8- Les étapes de la démarche d'évaluation
MLF- Florence vendredi 19 février 2010 Arts et culture, langues, projets de dimension européenne… Quelques outils… Quelques pistes et propositions.
IREMIA : Institut de REcherche en Mathématiques et Informatique Appliquées Université de la Réunion Uniformisation des mécanismes de conception de SMA.
SYSTEMES DE CONTRÔLE – COMMANDE ET INFORMATIQUE DISTRIBUEE TEMPS REEL
Une approche informationnelle de la restauration d’images
MODELISATION DES DONNEES Licence professionnelle A Lancini.
Des B2i aux C2i, la continuité des référentiels et des certifications
Cours n°1ue304b (S. Sidhom) UE 304 b Cours_L2.documentation_n°1 Gestion des documents : Technologies de lInformation et de la Communication Par : Sahbi.
Mise en œuvre d’une démarche et d’un outil de gestion de « connaissances métier » basés sur la collaboration. Cyril BEYLIER
Journée Francilienne de recherche Opérationnelle Politiques de gestion de coûts de transit dans lInter domaine basé sur BGP Loubna ECHABBI Dominique BARTH,
ACTIVITES RAPIDES Collège Jean Monnet Préparez-vous ! Série 1A.
Présentation du référentiel CAP « PRO Elec »
Expérimentation – Fabien AUDRY – juillet 2004
Activité 1 Accueil et information du client et de l’usager
Indexation textuelle : Systèmes de recherche d’informations
Modélisation et commande hybrides d’un onduleur multiniveaux monophasé
L'intérêt d'un atelier d'expression artistique
Titre conférence lundi 27 mars 2017
Journée de Travail Groupe “Bermudes”
Développement durable Avant-projet de plan fédéral de développement durable Consultation 15/02/2004 – 14/05/2004.
Journées ABES Transformation du système universitaire français et IST Jean-Pierre Finance Président de lUniversité Henri Poincaré, Nancy.
Les cursus LCA et C2i à la Faculté de Médecine de Strasbourg
Sélection automatique d’index et de vues matérialisées
introduction à la sociologie générale, cours 3
Vers une approche de construction de composants ontologiques pour le web sémantique – synthèse et discussion. Nesrine Ben Mustapha (RIADI, ENSI Tunis)
Claire DELAYE – ENESAD EDUTER
Université Mouloud Mammeri de Tizi-Ouzou
Université Paris I – Panthéon Sorbonne
Formation sur mesure à distance Une obligation éthique pour répondre aux besoins du Québec.
Recherche d’information & Représentation des Connaissances
INTRODUCTION Objectif:
جامعــــــة محمد خيضــــــــــــر بــســكــــــــــــرة
OLAP : Un pas vers la navigation
Méthode des k plus proches voisins
Rappel... Solution itérative de systèmes linéaires (suite et fin).
Recherche Documentaire et traitement de l’information
Conception d’un protocole expérimental avec un logiciel dédié
SCIENCES DE L ’INGENIEUR
Académie de Besançon Journées collège Evaluation par compétence, prise d'initiative, différenciation.
Moteur de recherche d’information
24 Novembre 2006 Laboratoire dInformatique de Paris 6 Moteur de recherche XML pour la plateforme Outilex.
3.1 DÉTERMINANTS (SUITE) Cours 6.
Marta Garcia Carnero CAD Support December Scénario Préparation pour lopération Save as du 3D Save as du 2D Save as des enfants December
Universté de la Manouba
Article présentée par : Étudiante en 2ème année mastère F.S.T. Tunisie
Journée de lancement du Réseau Thématique Pluridisciplinaire 32
Projet Greenotec Recherche intégrée sur les critères de choix et de faisabilité de techniques de travail du sol sans labour dans une perspective d’agriculture.
Vivre longtemps, vivre content ? 15/10/2008. Q1: Avez-vous peur de vieillir?
ONDE MECANIQUE PROGRESSIVE A UNE DIMENSION
Découverte de correspondances entre ontologies distribuées
Assemble Générale du Samedi 17 septembre 2011 à 19H00 Bilan 2010/2011 et Perspectives Saison 2011/ /09/20111.
1 Gestion des intérêts d’une communauté au moyen d’un agent intelligent El Bachir Boukherouaa, El Bachir Gardouh, Claude Frasson Laboratoire HERON Informatique.
Université M’Hamed Bougara de Boumerdes
Fonctions logiques séquentielles bascules compteurs registres
synthèse onduleur autonome
Animation "mini tennis" 05/10/2011
1 LA MISE EN ŒUVRE DU SCHEMA DIRECTEUR DE LA STATISTIQUE (SDS) DU SENEGAL : Les défis à relever Atelier sur la revue de la mise en œuvre du CSRR Dakar,
BRASSERIE DUBUISSON Conférence de Presse
L’enseignement de spécialité SLAM
TEXT MINING Fouille de textes
20/06/2015propagation de signatures lexicales dans le graphe du Web 1 Propagation de signatures lexicales dans le graphe du Web M. Bouklit M. Lafourcade.
Problématique de SIG/D2S2 dans les SSTA Le(s) système(s) d’information dans les SSTA Omniprésent(s) Transparent(s) pour l’utilisateur Multi-utilisateurs.
Apprentissage semi-supervisé avec des modèles discriminants : application au résumé automatique de texte Massih-Réza Amini LIP6, Université de Paris VI.
1 4th International Conference on Arabic Language Processing, May 2–3, 2012, Rabat, Morocco Titre Mohamed El Amine ABDERRAHIM Mohamed Alaedine ABDERRAHIM.
ARIANE : Interopérabilité sémantique et accès aux sources d'information sur Internet Sylvain Aymard, Michel Joubert, Dominique Fieschi, Marius Fieschi.
Séminaire IRIT-UT1 « Les nouveaux de 2010 » Novembre 2010 Les entrepôts de données et des documents = des entrepôts de documents ? Ronan Tournier
Transcription de la présentation:

Université Mouloud Mammeri de Tizi-Ouzou R2I 12-14 Juin 2011 Modèle de Recherche d’Information Personnalisée Basé sur les Réseaux Bayésiens Mme Farida Achemoukh - Adouane Mr Rachid Ahmed-Ouamer Laboratoire LARI Université Mouloud Mammeri de Tizi-Ouzou Monsieur les membres de jury, l’honorable assistance Bonjour, j’ai l’honneur de vous présenter mon travail intitulé modèle de recherche d’information personnalisée basé sur les réseaux bayésiens

Plan de la présentation Introduction Problématique Accès Personnalisé à l’ Information Contribution Conclusion & perspectives Les points a développer consiste on une introduction, problématique, l’accès personnalisée à l’information, la contribution et enfin une concluction avec les perspectives envisagées R2I 12-14 juin 2011

C’est l’expression d’un besoin en information Introduction La vocation d’un système de recherche d’information est de fournir à l’utilisateur des informations utiles Virus biologique Virus informatique Q=‘virus’ Q=‘virus’ Collection documents Requête C’est l’expression d’un besoin en information Le problème des systèmes classique repose sur le fait que la pluparts des requêtes soumissent par des utilisateurs ne ciblent pas précisément leur besoin en informations Nous prenons l’exemple de Deux utilisateurs de profession différentes (un informaticien et un biologiste)soumettent la même requête (virus) , auront exactement les même résultats par le SRI. Il faut donc une meilleure connaissance de l’utilisateur pour composer le manque de précision de la requête, D’où l’idée de prise en compte de l’utilisateur dans la recherche d’information SRI Doc 1 Doc 1 Doc N Doc N 12/06/2011 R2I 12-14 juin 2011

Introduction Le système tiens compte de la requête utilisateur et des informations qui le décrivent Virus informatique Q=‘virus’ Profil utilisateur Domaine d’intérêt : informatique Collection documents SRI Dans ce cas l’utilisateur soumet sa requête et le système prend en compte des informations qui le décrivent (domaine d’intérêt) ce qui permet d’obtenir des résultats adaptés a son besoin Profil utilisateur informations décrivant ses centres d’intérêts et ses préférences Doc 1 Doc M Personnalisation de l’information 12/06/2011jz 12/06/2011 R2I 12-14 juin 2011

Problématique Comment modélisation l'utilisateur ? Comment inclure l’utilisateur dans le processus d'accès à l'information ? La problématique majeure de la personnalisation de l'accès à l'information est liée principalement au choix du modèle a utiliser pour représenté et construire l’utilisateur ainsi que son exploitation dans le processus de recherche 12/06/2011 R2I 12-14 juin 2011

Accès Personnalisé à l’ Information Modèlisation de l’utilisateur Representation du Profil Vectorielle (Gowan 2003) Hiérarchique (Micarelli et al.2004) Multidimensionnlle (Kostadinov 2003) Construction du Profil Explicite (Kraft et al.2005) Implicite (Gauch et al.2003) Plusieurs approches on été développées pour modéliser l'utilisateur ; cependant elles diffèrent dans la manière de représenter, et de construire son profil . La représentation du profil utilisateur peur être : 1. vectorielle: dans ce cas le profil est constitué d’un ou de plusieurs vecteurs définis dans un espace de termes. exemple systèmes : Alipes, WebMate et Surfagent 2 hiérarchique : les caractéristiques utilisateur sont organisées dans une structure hiérarchique de concepts (catégorie) représentant les domaines d'intérêt Exemple system dans le système OBIWAN. SmartPush 3. oubien multidimensionnelle : LE profil est représenté dans ce cas par un modèle structuré de dimensions (ou catégorie) prédéfinis . Une fois effectué le choix de la représentation, la construction du profil consiste à la collecte des informations qui le représentent et cela d’une manière explicite, en se basant sur les informations fournies directement par l’utilisateur, Ou Implicitement à partir des documents consultés et de comportement de l’utilisateur (temps de lecture d’un document ,sauvrade , impression) 12/06/2011 R2I 12-14 juin 2011

Accès Personnalisé à l’ Information Exploitation du Profil Utilisateur dans le processus de recherche Reformulation de la requête (Sieg et al. 2004), (Koutrika et al.2005) augmentation de la requête par des termes issus du profil utilisateur Appariement Requête- Documents (Haveliwala et al.2002), (Zemirli et al. 2008) compte tenu de la requête et du profil utilisateur dans le calcul de pertinence de documents Présentation des résultats de recherche (Gowan 2003),(Liu et al.2004) Le score final est la combinaison de score de similarité entre le document et le profil avec le score d’appariement initial du document La personnalisation d’accès à l’information consiste a intégrer le profil utilisateur dans au moins l’une des phases du processus de recherche. telles que: la reformulation de requête ou la requête initiale est augmenter par des termes issus du profil l’appariement requête-document le profil est intégré dans le calcul de pertinence du document ’ pour la phase d’ ordonnancement des résultats de recherche cela consiste à associer le profil utilisateur dans les résultats finaux de recherche 12/06/2011 R2I 12-14 juin 2011

Contribution Idée directrice Les Réseaux Bayésiens constituent un outil puissant pour la représentation des connaissances Les utiliser pour la présentation des différentes informations participantes à la définition du modèle de recherche Définition d’un module d’appariement intégrant le profil utilisateur Notre contribution consiste à présenter le profil utilisateur, comme composante à part , au même titre que la requête et les documents participants à la définition d’un modèle de recherche en utilisant Les Réseaux Bayésiens, ces derniers constituent un outil puissant pour la représentation des connaissances ensuite on intègre ce même profil dans le module d’appariement du système de RI. 12/06/2011 R2I 12-14 juin 2011

Contribution Démarche adoptée Définition de la librairie des centres d’intérêts chaque centre d’intérêt ck est défini comme un vecteur de termes ti pondérés selon la formule BM25 (Kassab R et al. 2005) N :le nombre total de documents de la collection ; n : le nombre de documents de la collection contenant le terme ti ; R : le nombre de documents pertinents face à une requête utilisateur ; r : le nombre de documents pertinents contenant le terme ti. En premier nous définissons une librairie des centres d’intérêts, nous supposons un ensemble de requêtes utilisateurs, pour chacune on définit le centre d’intérêt correspondent (profil correspondant) Qui sera représenté comme un vecteur de termes pondérés issus des documents pertinents selon le SRI classique face à la même requête BM25 permet la distribution des termes dans les documents pertinents et les non pertinents (un terme important pour le centre est celui qui apparais dans les docs pertinents et apparais peu dans les non pertinents) Remarque: un profil = un centre d’interet En essaye de trouver le profil de chaque utilisateur dans la libraire de centres ( profils) 12/06/2011 R2I 12-14 juin 2011

Contribution 2. Présentation du modèle Le modèle consiste en un graphe G= (V, E) acyclique orienté Nœuds V englobent la requête, les documents de la collection et la librairie de centres d’intérêts Arcs E orientés des termes constituant l’espace d’indexation, vers les documents, les requêtes et les centres d’intérêts. requête Termes Documents Centres d’intérêts Notre modèle consiste en un graphe acyclique orienté, il permet en plus de la représentation des termes d’indexation, des documents et de la requête utilisateur, la représentation de la librairie des centres d’intérêts qui constituent la dimension principale de la personnalisation de l’information. Le son des arcs représentent les relations de dépendances entre les différentes dimensions avec l’espace de termes. Les trois dimensions (requete, document, centre d’intérêt) sont représentés dans l’espace des termes d’indaxation d’où l’orientation des arcs 12/06/2011 R2I 12-14 juin 2011

Contribution 3. Calcul de la Pertinence (1) U : l’ensemble des configurations u possibles de termes. P(u) : la probabilité à priori associée à une configuration de termes L’espace de termes est réduit à la configuration couverte par la requête q P(q/u)= 1 si q=u 0 sinon Le calcul de la pertinence revient à instancier chaque document de la collection et un à un chacun des centres d'intérêts utilisateur. L’ equation (1) calcul le degré de couverture des trois concepts (requête ,document, centre) pour l’espace des termes d’indexation pour minimiser les calcul on prend seule la configuration qui couvre la requête utilisateur la probabilité de satisfaire la requête étant donnés le document et le centre d'intérêt instanciés et alors estimer comme degré de convergence des trois concepts. Pour Le calcul des probabilités P (ck/uq) et P (dj/uq) on utilise leurs correspondances en mesure vectorielle de cosinus (cosinus d’angle entre les trois vecteurs) Nous avons utilisé la mesure cosinus vectorielle.(elle a largement prouver son efficacité) Le modèle « réseau bayésien » généralise « le modèle vectoriel » l’équation (1) peut être écrite 12/06/2011 R2I 12-14 juin 2011

Table 1. Librairie de centres d’intérêts Contribution 4. Exemple illustratif Soit une collection= {d1, d2, d3, d4, d5} d1= {10t1, 2t2, 4t3, 5t5}, d2= {4t1, 9t2, 7t6}, d3= {5t2, 7t3, 12t4, 9t6} d4= {2t1, 11t4, 3t5, 7t6} , d5= {10t2, 15t3, 5t4, 8t5, 14t6} Libraire des centres d’intérêts Requêtes Q= {q1, q2, q3, q4, q5 } q1= {t1} ,q2= {t2} , q3= {t3} , q4= {t4}, q5= {t5} Comme exemple, Nous supposons une collection de cinq document et un ensemble de cinq requête utilisateur pour lesquelles nous définissons les documents pertinents retournés par un système de recherche classique Pour le choix des documents pertinents face à toute requête, nons avons fixe un seuil de pertinence à une valeur de 0.4 défini par rapport a notre exemple et elle correspond à la valeur medium des moyennes de pertinences de documents correspondantes a chaque requête (0.54, 0.25, 041, 0.53,0.36) pour la validé il faut une expérimentation)) Table 1. Librairie de centres d’intérêts 12/06/2011 R2I 12-14 juin 2011

Contribution Architecture du modèle ordre de pertinence Centres d’intérêts Collection documents Termes d’indexation t1 t2 t6 t3 t4 t5 d1 d2 d3 d4 d5 C1 C2 c3 c4 c5 ordre de pertinence Avec intégration du profil + D5 D2 D3 D4 - D1 + D2 D5 D4 D3 - D1 c4 Le modèle est illustré par le schéma suivant Supposons maintenant une nouvelle requête utilisateur q= {t6} pour laquelle on cherche le centre d’intérêt adéquat et les documents pertinents associés. Le résultat de la recherche classique à donné L‘l’ordre de pertinence suivantsd5, d2, ces résultats obtenue selon notre modèle montre que le centre d’intérêt correspondant à la requête q= {t6} est c4, combiné avec les documents présentés selon un ordre décroissant de pertinence : d2, d5, d4, d3.d1 Effectivement d’après la distribution des termes dans les centres d’intérêts (cf. table 3), le terme t6 figure dans le centre d’intérêt c4 avec la plus grande valeur de pondération et il figure aussi dans les quatre documents (cf. table 1). La fréquence d’apparition du terme t6 est plus élevée dans le document d5 mais le document le plus pertinent est le document d2 (cela est du à la prise en compte de la distribution des termes dans toute la collection de documents). Q Requête utilisateur 12/06/2011 R2I 12-14 juin 2011

Conclusion Le modèle proposé mesure la pertinence comme un degrés de convergence des trois concepts document, requête utilisateur et centre d’intérêt La prise en compte du profil utilisateur modélisé par son centre d’intérêt dans le module d’appariement permet un bon ordonnancement des résultats. Pour conclure nous estimons que La prise en compte du profil utilisateur modélisé par son centre d’intérêt dans le module d’appariement à permet un bon ordonnancement des résultats. 12/06/2011 R2I 12-14 juin 2011

Perspectives personnalisée Prise en compte de l’évolution du profil Validation du modèle proposé sur une collection personnalisée Prise en compte de l’évolution du profil utilisateur dans le modèle proposé Comme perspectives nous envisageons la Validation du modèle sur la collection personnalisée Ainsi que la Prise en compte de l’évolution du profil utilisateur dans le modèle proposé . 12/06/2011 R2I 12-14 juin 2011

Merci de votre attention! 12/06/2011 R2I 12-14 juin 2011