Télécharger la présentation
La présentation est en train de télécharger. S'il vous plaît, attendez
Publié parThibauld Martinet Modifié depuis plus de 10 années
1
Promotion Ranking
2
Défault des Méthodes de ranking Les pages nouvellement créées ne sont pas tout de suite référencées pas les méthodes de ranking traditionnelles. Exemple : PageRank, HITS
3
Pourquoi Les nouvelles page font partie du « IN » dans le WebGraph. Elles ne possèdent pas de liens qui les référencent. Il est donc très difficiles de connaître leurs « qualité ». Il faut attendre quelles fassent partie du « core » du « WebGraph ». Ceci demande un facteur temps important.
4
Objectif Trouver un moyen dinclure les nouvelles pages (de qualité) dans les résultats des moteurs de recherches avant quelles ne fassent parties du « core » du « WebGraph »
5
Idée : Rank Promotion Promouvoir les pages lointaines de la liste des résultats dun moteur de recherche Pour cela on les fait artificiellement grimper au sommet de la liste. Résultat 1 1 Résultat 2 2 Résultat 3 3 Résultat 4 4 Résultat 5 5 Résultat 6 6 Résultat 500 500
6
Expérience Site Internet dans lequel se trouve plusieurs milliers de pages au contenu amusant ou comique. Presque un millier de « surfeurs », qui navaient aucune connaissance préalable du sujet dexpérience.
7
Expérience : pages du site Les pages ont été créées dynamiquement à partir dune base de données contenant des blagues. La qualité des pages est le degré de « funniness ». Des pages contenant des citations ont été ajoutées pour que lensemble des pages du site ait une distribution par PageRank normale. Cest à dire, que la distribution ressemble à celle de nimporte quel autre site Internet.
8
Expérience : la page principale du site La homepage du site présente les blagues et citations à la manière dune moteur de recherche, par groupe de dix et en ordre descendant de « funniness ». Le niveau de « funniness » est établi par les utilisateurs. Ils ont le choix de cliquer sur les boutons « drôle », « neutre » et « pas drôle ». Pour limiter la fraude, une fois que lutilisateur a cliqué sur un bouton, ils disparaissent.
9
Expérience : les utilisateurs La publicité faite pour le site a attiré un total de 962 visiteurs pendant 45 jours. Chaque surfeur qui visite le site pour la première fois se voit attribué un numéro de groupe: 1 ou 2. Pour le 1er groupe, les blagues sont présentées en ordre descendant de popularité. Pour le 2ième groupe, les blagues sont également présentées en ordre descendant de popularité. Mais les pages qui nont pas été évaluées sont insérées dans la page principale par Rank Promotion.
10
Expérience : rotation du contenu Pour chaque visiteur, le maximum de pages accessibles est fixé à mille. La durée de vie des page est fixée au hasard de 1 à 30 jours. Pour simuler un état stationnaire dans lequel chaque page a une durée de vie réelle de 30 jours, chaque page qui disparaît est remplacée par une page de même qualité avec une durée de vie fixée à 30 jours et une popularité de zéro.
11
Evaluation Le site est capable de « monitorer » lactivité de 10% des utilisateurs. Ceci permet dutiliser deux indices pour évaluer les effets du promotion ranking. TBP => Time To Become Popular QPC => Quality Per Click
12
TBP Temps que met une page de bonne qualité à devenir populaire dans un moteur de recherche. Cest à dire, quelle va figurer au début de la liste des résultats pour un mot clef donné.
13
QPC Mesure la qualité moyenne des pages visionnées par les « surfeurs » sur une grande période de temps.
14
Qualité intrinsèque de la page « p » Nombre de visiteurs de la page « p » pendant sa durée de vie « tl » Somme de toute les pages du site Sur une durée infinie Normalisation QPC
15
Evaluation : Constats Le but du du Promotion Ranking est de diminuer TBP et daugmenter QPC. Plus une page est référencée tôt dans un moteur de recherche, plus sa popularité va devenir importante. Pour promouvoir une nouvelle page, il faut donc linsérer au début de la liste des résultats du moteur de recherche.
16
Promotion Ranking : Méthodes Pour le promotion ranking, il existe plusieurs méthodes. Ici, il y en a deux : 1) Randomized Rank Promotion 2) Selective Randomized Rank Promotion.
17
Randomized Rank Promotion Instanciation de 3 listes : L, Ld, et Lp. Ld contient lensemble des pages de résultats suite à une requête lancée dans un moteur de recherche. Lp contient la liste des pages à promouvoir. L est la liste finale, présentée à lutilisateur.
18
Randomized Rank Promotion suite Les k-1 premiers éléments de Ld sont insérés dans L. Les k+i éléments de L sont pris soit de Ld, soit de Lp. Ce choix dépend de la valeur probabiliste dune variable aléatoire r. Exemple : la variable r peut être le résultat du jet dune pièce de monnaie (pile ou face).
19
Selective Randomized Rank Promotion Différences avec le modèle précédant : 1)Toutes les pages nont pas les mêmes chances dêtre choisies. Seul le pages avec une « awareness » de 0 sont promues. Méthode : 1)Utiliser les informations supplémentaires fournies par les visiteurs « monitorés » du moteur de recherche. 2)Utiliser la relation entre la popularité dune page et son nombre attendu de visiteurs.
20
Selective Randomized Rank Promotion (suite) La relation popularité par rapport au nombre de visiteur sexprime par : F2 = nombre de visiteurs attendus. F1 = popularité de la page.
21
Selective Randomized Rank Promotion (suite 1) F2 est déduite empiriquement par les résultats fournis par le moteur de recherche AltaVista (loi de puissance). Teta = cte de normalisation v = nombre de visteurs par unité de temps
22
Selective Randomized Rank Promotion (suite 2 ) La popularité F1(x) dune page sexprime par la relation : m = nombre dutilisateurs « monitorés » Q(p) = Qualité intrinsèque de la page F1 = 1 + toutes les autres pages dont la popularité surpasse x. « awareness »
23
Selective Randomized Rank Promotion (suite 3) Formule finale: Si F1(x) < k Autrement z = pages avec une « awareness » de zéro F1 = formule précédente
24
Selective Randomized Rank Promotion (suite 4 ) F1 étant une formule approximative : 1)On ignore les effets de valeurs proches en popularité. 2)On oublie de compter une page. On combine F1 avec la formule suivante, par « curve fitting » (simulation par régression non- linéaire): x = popularité de la page
25
Selective Randomized Rank Promotion (suite 5) Question : Quelles valeurs faut-il donner à k (point dentrée dans la liste), r (degré de hasard) et Wp (pages à promouvoir). Réponse par simulation
26
Effet sur TBP -no promotion - uniform promotion - selective promotion k=1 and r=0.2
27
Ajustement de k et r
28
Résultats (par simulation)
29
Résultat final (réel)
Présentations similaires
© 2024 SlidePlayer.fr Inc.
All rights reserved.