Monitoring the Dynamic Web to respond to Continuous Queries Le titre en français : Surveillance de l'enchaînement dynamique pour répondre aux questions continues
Les auteurs de l’article Sandeep Pandey Krithi Ramamritham Soumen Chakrabarti Computer Science and Engineering Indian Institute of Technology Powai, Mumbai400076,India
Abrégé Mots clés : Questions continues Exécution Politique d’attribution Les questions continues sont des questions pour lesquelles les réponses données aux utilisateurs doivent être sans interruption mises à jour : la prise de décision en ligne commande de la circulation temps surveillant, etc.
CAM : Continuous Adaptative Monitoring Les phases importantes de la CAM : La phase de cheminement (The tracking phase) La phase d’attribution de ressources (The ressource allocation phase) La phase d’établissement de programme (the scheduling phase)
CAM Questions discrètes VS Questions continues Rampement (crawling) VS Surveillance (Monitoring) Processus de mise à jour de poissons (Crawling) CAM : dépiste les changements sur les pages dynamiques et évalue les statistiques concernant ces changements
Vue d’ensemble de la CAM CAM : Une technique pour surveiller des changements : Le but de l’algorithme d’attribution de ressources est d’allouer des ressources de surveillances limitées à travers des pages afin de réduire au minimum la perte d’information.
Vue d’ensemble de la CAM Exemples : Ouragan en marche: Quelles sont les pages appropriées Dépistant les changements sur les pages, pour déterminer les caractéristiques sur ces pages Décidant quand surveiller les pages pour des changements de sortes que les réponses soient courantes : Allouer les ressources dont on a besoin pour surveiller les pages Programmation des taches de surveillance réelles Surveillances (Monitoring)
Différentes phases de l’approche de la CAM
Les arcs de rétroaction de la phase de surveillance aux phases plutôt indiquent que des observations faites pendant la phase de surveillance peuvent être employées pour ajuster les décisions suivantes.
Attribution de ressource dans la CAM On distinguer les pages sur la base de deux métriques : la nature du comportement de changement de page l'importance d'une page pour une ou plusieurs questions
Tâches de surveillance d'établissement du programme Le but est de programmer les tâches de surveillance assignées parmi M processus de surveillance parallèles dans le but de réduire au minimum la perte d’information
Tâches de surveillance d'établissement du programme Une tâche de surveillance cherche une page web comme un crawler, mais avec le but de chercher la nouvelle information concernant une ou plusieurs questions alors qu’un crawling n’est fait avec aucune demande explicite d’utilisateur. Distribuer un nombre donné de taches de surveillance sur les pages
Conclusion Il y a plusieurs systèmes développés pour surveiller des sources sur l'enchaînement : CONQUER, WebCQ et C3 Les différences les plus évidentes entre la CAM et n'importe lequel de ces travaux relatifs est l'approche de la surveillance La CAM tient des réponses aux questions continues à jour en se concentrant sur le problème de surveiller dynamiquement les sources d'information concernant les questions. Des caractéristiques de changement de ces pages (observées dans une phase de cheminement), un modèle probabiliste de leur comportement de changement est formulé et des poids sont assignés aux pages pour dénoter leur importance pour les questions courantes.
Conclusion Pendant la phase d'attribution de ressource, basée sur ces statistiques, les ressources, requises surveillent sans interruption ces pages pour des changements la phase d'établissement du programme produit un programme proche-optimal pour la surveillance