La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Présentation Biblio. (DESS IIR) Les moteurs de recherche Web Jérémy CLUZEL Philippe ROCHEBLOINE.

Présentations similaires


Présentation au sujet: "Présentation Biblio. (DESS IIR) Les moteurs de recherche Web Jérémy CLUZEL Philippe ROCHEBLOINE."— Transcription de la présentation:

1 Présentation Biblio. (DESS IIR) Les moteurs de recherche Web Jérémy CLUZEL Philippe ROCHEBLOINE

2 Les moteurs de recherche web Sommaire Introduction Définition Présentation Fonctionnement Architecture Conclusion

3 Les moteurs de recherche web Introduction

4 Introduction Internet en croissance exponentielle. Source importante dinformations ne pouvant être ignorée (même si utilisée en complément…). Données et documents pertinents noyés dans limmensité du réseau. Utilisation doutils de recherche quasi-obligatoire.

5 Les moteurs de recherche web Définition

6 Définition Expression « moteur de recherche » souvent employée à tord. Importance de la différenciation entre les différents outils existants Diversité plus complémentaire que concurrentielle

7 Les moteurs de recherche web Présentation

8 Présentation moteurs méta–moteurs annuaires portails anneaux « web invisible » autres…

9 Les moteurs de recherche web Moteurs Outil permettant de rechercher les pages comportant une expression donnée. Ex: AltaVista, Excite, Google, Lycos… + Exhaustif, options de recherche utiles, indexation de chaque mot. – Nombre de réponses souvent élevé, une certaine expérience dutilisation est requise.

10 Les moteurs de recherche web Moteurs (suite) – les catégories Sémantiques : intégration du sens du langage au processus de recherche (dictionnaires de concepts, thésaurus). Multi-dimensionnels : paramétrage poussé, affinage de la catégorisation des documents, et des procédés de requêtes croisées. Verticaux : adaptation à des problématiques métier bien particulières.

11 Les moteurs de recherche web Méta-moteurs « Super-moteurs » permettant deffectuer simultanément une recherche sur plusieurs moteurs et annuaires. Ex: Debriefing, MetaCrawler, Savvy Search. + Puissance cumulée de plusieurs outils, efficacité croissante. – Longueur de la recherche, fantaisie de certains résultats, efficacité moindre par rapport aux moteurs spécialisés.

12 Les moteurs de recherche web Annuaires (ou répertoire) Cest un catalogue de sites, ne recensant que certains sites seulement. Création de fiches descriptives avec titre, URL, et bref descriptif (15 à 25 mots). Utilisation de bases de données décrivant une sélection de sites indexée par une liste arborescente de catégories (ou rubriques). Ex: Francité, Nomade, Yahoo...

13 Les moteurs de recherche web Annuaires (suite) + Utilisation simple, encadrement de linternaute dans sa recherche à laide de raffinements successifs. – Non-exhaustif (seule une petite partie du réseau est référencée) nécessité de mettre à jour très régulièrement le contenu des rubriques.

14 Les moteurs de recherche web Portails Site offrant un ensemble de ressources et de services (généraux ou propres à un domaine) à un ensemble d'utilisateurs défini (grand public, membre d'une profession, d'une branche d'activité...). Ex: Cuisinons, Visioweb. + Navigation et recherche d'information facilitées, services à valeur ajoutée. – Sites cloisonnant…

15 Les moteurs de recherche web Portails (suite)

16 Les moteurs de recherche web Portails (suite) – les services Outils de recherche, Information (actualité, finance, météo, etc.), Outils de communication ( , listes de diffusion, groupes de discussion), Outils de consommation (vente en ligne, publicité, etc.), Personnalisation, Du contenu...

17 Les moteurs de recherche web Anneaux (« WebRings ») Communauté (de sites) décentralisée à l'extrême, liée par un thème commun. L'anneau sélectionne et contrôle humainement la qualité des sites proposés. + Qualité et fiabilité de l'information. – Recherche du « bon » anneau laborieuse.

18 Les moteurs de recherche web « Web invisible » Partie du Web contenant des documents nayant pas été indexés. Origines : Type de fichiers, données dynamiques, robot de recherche bridé, documents « interdits de référencement »… Outils :, All-One-Search, AlphaSearch, Fossick, Invisibleweb, Searchability…

19 Les moteurs de recherche web Autres… Impossibilité de citer, et de classer la totalité des outils de recherche existants. Quelques exemples de ces catégories difficilement « classables » : Recherche d'adresses classées par zone géographique (FinderSeeker, Excite Travel). Recherche dobjets perdus (Yellowtag).

20 Les moteurs de recherche web Fonctionnement

21 Fonctionnement Vue densemble, Le robot – explorateur, Le système dindexation, Le module de recherche, Modes dinterrogation, Techniques utilisées.

22 Les moteurs de recherche web Vue densemble Le « spider » récupère et analyse le maximum dinformations provenant des pages quil visite. Le système dindexation soccupe de stocker, et classer ces informations dans une base de données. Le « searcher » est chargé de retrouver dans cette base, les documents qui correspondent le mieux à la requête émise.

23 Les moteurs de recherche web Fonctionnement général

24 Les moteurs de recherche web Le robot – explorateur (« spider ») Cest un robot logiciel qui explore de façon autonome le « Web ». Son efficacité est capitale pour le moteur. Identifie les liens des pages, puis les visite à son tour, parcourant ainsi rapidement la totalité du site, puis ceux qui lui sont rattachés. Examine périodiquement des millions de pages et constitue de cette façon une base de données de celles déjà visités.

25 Les moteurs de recherche web Le système dindexation Analyse les informations collectées, construit un index des mots rencontrés (et des pages correspondantes), puis stocke lensemble dans une base de données. Convertit certains fichiers ne pouvant pas être indexés à cause de leur format. Utilise des outils dextraction pour ne récupérer que « lessence » des documents. Ex: Fulcrum, Infoseek, Intelliserv, Livelink.

26 Les moteurs de recherche web Le système dindexation (suite) Les techniques dindexation : Au début, seulement les titres des documents, Puis, tous les mots du premier paragraphe, Aujourdhui : les méta-données (ou metatags ), ex: balise HTML.

27 Les moteurs de recherche web Module de recherche (« searcher ») Le searcher est le frontal de l'utilisateur. Grâce à son interface graphique, on peut poser une question, sélectionner les options disponibles, et lancer une recherche. Un script faisant alors appel au système d'indexation pour quil exécute la requête sur la base de données. Les résultats affichés sous forme de page Web intégrant généralement les réponses sous forme de liste.

28 Les moteurs de recherche web Module de recherche – modes dinterro. Booléen : utilisation des opérateurs logiques (AND, OR, NOT, NEAR, etc.), Liste de mots : requête retranscrite en une expression booléenne, En langage naturel (expérimental).

29 Les moteurs de recherche web Module de recherche - techniques Documentaire classique : utilisant des fichiers d'index de type mots-clés (mots ou expressions normalisés). Textuelle : cherchant à retrouver les documents " ressemblant " le plus à la question posée. Pour cela, on utilise des techniques linguistiques (question posée en langue naturelle) ou statistiques (pondération des valeurs des mots et des documents) Floue : autorisant les erreurs (OCR)

30 Les moteurs de recherche web Architecture

31 Architecture Architecture Générale Exemple de base de données (DILIB) Exemple darchitectures (ALTAVISTA)

32 Les moteurs de recherche web Architecture Générale

33 Les moteurs de recherche web DILIB DILIB est une plate-forme pour l'Ingénierie du Document et de l'Information Scientifiques et Techniques partie recherche

34 Les moteurs de recherche web Structure base de données (DILIB)

35 Les moteurs de recherche web Fichier direct / inverse

36 Les moteurs de recherche web Architecture moteur ALTAVISTA

37 Les moteurs de recherche web Deux serveurs

38 Les moteurs de recherche web Serveurs en parallèles

39 Les moteurs de recherche web Serveurs Indépendants

40 Les moteurs de recherche web Conclusion Accroissement important de la quantité dinformations disponible sur le réseau. Progression notable (mais pas encore suffisante) des performances des outils de recherche. Nouvelles technologies intelligentes prometteuses : agents, recherche en langage naturel.

41 Les moteurs de recherche web Bibliographie Glossaire spécialisé dans le domaine : Divers sites explicatifs : Sur le Web invisible : Sur les Anneaux: Liste de discussions :


Télécharger ppt "Présentation Biblio. (DESS IIR) Les moteurs de recherche Web Jérémy CLUZEL Philippe ROCHEBLOINE."

Présentations similaires


Annonces Google