Présentation Biblio. (DESS IIR) Les moteurs de recherche Web

Slides:



Advertisements
Présentations similaires
Tutoriel - Les Ressources du BCH
Advertisements

Concevoir un site dans une optique de référencement Sébastien Billard Consultant référencement.
La recherche documentaire
« Les Mercredis du développement » Introduction Office « 12 » Présenté par Bernard Fedotoff Microsoft Regional Director Agilcom.
Les réseaux et Internet : Fonctionnement et utilisation
Internet : serveurs Web
Moteur de recherche Google
Chercher pour trouver Nous quittons l'ère où on courait après l'information pour entrer dans celle où l'information nous court après"Nous quittons l'ère.
Concevoir un site dans une optique de référencement.
INTRODUCTION Grande quantité de données
« ARCHEODOC, un portail dynamique pour la recherche d’information en archéologie » Véronique HUMBERT (Lattes) Blandine.
CPeyronnet | | Veille et recherche sur Internet : concepts, méthodologies, outils... 1 CvTic Veille et recherche sur Internet.
Cours n°1ue304b (S. Sidhom) UE 304 b Cours_L2.documentation_n°1 Gestion des documents : Technologies de lInformation et de la Communication Par : Sahbi.
2002 Compétitif XMiner : Plate-forme de structuration texte libre multi-approches par balisage XML de Tags Actifs Lobjectif du projet est de développer.
Mettre en place une démarche de recherche documentaire
Indexation textuelle : Systèmes de recherche d’informations
L’information scientifique et technique
Le référencement des pages web
Les moteurs de recherche Par Pauline RAUDET
UNTE 101 2e partie Isabelle Lorrain, MSI 28 septembre 2004 Bibliothèque Saint-Jean.
Quelles ressources sur linternet ? Méthodologie de recherche et validation de linformation Jean-Philippe Accart Bibliothèque nationale suisse Service de.
> a patent search service supplied by Patents & Technology Surveys Ltd PROFESSIONAL ONLINE PATENT INFORMATION SERVICE.
Laboratoire Sciences Pour l’Environnement
Chapitre 4 : la gestion électronique des documents
Interfaces de recherche usager
SECURITE DU SYSTEME D’INFORMATION (SSI)
XML-Family Web Services Description Language W.S.D.L.
Aide à la Recherche Bibliographique sur le WEB Hatem BEN ROMDHANE (URSAM) ENIT Janvier 2003.
L'ORIENTATION UN CHANTIER A PARTAGER
Comment trouver sur Internet?
CDI Lycée Marguerite Yourcenar La recherche d’information
Les étapes de la recherche documentaire
Identifier ce qui peut gêner ou bloquer votre référencement Sébastien Billard, consultant référencement.
Annuaires et moteurs de recherche d’information sur Internet
LE REFERENCEMENT NATUREL S.E.O. (Search Engine Optimisation)
Médiathèque de Sélestat - 5 février 2005 Olivier Andrieu Comment ne pas être visible sur les moteurs de recherche.
Ordre du jour Copernic, portrait de lentreprise Copernic Enterprise Search Description du produit Fonctionnement Spécificités techniques Options offertes.
LA RECHERCHE DOCUMENTAIRE AVEC BCDI CLASSE DE 2nd
Ressources web : évaluer leur validité et leur fiabilité... © Français et Informatique
Recherche, évaluation et utilisation de linformation Martine Mottet www1.sites.fse.ulaval.ca/martine.mottet.
La face cachée des systèmes de recherche Martin Bouchard, président Janvier 2003.
« Google, un moteur de recherche comme les autres ? »
La veille numérique : un outil pour s'informer intelligemment &
Le langage du Web CSS et HTML
Les moteurs de recherche Paul de Theux. Sommaire Google: leader presque incontesté Fonctionnement Syntaxe Limites.
La veille technologique au service de l’innovation CCI 28, le 14 avril 2009 Estelle SAPIN Chargée de mission Agence Régionale d’Informations Stratégiques.
Manuel Kervarker.org : l'accueil
Tous droits réservés 04 octobre 2005© présente Les Moteurs de Recherche.
Les grandes étapes de la recherche
Internet : serveurs Web  Clients et serveurs : le navigateur  Sites Web et urls  Fichier source d’une page  Langage HTML 1.
LA GESTION DOCUMENTAIRE BTS Assistant de direction 2e année, Janvier 2007.
1. Se poser des questions Prendre du temps au départ
LA RECHERCHE DOCUMENTAIRE
INTERNET Un réseau informatique mondial : ce sont des millions d'ordinateurs en permanence allumés (reliés entre-eux par des lignes téléphoniques, fibres.
Concevoir un site web de A a Z Cours 3. Aujourd’hui Découper sa page en tranche pour une intégration graphique optimale avec Photoshop L’intégration des.
Guide d’utilisation du site CampusFrance Maroc. Ce petit guide vous permet de visualiser les rubriques importantes afin d’utiliser le site Internet et.
Thibault ROY Université de Caen / Basse-Normandie Laboratoire GREYC – Equipe ISLanD Apport d’outils d’informatique documentaire à l’analyse de forums de.
La veille à l’Institut national du cancer Identifier des sources d’information fiables Rencontre De la veille à la gestion des connaissances, Bordeaux,
Équipe ISLanD Laboratoire GREYC Université de Caen / Basse-Normandie Des outils pour chercher sur la Toile Fête de la Science 2005.
TEXT MINING Fouille de textes
Se repérer et organiser sa veille dans la recherche en éducation Module 2 « Maîtriser l’accès aux ressources scientifiques en éducation » Introduction.
Moteurs et métamoteurs de recherche
Méthodes de recherche sur Internet
IUFM D’AIX-EN-PROVENCE
Présentation des outils de recherche d’informations scientifiques.
Gestion des documents internes avec SQL Server 2005 Date de publication : janvier 2006.
Apéro Techno Romain Maragou - Aliou Sow Web sémantique.
Le Bac Vert Un outil de recyclage des objets et des documents.
Internet et la recherche documentaire Comment utiliser Internet de façon pertinente ?
Compétences informationnelles Choisir ses sources Connaître les outils de repérage.
Transcription de la présentation:

Présentation Biblio. (DESS IIR) Les moteurs de recherche Web Jérémy CLUZEL Philippe ROCHEBLOINE

Les moteurs de recherche web Sommaire Introduction Définition Présentation Fonctionnement Architecture Conclusion Les moteurs de recherche web

Les moteurs de recherche web Introduction Les moteurs de recherche web

Les moteurs de recherche web Introduction Internet en croissance exponentielle. Source importante d’informations ne pouvant être ignorée (même si utilisée en complément…). Données et documents pertinents noyés dans l’immensité du réseau. Utilisation d’outils de recherche quasi-obligatoire. Les moteurs de recherche web

Les moteurs de recherche web Définition Les moteurs de recherche web

Les moteurs de recherche web Définition Expression « moteur de recherche » souvent employée à tord. Importance de la différenciation entre les différents outils existants Diversité plus complémentaire que concurrentielle Les moteurs de recherche web

Les moteurs de recherche web Présentation Les moteurs de recherche web

Les moteurs de recherche web Présentation moteurs méta–moteurs annuaires portails anneaux « web invisible » autres… Les moteurs de recherche web

Les moteurs de recherche web Outil permettant de rechercher les pages comportant une expression donnée. Ex: AltaVista, Excite, Google, Lycos… Exhaustif, options de recherche utiles, indexation de chaque mot. Nombre de réponses souvent élevé, une certaine expérience d’utilisation est requise. Les moteurs de recherche web

Moteurs (suite) – les catégories Sémantiques : intégration du sens du langage au processus de recherche (dictionnaires de concepts, thésaurus). Multi-dimensionnels : paramétrage poussé, affinage de la catégorisation des documents, et des procédés de requêtes croisées. Verticaux : adaptation à des problématiques métier bien particulières. Les moteurs de recherche web

Les moteurs de recherche web Méta-moteurs « Super-moteurs » permettant d’effectuer simultanément une recherche sur plusieurs moteurs et annuaires. Ex: Debriefing, MetaCrawler, Savvy Search. Puissance cumulée de plusieurs outils, efficacité croissante. Longueur de la recherche, fantaisie de certains résultats, efficacité moindre par rapport aux moteurs spécialisés. Les moteurs de recherche web

Annuaires (ou répertoire) C’est un catalogue de sites, ne recensant que certains sites seulement. Création de fiches descriptives avec titre, URL, et bref descriptif (15 à 25 mots). Utilisation de bases de données décrivant une sélection de sites indexée par une liste arborescente de catégories (ou rubriques). Ex: Francité, Nomade, Yahoo... Les moteurs de recherche web

Les moteurs de recherche web Annuaires (suite) Utilisation simple, encadrement de l’internaute dans sa recherche à l’aide de raffinements successifs. Non-exhaustif (seule une petite partie du réseau est référencée) nécessité de mettre à jour très régulièrement le contenu des rubriques. Les moteurs de recherche web

Les moteurs de recherche web Portails Site offrant un ensemble de ressources et de services (généraux ou propres à un domaine) à un ensemble d'utilisateurs défini (grand public, membre d'une profession, d'une branche d'activité...).  Ex: Cuisinons, Visioweb. Navigation et recherche d'information facilitées, services à valeur ajoutée. Sites cloisonnant… Les moteurs de recherche web

Les moteurs de recherche web Portails (suite) Les moteurs de recherche web

Portails (suite) – les services Outils de recherche, Information (actualité, finance, météo, etc.), Outils de communication (E-mail, listes de diffusion, groupes de discussion), Outils de consommation (vente en ligne, publicité, etc.), Personnalisation, Du contenu... Les moteurs de recherche web

Les moteurs de recherche web Anneaux (« WebRings ») Communauté (de sites) décentralisée à l'extrême, liée par un thème commun. L'anneau sélectionne et contrôle humainement la qualité des sites proposés. Qualité et fiabilité de l'information. Recherche du « bon » anneau laborieuse. http://nav.webring.yahoo.com Les moteurs de recherche web

Les moteurs de recherche web « Web invisible » Partie du Web contenant des documents n’ayant pas été indexés. Origines : Type de fichiers, données dynamiques, robot de recherche bridé, documents « interdits de référencement »… Outils :, All-One-Search, AlphaSearch, Fossick, Invisibleweb, Searchability… Les moteurs de recherche web

Les moteurs de recherche web Autres… Impossibilité de citer, et de classer la totalité des outils de recherche existants. Quelques exemples de ces catégories difficilement « classables » : Recherche d'adresses classées par zone géographique (FinderSeeker, Excite Travel). Recherche d‘objets perdus (Yellowtag). Les moteurs de recherche web

Les moteurs de recherche web Fonctionnement Les moteurs de recherche web

Les moteurs de recherche web Fonctionnement Vue d’ensemble, Le robot – explorateur, Le système d’indexation, Le module de recherche, Modes d’interrogation, Techniques utilisées. Les moteurs de recherche web

Les moteurs de recherche web Vue d’ensemble Le « spider » récupère et analyse le maximum d’informations provenant des pages qu’il visite.  Le système d’indexation s’occupe de stocker, et classer ces informations dans une base de données. Le « searcher » est chargé de retrouver dans cette base, les documents qui correspondent le mieux à la requête émise. Les moteurs de recherche web

Fonctionnement général Les moteurs de recherche web

Le robot – explorateur (« spider ») C’est un robot logiciel qui explore de façon autonome le « Web ». Son efficacité est capitale pour le moteur. Identifie les liens des pages, puis les visite à son tour, parcourant ainsi rapidement la totalité du site, puis ceux qui lui sont rattachés. Examine périodiquement des millions de pages et constitue de cette façon une base de données de celles déjà visités. Les moteurs de recherche web

Le système d’indexation Analyse les informations collectées, construit un index des mots rencontrés (et des pages correspondantes), puis stocke l’ensemble dans une base de données. Convertit certains fichiers ne pouvant pas être indexés à cause de leur format. Utilise des outils d’extraction pour ne récupérer que « l’essence » des documents. Ex: Fulcrum, Infoseek, Intelliserv, Livelink. Les moteurs de recherche web

Le système d’indexation (suite) Les techniques d’indexation : Au début, seulement les titres des documents, Puis, tous les mots du premier paragraphe, Aujourd’hui : les méta-données (ou metatags), ex: balise HTML <META>. Les moteurs de recherche web

Module de recherche (« searcher ») Le searcher est le frontal de l'utilisateur. Grâce à son interface graphique, on peut poser une question, sélectionner les options disponibles, et lancer une recherche. Un script faisant alors appel au système d'indexation pour qu’il exécute la requête sur la base de données. Les résultats affichés sous forme de page Web intégrant généralement les réponses sous forme de liste. Les moteurs de recherche web

Module de recherche – modes d’interro. Booléen : utilisation des opérateurs logiques (AND, OR, NOT, NEAR, etc.), Liste de mots : requête retranscrite en une expression booléenne, En langage naturel (expérimental). Les moteurs de recherche web

Module de recherche - techniques Documentaire classique : utilisant des fichiers d'index de type mots-clés (mots ou expressions normalisés). Textuelle : cherchant à retrouver les documents " ressemblant " le plus à la question posée. Pour cela, on utilise des techniques linguistiques (question posée en langue naturelle) ou statistiques (pondération des valeurs des mots et des documents) Floue : autorisant les erreurs (OCR) Les moteurs de recherche web

Les moteurs de recherche web Architecture Les moteurs de recherche web

Les moteurs de recherche web Architecture Architecture Générale Exemple de base de données (DILIB) Exemple d’architectures (ALTAVISTA) Les moteurs de recherche web

Architecture Générale Les moteurs de recherche web

Les moteurs de recherche web DILIB DILIB est une plate-forme pour l'Ingénierie du Document et de l'Information Scientifiques et Techniques  partie recherche  Les moteurs de recherche web

Structure base de données (DILIB) Les moteurs de recherche web

Fichier direct / inverse Les moteurs de recherche web

Architecture moteur ALTAVISTA Les moteurs de recherche web

Les moteurs de recherche web Deux serveurs Les moteurs de recherche web

Serveurs en parallèles Les moteurs de recherche web

Serveurs Indépendants Les moteurs de recherche web

Les moteurs de recherche web Conclusion Accroissement important de la quantité d’informations disponible sur le réseau. Progression notable (mais pas encore suffisante) des performances des outils de recherche. Nouvelles technologies intelligentes prometteuses : agents, recherche en langage naturel. Les moteurs de recherche web

Les moteurs de recherche web Bibliographie Glossaire spécialisé dans le domaine : http://www.idf.net/mdr/glossaire.html Divers sites explicatifs : http://www.decisionnel.net/recherche/ http://www-dist.cea.fr/ext/neuf/moteur/ Sur le Web invisible : http://www.asktibbs.com/web_invisible.html Sur les Anneaux: http://2sevres.clipewebring.free.fr/quoi.html Liste de discussions : motrech-subscribe@egroups.com  Les moteurs de recherche web