Moteurs de recherche : pour en finir avec les idées reçues… ADBS Lorraine Véronique MESGUICH INFOTHEQUE POLE UNIVERSITAIRE LEONARD DE VINCI 12 octobre.

Slides:



Advertisements
Présentations similaires
Le web 2.0 L'Internet deuxième génération ? Moussay Jérôme - Master 2LCE1/16.
Advertisements

La recherche documentaire
dispositif SIST et l’accès à l’information scientifique et technique
Chercher pour trouver Nous quittons l'ère où on courait après l'information pour entrer dans celle où l'information nous court après"Nous quittons l'ère.
Comment choisir une solution technologique de veille sur le marché ?
« ARCHEODOC, un portail dynamique pour la recherche d’information en archéologie » Véronique HUMBERT (Lattes) Blandine.
CPeyronnet | | Veille et recherche sur Internet : concepts, méthodologies, outils... 1 CvTic Veille et recherche sur Internet.
La recherche documentaire sur le réseau Internet
Veille informationnelle et outils du Web 2.0
Veille informationnelle Jacques PIOT - CRDP Midi-Pyrénées Octobre 2008.
ETAPES DE LA RECHERCHE DOCUMENTAIRE
POUR LES ANIMATEURS EPN
FACTIVA Présentation et guide d’utilisation
Analyse des moteurs de recherche Paul de Theux. Sommaire Google: leader presque incontesté Fonctionnement Syntaxe Limites.
PubMed Trucs et astuces…
Quelles ressources sur linternet ? Méthodologie de recherche et validation de linformation Jean-Philippe Accart Bibliothèque nationale suisse Service de.
> a patent search service supplied by Patents & Technology Surveys Ltd PROFESSIONAL ONLINE PATENT INFORMATION SERVICE.
Aide à la Recherche Bibliographique sur le WEB Hatem BEN ROMDHANE (URSAM) ENIT Janvier 2003.
Comment trouver sur Internet?
Le portail documentaire de Paris 1
Annuaires et moteurs de recherche d’information sur Internet
La veille informationnelle : principes et pratique
MARKETING Présentation du CDI et d’outils pour la démarche de recherche documentaire et de veille informationnelle TSTG A. PEDRIZETTI. Professeure documentaliste.
Présentation des outils de recherche dinformations scientifiques.
Les TECHNIQUES de RECHERCHE dEMPLOI « Spécial Web » Journée de sensibilisation - 09/03/2010.
Natalie Meystre Maciej Macowicz Conférence des Webmasters 22 mars 2005 Moteurs de recherche, meta-moteurs.
La recherche sur le Web Améliorer sa performance Compétences informationnelles – Activité 13 - Documentation Module 1: notions de base.
Recherche, évaluation et utilisation de linformation Martine Mottet www1.sites.fse.ulaval.ca/martine.mottet.
La face cachée des systèmes de recherche Martin Bouchard, président Janvier 2003.
Le portail documentaire de Paris 1
18/03/091 L’information sur Internet Typologie et outils pour rechercher sur le net.
Veille Documentaire en Orientation
La veille numérique : un outil pour s'informer intelligemment &
Manuel Kervarker.org : l'accueil
Formation ADBS – septembre 2014 – 1 Approfondir son expertise en recherche d'information 3-4 & 5 septembre 2014.
Tous droits réservés 04 octobre 2005© présente Les Moteurs de Recherche.
©Armelle Thomas - février Quel lecteur de flux RSS en ligne choisir, en fonction de quel besoin ? ADBS RA Grenoble Les jeudi de l’Internet pratique.
Les outils avancés de recherche d’information Février 2005 Intervenant: Lionel CAMMARATA INSTITUT INTERNATIONAL DU MULTIMEDIA.
BENCHMARKS : Pourquoi ? Comment ? Sup de Pub – 2009/2010
LA GESTION DOCUMENTAIRE BTS Assistant de direction 2e année, Janvier 2007.
LA RECHERCHE DOCUMENTAIRE
INTERNET Un réseau informatique mondial : ce sont des millions d'ordinateurs en permanence allumés (reliés entre-eux par des lignes téléphoniques, fibres.
Recherche d’information
LA BIOBASE ET LE BIOPRESSE DU CETAB+ ET D’ABIODOC Projet réalisé dans le cadre du programme Innovbio du Ministère de l’agriculture, des pêcheries et de.
Techniques documentaires et veille stratégique Anne Pajard, avril 2008
Page  1 Bienvenue à l’ADBS ! Stage DE1-09 Les pratiques documentaires au service de la recherche d’emploi.
La veille à l’Institut national du cancer Identifier des sources d’information fiables Rencontre De la veille à la gestion des connaissances, Bordeaux,
RSS / Pablo Iriarte - DocSoc 2006 La diffusion de l'information documentaire et des actualités en format RSS Un exemple de mise en place au Centre de Documentation.
Maîtriser l’information stratégique JOURNEE DE SYNTHESE Véronique MESGUICH INFOTHEQUE POLE UNIVERSITAIRE LEONARD DE VINCI 16 décembre.
Se repérer et organiser sa veille dans la recherche en éducation Module 2 « Maîtriser l’accès aux ressources scientifiques en éducation » Introduction.
Moteurs et métamoteurs de recherche
Se repérer et organiser sa veille dans la recherche en éducation Module 2 « Maîtriser l’accès aux ressources scientifiques en éducation » Organiser sa.
Formation financée par la région centre
France Bilodeau Bibliothécaire-conseil 19 octobre 2015 La recherche d’information en éducation.
Comment faire une recherche documentaire?
CMS : SPIP Formation PBC – Septembre SPIP = Système de publication Internet SPIP = Système de publication Internet SPIP = CMS = Content Management.
La veille Joëlle LE MOIGNE /2015 Formation BTS Industriels 1 Image :
1 Chercher et trouver sa documentation sur Internet L1 DC Expression et communication Intervention du Par Sylvie Doyon, documentaliste.
Bibliothèque Centrale de l’École Polytechnique La Recherche Documentaire Economie - HSS Session pratique Ressources Documentaires en Economie-Gestion Vanessa.
Intervention ReRIP – 26 mars 2008 – Mathilde Guiné Le Réseau Tela Botanica Un réseau d’acteurs au service de la botanique francophone Le projet "Outils-réseaux"
Veille et IE, mode d’emploi Veille et IE, mode d’emploi Véronique MESGUICH INFOTHEQUE POLE UNIVERSITAIRE LEONARD DE VINCI CCI VERSAILLES 15 décembre 2008.
©Armelle Thomas - février Quel lecteur de flux RSS en ligne choisir, en fonction de quel besoin ? ADBS RA Grenoble Les jeudi de l’Internet pratique.
Internet et la recherche documentaire Comment utiliser Internet de façon pertinente ?
Bibliothèque Centrale de l’École Polytechnique Session pratique Recherches documentaires en sciences dures PSC 2013 septembre/octobre 2013 Denis Roura,
La recherche documentaire & internet Sport, sciences et technologie Octobre 2009 Délimiter et définir son sujet Dictionnaires (Google, define:sport, sciences,
La veille comme outil d ’aide à la décision. Introduction Veille : Recherche de sources d ’information, surveillance de ces sources et présentation /
Master 1 « diffusion de la culture » Formation à la maîtrise de l’information scientifique et technique Séance 2 Jeudi 02/10/2014 SID2 1.
©Armelle Thomas - Février Méthodologies de la recherche d’information sur Internet Le tour de la question ADBS - Les jeudi de l’Internet pratique.
Atelier recherche d'emploi WEB 2.01 Atelier Recherche d’emploi à l’aide d’outils du Web 2.0 Marjorie Andrieux, Volker Stock – ADBS Lorraine Laetitia Bertrand,
Compétences informationnelles Choisir ses sources Connaître les outils de repérage.
Transcription de la présentation:

Moteurs de recherche : pour en finir avec les idées reçues… ADBS Lorraine Véronique MESGUICH INFOTHEQUE POLE UNIVERSITAIRE LEONARD DE VINCI 12 octobre 2006

La recherche d’information sur Internet : un art plutôt qu’une science  Abondance de l’information  Hétérogénéité et fragmentation de l’information  Coexistence de contenus structurés et non structurés  Renouvellement continuel  Multilinguisme  Internet, outil documentaire ou outil de communication ?

Données bibliographiques Texte intégral Contenus éditoriaux (payants) « Grand public » ProfessionnelEnseignement Données factuelles « Question réponse » Etude complète Connaissance du sujet Utilisateur final / Professionnel de l ’information

Deux approches méthodologiques  L’approche « mots clés » : recherche par mots clés sur texte intégral des pages web. La qualité de la recherche dépendra du choix des mots clés : nombre de mots clés, degré de précision, langue, combinaison avec opérateurs booléens... Inconvénient : le manque d’exhaustivité des moteurs et méta-moteurs (« web invisible »)  L’approche « exploration des sources » : identifier les sources d’information les plus pertinentes par rapport à la requête, utiliser ensuite les outils de recherche intégrés à ces sources, l ’exploration de liens... Inconvénient : suppose une bonne connaissance des sources

Recherche d ’information sur Internet : se méfier des idées reçues  Les moteurs de recherche, même les plus puissants, n ’indexent qu’une partie du web (notion de pages dynamiques, « web invisible »)  Les moteurs de recherche n ’indexent pas le web en temps réel et ne sont pas à jour  L ’outil n ’est pas tout : rechercher l ’information « à la source » : portails spécialisés, portails géographiques...

Les nouvelles tendances de la recherche d ’information sur le web  Regroupement des acteurs. Simplification de la syntaxe  « Clustering » (Exalead, Vivisimo…)  Le web 2.0 ou « web social »: vu comme une plate-forme de services crée par les utilisateurs pour les utilisateurs  Développement des portails spécialisés (accès au web invisible)  Personnalisation (Yahoo, Google, Ujiko)  Représentation cartographique des résultats (Kartoo )  Développement des flux RSS

3 générations de moteurs de recherche

Portrait robot d’un moteur idéal... Pertinence Interface d’interrogation Utilitaires Classement et visualisation Contenus Qualité, quantité mise à jour Suggestion de mots clés, Recherche booléenne, options avancées Clustering Cartographie Résumé automatique Traduction Surveillance automatique

Les principaux critères de pertinence des moteurs  - Occurrence et densité des mots-clés - Présence dans l ’URL, dans le titre ou positionnement dans la page - Proximité et ordre des mots-clés - Taille et styles de polices - Présence dans les méta-données (meta- keyword, meta-description)  Critères « off the page » : - Indice de popularité (page rank)

Moteurs de blogs  Technorati : 56 millions de blogs « scrutés » Rech par mots-clés, ou par tags  Blogpulse : 35 millions de blogs Rech par mots-clés sophistiquée + tendances des termes les plus discutés (trend search) + conversation tracker.  Google Blog search : depuis juin 2005 Rech par mots-clés + sur le titre du blog, du post, par auteur et par date.  Voir aussi : Ice Rocket, Blogdigger, Daypop, Pubsub, Feedster (blogs.feedster.com), Waypath…  Et pour les blogs francophones : Google (blogsearch.google.fr), Blog Ouaf, Allblog ( BlogDimension ou Retronimowww.all-blog.com

Les fils RSS (Really simple syndication, rich site summary)  Flux de contenus gratuits en provenance de  sites internet éditoriaux.  Contiennent des titres des articles, et des liens hypertextes vers les articles.  Ils permettent d’être alerté en permanence sur un domaine d’actualité ou sur les nouveautés apparaissant sur un site précis.  Formats les plus utilisés : RSS 2.0 et Atom 1.0

Identifier des flux RSS  Moteurs de recherche spécialisés RSS : Feedster, EasyRSS…  Recherche avancée de Yahoo (choisir dans les formats RSS/XML)  Exalead : cliquer sur l’onglet RSS dans la liste des réponses, à partir d’une recherche

Accéder aux fils RSS  Intégration aux navigateurs Firefox (ajouter l’adresse du flux RSS dans le marque page) ou Safari.  Utilisation d’un agrégateur en ligne (ex : Netvibes, Webwag, Feedreader…)  Options personnalisées de Google ou Yahoo (mon Yahoo)

La navigation « sociale »  La navigation "sociale" consiste à exploiter des adresses de sites ou de pages repérés par d'autres internautes d'une même "communauté" ou "réseau social  Social bookmarking : del.icio.us  « Folksonomie » : les internautes définissent eux- même les catégories de classement (tags)  Yoono : moteur de recherche « collaboratif »

Web invisible  Pages non localisables et/ou non indexables par les moteurs de recherche web  Accéder au contenu de bases de données diversifiées  Exploiter le contenu des pages « à identification », ou « confidentielles »  Découvrir des pages peu ou mal indexées (isolées, ou d’un format « original ».

Le web invisible : comment y accéder  Bonne connaissance des ressources. Veille sur un domaine (portails thématiques, listes de diffusion...)  Répertoires de « web invisible » ex :  Méta-moteurs spécialisés

Internet versus bases de données  Intérêt d ’Internet :. Multiplicité des sources d ’information. Interactivité. Couverture internationale A utiliser pour :. Actualité immédiate. Analyse sites des entreprises. Infos sur pays. Fédérations professionnelles - portails spécialisés  Intérêt des bases de données :. Fiabilité de l ’information. Données à valeur ajoutée. Forme structurée A utiliser pour :. Archives de presse. Bilans entreprises. Etudes de marché

Méta-moteurs : quand les utiliser  Les méta-moteurs « on-line » (Ixquick, Profusion...) parfois trop aléatoires. Privilégier les unitermes.  Les méta-moteurs « clients » (Copernic, Digimind Finder)  Certains méta-moteurs (Jux2, Releton…) comparent les résultats des « grands moteurs»

Avantages et inconvénients des méta-moteurs  Permet de cumuler la puissance de plusieurs outils.  N’intègre pas la syntaxe de chaque moteur,  Récupère un nombre limité de résultat par moteur (10 premiers résultats de chaque outil)   Réponses pas toujours pertinentes.  Usage : pour une recherche large de premier niveau.

Une tendance : les méta- moteurs spécialisés  Recherche simultanée sur des corpus spécialisés (web invisible). Mélange d’outil humain et automatique  Les méta-moteurs spécialisés On line : exemple Clients : Copernic, Digimind Finderwww.keljob.com  Recherche sur des sites prédéfinis :  Des outils personnalisables : Rollyo

De nouveaux types d’annuaires  Les annuaires « contributifs » ou « ouverts » ex : Open Directory  Les annuaires « professionnels » ex : Indexa  Les annuaires de portails ex : Mediaveille Objectif Grandes écoles

Les techniques spécifiques utilisables pour la recherche de sources (source : Armelle Thomas) Trouver des portails / sites fédérateurs Trouver des listes de liens Trouver des sites « pointant » sur une source déjà connue Trouver des sites « similaires » à une source connue

Identifier des portails spécialisés  Attention à l’exhaustivité et à la mise à jour  Répertoires ouverts (dmoz)  Répertoires d’outils de recherche (enfin,, beaucoup, mediaveille, Objectifs grandes écoles...)  Sites d’associations professionnelles, sites de référence  Recherche par mots clés sur moteurs

L’évaluation des sites web  Identifier l’origine d’un site (Alexa)  Identifier la date de dernière mise à jour d’une page  Remonter dans le temps :  Identifier un nom de domaine : les annuaires WHOIS (

Les agents d ’alerte  Signalent les modifications à l ’intérieur d ’une page  Agents d ’alerte « on line » ex :  Agents d ’alerte « clients » ex : Kbcrawl Websitewatcher  Parfois, aspirateurs et agents d ’alerte ex : Wysigot

KB Crawl: surveillance de pages dynamiques

Automatiser une requête récurrente avec Google  Google newsalert : veille sur l ’actualité et les pages web  Possibilité de transformer l’alerte en flux RSS  Site GoogleAlert

Les 4 principaux modes de recherche d’information (source : URFIST)

En guise de conclusion… les 10 règles d ’or  Savoir questionner, choisir les bons mots-clés  Savoir utiliser les outils de navigation et de recherche  Savoir raisonner en termes de « sourcing »  Savoir sélectionner les bons points de repère  Savoir analyser  Savoir passer des outils aux sources, et des sources aux outils  Savoir se limiter dans le temps  Savoir rester clair sur ses objectifs  Savoir conjuguer recherche outils et navigation  Savoir être agile et « rebondir »