La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Outils de recherche du web Alexandre Serres URFIST de Rennes

Présentations similaires


Présentation au sujet: "Outils de recherche du web Alexandre Serres URFIST de Rennes"— Transcription de la présentation:

1 Outils de recherche du web Alexandre Serres URFIST de Rennes
Maîtrise de l’information scientifique Doctorat URFIST de Rennes, SCD Rennes 1 Module 1, TD 1 : Outils de recherche du web Session SDLM Alexandre Serres URFIST de Rennes Urfist de Rennes, SCD Rennes 1, 2011

2 Moteurs scientifiques ?
Annuaires thématiques ? Pages personnalisables ? Folksonomie ? Moteurs scientifiques ? Fils RSS ? Indice de popularité ? Métamoteur ? Web 2.0 ? Urfist de Rennes, SCD Rennes 1, 2011

3 Urfist de Rennes, SCD Rennes 1, 2011
PLAN 1/Panorama, typologies des outils de recherche 2/ Outils de repérage et d’accès : annuaires thématiques, portails… 3/ Outils automatisés : moteurs et métamoteurs de recherche 4/ Moteurs scientifiques, moissonneurs OAI… 5/ Outils pour la veille : syndication de contenu, pages personnalisables… 6/ Outils de gestion et de partage de signets : les plates-formes de « social bookmarking » 7/ Ressources pour aller plus loin Urfist de Rennes, SCD Rennes 1, 2011

4 1/ Panorama, typologies des outils de recherche
Existence de milliers d’outils de recherche : Voir :ISEDB, Vite tous les outils Nombreuses catégories d’outils : Annuaires thématiques Moteurs de recherche Moteurs spécialisés Métamoteurs Outils de veille, agents intelligents Portails, sites de référence Moissonneurs Plates-formes de signets Pages personnalisables ... > quelles typologies ? Urfist de Rennes, SCD Rennes 1, 2011

5 1/Typologies des outils de recherche du web
Distinguer d’abord : Outils propres au web : moteurs de recherche, moteurs de blogs… Outils accessibles par le web : bases de données, catalogues… Deux critères essentiels : Offre des ressources : outil généraliste / spécialisé Mode d’indexation : outil humain / automatisé Urfist de Rennes, SCD Rennes 1, 2011

6 1/ Typologies des moteurs de recherche : l’offre des ressources
Critère : type de ressources collectées Distinction principale : Moteurs généralistes : Google, Yahoo, Exalead, Ask, Bing… caractéristique historique des grands moteurs : collecte et indexation de tous les types de ressources Moteurs spécialisés : Tendance lourde des moteurs : Modules spécialisés à l’intérieur des moteurs généralistes Infinité des types de spécialisations Explosion du nombre d’outils Urfist de Rennes, SCD Rennes 1, 2011

7 2.1 Outils de repérage : les annuaires thématiques
Premiers outils du web : Virtual Library (1991), Yahoo (1994) Des principes communs : Sélection humaine de ressources : Caractère très sélectif des annuaires Recensement de sites web (et non de pages web) Pré-catégorisation des ressources Arborescence Description manuelle des sites Moteur de recherche interne à l’annuaire : Possibilités de requêtes Urfist de Rennes, SCD Rennes 1, 2011

8 2.1 Outils de repérage : les annuaires thématiques
Usages : Recherche d’information sur un sujet large Première approche d’un domaine : Exemple de la presse Recherche géographique Recherche de sites de référence utiles pour défricher un domaine, pour les premières recherches sur un sujet Ne pas opposer annuaires et moteurs : outils complémentaires Urfist de Rennes, SCD Rennes 1, 2011

9 2.1 Outils de repérage : les annuaires thématiques
Annuaires tous publics: Open Directory : plus important annuaire généraliste Annuaires scientifiques multidisciplinaires : Virtual Library : annuaire collectif de ressources scientifiques Les Signets de la BNF : sélection de sites de référence Signets Universités : Liens sélectionnés par les BU Sciseek DOAJ : annuaire de revues en libre accès 5952 revues recensées en janvier 2011 Guides disciplinaires de l’UQAC (Université du Québec à Chicoutimi) : Guides de ressources par disciplines Exemple en Génie informatique Urfist de Rennes, SCD Rennes 1, 2011

10 2.1 Outils de repérage et d’accès : les portails
Définition : "Ressource accessible via Internet, constituant un point d'accès unique, simplifié, facile d'emploi et unifié, pour un public cible, à des ressources (services, produits) électroniques distantes, variées et hétérogènes". (Sylvie Dalbin, Instruments de recherche sur le Web, in La Recherche d'information sur les réseaux, cours INRIA 2002) Dispositif : documentaire (ressources informationnelles), communicationnel, éditorial, technique... Diversité des ressources et services : recherche d ’information, achats/ventes, informations générales, spécialisées, personnalisation, messagerie, forums, services d’alerte… Portails généralistes / spécialisés Exemples : Yahoo.fr, Culture.fr Urfist de Rennes, SCD Rennes 1, 2011

11 2.1 Annuaires et portails en sciences
Portails officiels : Science.gouv.fr, portail de la science du Ministère de l’Enseignement supérieur Portails multidisciplinaires : Intute : Portail scientifique multidisciplinaire Voir Intute Mathematics and Computer science SciNet Science and Technology : Annuaire, créé en 1999 SciCentral Portail de ressources scientifiques, depuis 1997 Urfist de Rennes, SCD Rennes 1, 2011

12 2.1 Annuaires et portails spécialisés : en Sciences de la terre
Le portail des sciences de la terre du BRGM Voir notamment Liens utiles Le portail européen : EuroGeoSurveys Portail de 33 organisations européennes de sciences de la terre Voir notamment Links Athena Earth Sciences Resources Annuaire de liens de l’Université de Genève GeoScience : K 12 Resources Annuaire canadien Urfist de Rennes, SCD Rennes 1, 2011

13 Urfist de Rennes, SCD Rennes 1, 2011
2.1 Annuaires et portails spécialisés : en Sciences physiques et astronomie PhysicsWorld.com : Portail de l’Institute of Physics PhysNet : Portail de l'European physical society, Université d'Oldenburg (Allemagne) Liste de liens vers les institutions de physique dans le monde entier recherche de documents parmi des bases de prépublications, de rapports, de thèses AstroWeb : Annuaire de sites en astronomie (plus de 3000) Consortium de 7 institutions, dont le Centre de Données astronomiques de Strasbourg (CDS) Urfist de Rennes, SCD Rennes 1, 2011

14 2.1 Annuaires et portails spécialisés : en chimie
Links for Chemists : Annuaire de plusieurs milliers de liens en chimie. Université de Liverpool Section chimie de la Virtual Library SIRCh (Selected Internet Resources for Chemistry) : Annuaire de ressources en chimie, Accessible sur le Chemical Information Sources Wiki wiki, créé par Gary Wiggins, enseignant à l'Université d'Indiana Urfist de Rennes, SCD Rennes 1, 2011

15 3.1 Les moteurs de recherche
Définition : outil automatisé d’indexation et de recherche des ressources du web Fonctionnement : 3 modules autonomes : robot collecteur : collecte des données module d’indexation : base de données du moteur module de requête : gestion des requêtes et des résultats Différence avec les annuaires : - indexent automatiquement les ressources - indexent les pages web et/ou les documents, et non les sites Urfist de Rennes, SCD Rennes 1, 2011

16 3.1 Moteurs de recherche : comprendre leur fonctionnement
Urfist de Rennes, SCD Rennes 1, 2011 Source : R. Viseur, CETIC

17 3.1 Moteurs de recherche : maîtriser l’interrogation avancée
Nombreuses possibilités de filtrage des résultats : géographique du web : mondial, francophone linguistique : choix de la langue des ressources des types de ressources : images, audio… des ressources internet : web, forum, messagerie, weblogs des formats : HTML, PDF, DOC, PPT, XLS, RTF… des dates : plusieurs options (mais problématique) des champs : titre, URL, host, domaine… thématique : choix du domaine de recherche Exercice de recherche : chercher un support pédagogique récent, en français, expliquant le fonctionnement des moteurs de recherche et provenant d’une université Urfist de Rennes, SCD Rennes 1, 2011

18 3.1 Moteurs de recherche : maîtriser les opérateurs de recherche
Opérateurs booléens : AND : implicite ; différent de + + : prend en compte l’orthographe exacte - : exclut un ou plusieurs termes (SAUF) OR (ou |) : l’un ou l’autre ou tous les termes Opérateurs linguistiques : «… » : recherche d’expression exacte * : astérisque permet de remplacer un terme sur Google : ~ : recherche sur les synonymes (dans version anglaise) define: : pour trouver la définition d’un mot Règle : limite des 10 mots Urfist de Rennes, SCD Rennes 1, 2011

19 Urfist de Rennes, SCD Rennes 1, 2011
3.1 Moteurs de recherche : connaître les méthodes de classement des résultats Enjeux du « relevance ranking », du classement des résultats selon leur pertinence Deux grandes méthodes (imbriquées) de classement : tri par indice de pertinence : calculs statistiques sur la fréquence des termes… tri par popularité : indice de popularité, indice de clic Urfist de Rennes, SCD Rennes 1, 2011

20 3.1 Méthodes de classement des résultats : l’indice de pertinence
Principes : classement des résultats fondé sur la fréquence d’apparition et la localisation des termes de la requête dans une page web affichage des résultats à partir du calcul d’un score pour chaque réponse : Ex. : Requête sur le marché des DVD en France : +marché +DVD +France > retourne les documents contenant tous les mots de la requête >> documents contenant le plus de fois les mots de la requête classés en premier Utilisation : première méthode de classement utilisée sur le web ; Utilisée, partiellement ou non, sur tous les moteurs de recherche ; Problèmes : détournement par le spamdexing Urfist de Rennes, SCD Rennes 1, 2011

21 3.1 Méthodes de classement des résultats : l’indice de popularité
Principes, origines : Utilisation de la nature hypertextuelle du web : prise en compte des liens entre sites, considérés comme des liens de parenté sémantique calcul de la notoriété d’un site en fonction du nombre de liens pointant vers le site Utilisation : indice de popularité lancé par Google en 98 originalité et succès de Google et de son PageRank Urfist de Rennes, SCD Rennes 1, 2011

22 3.1 Moteurs de recherche : utiliser le filtrage des résultats
Utiliser les options d’affinement des résultats : Sur Exalead : la « zapette » Sur Google : « Afficher les options » Différentes possibilités de filtrage : Sur les types de ressources : blogs, vidéos, actualités… Sur les dates d’indexation Sur les mots associés (Exalead), les recherches associées (Google Options de tri et d’affichage : Sur la chronologie (Google) Sur les concepts (« roue magique » sur Google) Urfist de Rennes, SCD Rennes 1, 2011

23 Urfist de Rennes, SCD Rennes 1, 2011
3.1 Moteurs de recherche : distinguer liens naturels et liens sponsorisés Positionnement : Position occupée par un site ou une page web dans la page de résultats d’un outil de recherche Positionnement naturel Selon le contenu, la notoriété… du site parcouru par le robot Positionnement payant : Achat de mots-clés, pour garantir une visibilité en tête des résultats d’un outil de recherche Ex. sur Google  Principale source du financement de Google Urfist de Rennes, SCD Rennes 1, 2011

24 3.2 Outils de recherche : Les métamoteurs
Définition : Un métamoteur est un outil de recherche qui interroge en parallèle plusieurs outils (moteurs et annuaires), rapatrie leurs réponses et les organise, selon des méthodes de classement spécifiques, pour fournir aux utilisateurs une présentation structurée des résultats. Nés en 1995 Diversité des métamoteurs : En ligne / hors-ligne Généraux / spécialisés * Urfist de Rennes, SCD Rennes 1, 2011

25 Urfist de Rennes, SCD Rennes 1, 2011
3.2 Les métamoteurs Fonctionnement, éléments d’un métamoteur : pas de base de données en propre outils intermédiaires : une seule requête posée sur différents outils Exploitation des résultats des autres outils Généralement, fusion des résultats et élimination des doublons Classement des résultats selon critères propres au métamoteur Présentation des résultats, selon différentes méthodes : linéaires, cartographiques Urfist de Rennes, SCD Rennes 1, 2011

26 Urfist de Rennes, SCD Rennes 1, 2011
3.2 Les métamoteurs Utilisation, intérêt : Simplification : Une seule requête sur plusieurs outils Elargissement de la recherche : : Possibilité d’interroger plusieurs sources : d’une dizaine à un millier (Copernic) Renforcement de la pertinence : Sélection des documents plus poussée, par le calcul de pertinence opéré sur plusieurs outils Utiles pour un panorama des ressources, des sites de référence sur un thème Exploitation parfois sophistiquée des résultats Outils paramétrables, personnalisables (surtout hors-ligne) Urfist de Rennes, SCD Rennes 1, 2011

27 Urfist de Rennes, SCD Rennes 1, 2011
3.2 Les métamoteurs Exemples de métamoteurs : Francophones : Ixquick : Anglo-saxons : Yippy : Plusieurs modules spécialisés Techniques de clustérisation SurfWax : Urfist de Rennes, SCD Rennes 1, 2011

28 4/ Outils de recherche spécialisés selon l’offre des ressources
Au moins 3 critères de spécialisations : Selon les ressources internet : Moteurs de blogs, de forums, de listes de diffusion, de FAQ, de wikis, de fils RSS… Selon la nature du contenu : Moteurs scientifiques, d’actualité, de personnes, de produits… Selon la nature du média : Moteurs d’images, de vidéos, de podcasts, de photos.. Autres critères possibles : langue, géographie, domaine thématique… Urfist de Rennes, SCD Rennes 1, 2011

29 4/ Outils spécialisés : quelques exemples
Selon les ressources internet : Moteurs de blogs : Technorati Google Blog Search Pour aller plus loin : Intelligence-Center Selon la nature des informations : Moteurs d’actualité (dépêches, articles…) : Wikio Yahoo Actualités Urfist de Rennes, SCD Rennes 1, 2011

30 4.1 Moteurs scientifiques
Moteurs spécialisés sur les ressources scientifiques Plusieurs types, plusieurs statuts…; typologie possible selon : Le contenu des ressources : Moteurs multidisciplinaires : Google Scholar, Scirus… Moteurs disciplinaires : GetInfo, SearchPigeon… L’accessibilité des ressources : Moteurs de recherche spécialisés dans les ressources en "libre accès" (open access), appelés aussi moissonneurs (harvesters) : OAIster… Moteurs de recherche spécialisés dans les articles de revues, la littérature scientifique commercialisée : Scirus… Urfist de Rennes, SCD Rennes 1, 2011

31 4.1 Google Scholar : fonctionnalités d’interrogation
Préférences : interface en français Lien vers bibliothèques Champs et opérateurs avancés d’interrogation : Sur l’auteur : author: ou champ Auteur en mode avancé Sur le titre d’une revue : Uniquement en mode avancé : champ Publication, Sur le titre d’un article ou d’un document : Opérateur intitle: Sur la date : Uniquement en mode avancé : champ Date Pour en savoir plus Urfist de Rennes, SCD Rennes 1, 2011

32 4.1 Moteurs scientifiques en sciences et techniques
Toutes disciplines scientifiques : Scirus : Produit par Elsevier ; indexation des revues et produits d’Elsevier plus de 450 millions de documents Pour en savoir plus, cf Urfist de Lyon Citebase Search : base de citations ; articles en physique, maths, informatique, biologie et médecine Urfist de Rennes, SCD Rennes 1, 2011

33 4.2 Moteurs scientifiques : moissonneurs
OAIster : Le plus grand moissonneur OAI Développé à l’Université du Michigan et soutenu par OCLC (depuis janvier 09) Donne accès à plus de 23 millions de notices Alimenté par plus de 1100 contributeurs : archives ouvertes essentiellement Désormais intégré et accessible dans WorldCat LARA : Libre accès aux Rapports scientifiques et techniques Moissonneur de l’INIST A. Serres, Urfist Rennes, 2011 Urfist de Rennes, SCD Rennes 1, 2011 33

34 4.2 Moteurs scientifiques : moissonneurs
Scientific Commons : Conçu par l'Université de St Gallen et l'Institute for Media and Communications Management (Suisse). Annonçe plus de 38 millions de publications, plus de 6 millions d'auteurs, réparties sur plus de 1100 archives. Simplicité d’interrogation en texte intégral et filtrage des résultats par année et par langue (anglais et allemand) et pertinence. Exportation des références bibliographiques d'un résultat au format EndNote ou Bibtex. Commence à extraire les citations des publications indexées en texte intégral (+ de ). Urfist de Rennes, SCD Rennes 1, 2011 34

35 4.2 Moteurs scientifiques : géolocalisation de chercheurs
AuthorMapper : Outil bibliométrique gratuit, produit par Springer Recherche dans 3 millions d’articles, issus des 2000 revues diffusées par Springer Géolocalisation : Croisement des données sur les publications en ligne avec la technologie Google Maps Localisation d’experts, d’équipes, de thèmes de recherche… Urfist de Rennes, SCD Rennes 1, 2011

36 Urfist de Rennes, SCD Rennes 1, 2011
5/ Outils pour la veille Veille : au sens large, activité de surveillance de l’environnement et de ses évolutions, dans un domaine donné Importance pour le chercheur : Se tenir informé des nouveautés dans son domaine Suivre l’actualité d’un site, d’une source, d’un auteur… Nombreux outils existants : Métamoteurs, outils professionnels Syndication de contenus Urfist de Rennes, SCD Rennes 1, 2011

37 5.1 Faire de la veille : les alertes
Rappel : Répétition automatique d’une requête à chaque mise à jour d’une source d'information (base de données, catalogue, revue, moteur de recherche…). Comment mettre en place une alerte ? Ouvrir un compte, définir un profil Définir la source : revue, site… définir la requête : mots-clés.. Définir la périodicité des alertes Définir le mode de transmission : mel, fils RSS Urfist de Rennes, SCD Rennes 1, 2011

38 5.1 Faire de la veille : les alertes
Quelques exemples de services d’alertes Tous publics, tous sujets : Google Alertes Sur les bases de données : voir Services d’alertes dans les bases de données Services scientifiques : Inist : Services payants de veille Urfist de Rennes, SCD Rennes 1, 2011

39 5.1 Faire de la veille : exemples de veille avec les fils RSS
Récupération automatique : des tables des matières des derniers numéros de revues électroniques : Ex. : fils RSS des revues du groupe Nature des résultats d'une recherche bibliographique dans une base de données : ex : fils RSS dans Pubmed Des derniers billets d’un blog scientifique : Ex. : DrugMonkey Nature What we do ?  newsfeed American Institute of Physics RSS Feeds Pour chaque journal, il y a plusieurs fils Pubmed Send to : RSS feed Urfist de Rennes, SCD Rennes 1, 2011

40 5.1 Faire de la veille : utiliser les fils RSS
Différents outils pour agréger et lire les fils RSS : Agrégateurs en ligne : MetaRSS, Pages personnalisables : Netvibes, IGoogle... Agrégateurs en local : FeedReader ; Agrégateurs intégrés au navigateur : Firefox, Safari, Opera.. Urfist de Rennes, SCD Rennes 1, 2011

41 5.2 Faire de la veille : Les pages personnalisables
Définition : Pages personnalisables : Possibilité de gérer et d’organiser soi-même ses flux RSS Pages web organisées en onglets et boîtes Fournies gratuitement Exemples : Netvibes PagesFlakes iGoogle Urfist de Rennes, SCD Rennes 1, 2011

42 5.2 Faire de la veille : Les pages personnalisables
Fonctions : Pour la gestion et la recherche d’information Choix personnel des sources : sites web, blogs, fils RSS … Divers services : calendrier, agenda … Bureau virtuel Outils de veille, de surveillance Outils d’information, de publication Développement des portails Netvibes Pages personnalisables Netvibes rendues publiques Urfist de Rennes Documentation Française MonBiblioCNRS : Portail Netvibes du CNRS Urfist de Rennes, SCD Rennes 1, 2011

43 6/ Les plateformes de partage de signets
Intérêt pour la recherche : Recherche parmi les sources jugées pertinentes par une groupe d’utilisateurs Identifier des leaders de veille Juger de la popularité d’une source (combien de fois a-t-elle été mise en signets) Urfist de Rennes, SCD Rennes 1, 2011

44 6/ Les plateformes de partage de signets
Intérêt pour les doctorants : Garder les traces de ses navigations Repérer des sources fiables Gérer ses bibliographies Faire de la veille Se familiariser avec les outils 2.0 Urfist de Rennes, SCD Rennes 1, 2011

45 6/ Les plateformes de partage de signets
Intérêt : Simplicité : de collecte et de gestion des signets Plus-value documentaire : Tags Catégories Plus-value sociale : Capitalisation du réseau Réseaux de confiance Principes : Externalisation de ses bookmarks Indexation libre par tags Classement des signets par catégories et par tags Indication du nombre de signalements d'un même signet Création de réseaux de partage « social bookmarking » Urfist de Rennes, SCD Rennes 1, 2011

46 6/ Plateformes de partage de signets
Généralistes : Delicious : Yahoo Diigo Blogmarks : entreprise française Blinklist : MindValley Labs, entreprise de Malaisie Scientifiques : Connotea : revue Nature 2collab : Elsevier Bibsonomy : Université de Kassel (Allemagne) Urfist de Rennes, SCD Rennes 1, 2011

47 Urfist de Rennes, SCD Rennes 1, 2011
6.1 Gérer ses signets sur des plateformes de partage en ligne : Delicious Plateforme de partage de signets la plus ancienne : Créée fin 2003 par Joshua Schachter, pour gérer ses propres signets Ancien nom : Del.icio.us Plateforme rachetée par Yahoo en décembre 2005 Symbole du web 2.0 et des folksonomies Plateforme la plus importante : tous publics Création de réseaux de social bookmarking Interfaçage avec applications web 2.0: pages perso., autres plateformes... Urfist de Rennes, SCD Rennes 1, 2011

48 Urfist de Rennes, SCD Rennes 1, 2011
6.2 Gérer ses signets sur des plateformes de partage en ligne : Connotea Connotea Lancé en 2004 par la revue Nature (Nature Publishing Group) Service en ligne gratuit Création, gestion, partage de sa bibliographie de références en ligne gratuit / accès à l’ensemble des références partagées dans Connotea + Partage de signets dans le monde académique Annotation / Tags Extraction automatique de références bibliographiques Abonnement RSS aux listes des autres utilisateurs ou tags spécifiques Export possible Urfist de Rennes, SCD Rennes 1, 2011

49 Urfist de Rennes, SCD Rennes 1, 2011
6.2 Gérer ses signets sur des plateformes de partage en ligne : Connotea Connotea Installation des boutons Connotea dans la barre personnelle navigateur « My Library » « Add to Connotea » « Connotea Comments » Intégration de signets en cours de navigation Page courante + clic sur Add Connotea Urfist de Rennes, SCD Rennes 1, 2011

50 Urfist de Rennes, SCD Rennes 1, 2011
6.2 Gérer ses signets sur des plateformes de partage en ligne : Connotea Utilisation de la toolbox pour gérer sa bibliothèque Boîte à outils Connotea Urfist de Rennes, SCD Rennes 1, 2011

51 7/ Ressources pour aller plus loin
REPERE SAPRISTI SISTEM CALIS DEFIST MethoDoc (Univ. De Gembloux) InfoSpheres AERIS (en sciences) URFIST de Rennes : Supports de formation sur la recherche d’information Sélection de ressources sur les outils de recherche URFIST de Lyon : Ressources pédagogiques Urfist de Rennes, SCD Rennes 1, 2011


Télécharger ppt "Outils de recherche du web Alexandre Serres URFIST de Rennes"

Présentations similaires


Annonces Google