La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Urfist de Rennes, 20091 M odule de formation à la maîtrise de linformation scientifique 2008-2009 Ecoles Doctorales, URFIST, SCD Rennes 2 Module 1, TD.

Présentations similaires


Présentation au sujet: "Urfist de Rennes, 20091 M odule de formation à la maîtrise de linformation scientifique 2008-2009 Ecoles Doctorales, URFIST, SCD Rennes 2 Module 1, TD."— Transcription de la présentation:

1 Urfist de Rennes, M odule de formation à la maîtrise de linformation scientifique Ecoles Doctorales, URFIST, SCD Rennes 2 Module 1, TD 2 : Outils de recherche du web Session ALL Alexandre Serres, Marie-Laure Malingre URFIST de Rennes

2 Urfist de Rennes, 20092

3 3 PLAN 1/Panorama, typologies des outils de recherche 2/ Outils de repérage et daccès : annuaires thématiques, portails… 3/ Outils automatisés : moteurs et métamoteurs de recherche 4/ Moteurs scientifiques, moissonneurs OAI… 5/ Outils pour la veille : syndication de contenu, pages personnalisables… 6/ Outils de gestion et de partage de signets : les plates-formes de « social bookmarking » 7/ Ressources pour aller plus loin

4 © A. Serres URFIST, / Panorama, typologies des outils de recherche Existence de milliers doutils de recherche : Voir :ISEDB, Vite tous les outilsISEDBVite tous les outils Nombreuses catégories doutils : Annuaires thématiques Moteurs de rcherche Moteurs spécialisés Métamoteurs Outils de veille, agents intelligents Portails, sites de référence Moissonneurs Plates-formes de signets Pages personnalisables... > quelles typologies ?

5 Urfist de Rennes, /Typologies des outils de recherche du web Distinguer dabord : Outils propres au web : moteurs de recherche, moteurs de blogs… Outils accessibles par le web : bases de données, catalogues… Deux critères essentiels : Offre des ressources : outil généraliste / spécialisé Mode dindexation : outil humain / automatisé

6 Urfist de Rennes, / Typologies des moteurs de recherche : loffre des ressources Critère : type de ressources collectées Distinction principale : Moteurs généralistes : G., Yahoo, Exalead, Ask, Live Search… caractéristique historique des grands moteurs : collecte et indexation de tous les types de ressources Moteurs spécialisés : Tendance lourde des moteurs : Modules spécialisés à lintérieur des moteurs généralistes Infinité des types de spécialisations Explosion du nombre doutils

7 Urfist de Rennes, / Typologies des outils de recherche : la spécialisation Plusieurs types de spécialisation : géographique : Breizoo, Annuaire Recherche France / linguistiqueBreizooAnnuaire Recherche France Allemagne : Google.de, Espagne : Yahoo pour lEspagne …Google.deYahoo pour lEspagne selon le contenu des ressources indexées : littérature grise (Google Scholar), presse (Google News)Google Scholar disciplinaire : Scirus en Sciences exactes, In-Extenso.org en SHSIn-Extenso.org par domaine : portails thématiques : Culture.fr, FabulaCulture.frFabula par type de ressources Internet : forums (Google Groups), listes de diffusion (Francopholistes), blogs (Blogonautes)Google GroupsBlogonautes Selon les parties du web : web invisible (DADI)DADI selon les supports : images, vidéos (Google ou Yahoo), fichiers son…

8 Urfist de Rennes, Outils de repérage : les annuaires thématiques Premiers outils du web : Virtual Library (1991), Yahoo (1994) Des principes communs : Sélection humaine de ressources : Caractère très sélectif des annuaires Recensement de sites web (et non de pages web) Pré-catégorisation des ressources Arborescence Description manuelle des sites Moteur de recherche interne à lannuaire : Possibilités de requêtes

9 Urfist de Rennes, Outils de repérage : les annuaires thématiques Usages : Recherche dinformation sur un sujet large Première approche dun domaine : Exemple de la presse Recherche géographique Recherche de sites de référence utiles pour défricher un domaine, pour les premières recherches sur un sujet Ne pas opposer annuaires et moteurs : outils complémentaires

10 Urfist de Rennes, Outils de repérage : les annuaires thématiques Annuaires tous publics: Open Directory : Open Directory annuaire collaboratif plus important annuaire généraliste Annuaires scientifiques multidisciplinaires : Virtual Library : annuaire collectif de ressources scientifiques Virtual Library Les Signets de la BNF : Les Signets de la BNF sélection de sites de référence Infomine. Scholarly Internet Resource Collection > Arts and Humanities Infomine Répertoire réalisé par des bibliothécaires duniversités américaines Boîte de recherche avec filtrage, description de la ressource BUBL Link, Catalogue of Internet Resources (toutes les thématiques universitaires) BUBL Link DOAJ (Directory of Open Access Journals) : DOAJ 3849 revues en libre accès

11 Urfist de Rennes, Outils de repérage et daccès : les portails Définition : "Ressource accessible via Internet, constituant un point d'accès unique, simplifié, facile d'emploi et unifié, pour un public cible, à des ressources (services, produits) électroniques distantes, variées et hétérogènes". (Sylvie Dalbin, Instruments de recherche sur le Web, in La Recherche d'information sur les réseaux, cours INRIA 2002) Dispositif : documentaire (ressources informationnelles), communicationnel, éditorial, technique... Diversité des ressources et services : recherche dinformation, achats/ventes, informations générales, spécialisées, personnalisation, messagerie, forums, services dalerte… Portails généralistes / spécialisés Exemples : Yahoo.fr, Fabula, Culture.frYahoo.frFabulaCulture.fr

12 Urfist de Rennes, Outils de repérage : annuaires et portails en ALL Répertoires, Portails, sélections de liens : quelques exemples Voice of the Shuttle (Alan Liu, University of California, Santa Barbara) Voice of the Shuttle Le portail Culture.frCulture.fr 16 thèmes : archéologie, art contemporain, Livres et littérature … Accès par région + Interface de recherche (simple et avancée) Intute Arts and Humanities : Sélection de ressources web pour léducation et la recherche

13 Urfist de Rennes, Outils de repérage : annuaires et portails en ALL Le portail Fabula (Association de chercheurs)Fabula Informations /théorie et critique littéraires Ressources scientifiques (atelier, revues, cours et colloques en ligne Outils collaboratifs Offres de postes et de bourses, etc. The Linguist List Archeophile, Annuaire de larchéologie francophone Archeophile La clé des langues (DGES / ENS LSH) La clé des langues Pour enseignants du secondaire / Ouverture sur le monde de la recherche universitaire Les liens de la Société française de musicologieSociété française de musicologie Musicologie toutes époques, tous domaines

14 Urfist de Rennes, Moteurs de recherche Premiers points daccès à Internet Outils également anciens : 1995 Également appelés : robots de recherche, spiders, crawlers, worms, search engines Différence avec les annuaires : - indexent automatiquement les ressources - indexent les pages web et/ou les documents, et non les sites

15 Urfist de Rennes, Fonctionnement des moteurs de recherche Source : R. Viseur, CETICR. Viseur, CETIC

16 Urfist de Rennes, Maîtriser linterrogation avancée : le filtrage Nombreuses possibilités de filtrage des résultats : géographique du web : mondial, francophone linguistique : choix de la langue des ressources des types de ressources : images, audio… des ressources internet : web, forum, messagerie, weblogs des formats : HTML, PDF, DOC, PPT, XLS, RTF… des dates : plusieurs options (mais problématique) des champs : titre, URL, host, domaine… thématique : choix du domaine de recherche Exercice de recherche : chercher un support pédagogique récent, en français, expliquant le fonctionnement des moteurs de recherche et provenant dune université

17 Urfist de Rennes, Maîtriser linterrogation avancée : les opérateurs de recherche Opérateurs booléens : AND : implicite ; différent de + + : prend en compte lorthographe exacte - : exclut un ou plusieurs termes (SAUF) OR (ou |) : lun ou lautre ou tous les termes Opérateurs linguistiques : «… » : recherche dexpression exacte * : astérisque permet de remplacer un terme sur Google : ~ : recherche sur les synonymes (dans version anglaise) define: : pour trouver la définition dun mot Règle : limite des 10 mots

18 Urfist de Rennes, Moteurs de recherche : m éthodes de classement des résultats Enjeux du « relevance ranking », du classement des résultats selon leur pertinence Trois grandes méthodes (imbriquées) de classement : tri par indice de pertinence : calculs statistiques sur la fréquence des termes… tri par popularité : indice de popularité, indice de clic tri par calcul dynamique de catégories …. + positionnement payant...

19 Urfist de Rennes, Méthodes de classement des résultats : lindice de pertinence Principes : classement des résultats fondé sur la fréquence dapparition et la localisation des termes de la requête dans une page web affichage des résultats à partir du calcul dun score pour chaque réponse : Ex. : Requête sur le marché des DVD en France : +marché +DVD +France > retourne les documents contenant tous les mots de la requête >> documents contenant le plus de fois les mots de la requête classés en premier Utilisation : première méthode de classement utilisée sur le web ; Utilisée, partiellement ou non, sur tous les moteurs de recherche ; Problèmes : détournement par le spamdexing

20 Urfist de Rennes, Méthodes de classement des résultats : lindice de popularité Principes, origines : Utilisation de la nature hypertextuelle du web : prise en compte des liens entre sites, considérés comme des liens de parenté sémantique calcul de la notoriété dun site en fonction du nombre de liens pointant vers le site Utilisation : indice de popularité lancé par Google en 98 originalité et succès de Google et de son PageRankGoogle

21 Urfist de Rennes, Méthodes de classement : classification automatique des résultats Technologies plus complexes ; domaine dinnovations avancées des moteurs : cf Exalead Exalead Principes : organisation dun lot de résultats pour donner possibilité daffiner ou étendre la requête répartition des documents dans des classes Intérêt pour la recherche : aide à la sélection dun mot-résultat aide à lélimination des corrélations inintéressantes suggestion didées et de pistes nouvelles Voir aussi sur Exalead les différentes possibilités d'affinement de la requête : Rubriques associées Limitation par zones géographiques Différents types de fichiers Recherches spécialisées : actualité, RSS...

22 Urfist de Rennes, La gestion des résultats : Marketing publicitaire, positionnement payant Positionnement : Position occupée par un site ou une page web dans la page de résultats dun outil de recherche Positionnement naturel Selon le contenu, la notoriété… du site parcouru par le robot Positionnement payant : Achat de mots-clés, pour garantir une visibilité en tête des résultats dun outil de recherche Principale source du financement des moteurs

23 Urfist de Rennes, Outils de recherche : Les métamoteurs Définition : Un métamoteur est un outil de recherche qui interroge en parallèle plusieurs outils (moteurs et annuaires), rapatrie leurs réponses et les organise, selon des méthodes de classement spécifiques, pour fournir aux utilisateurs une présentation structurée des résultats. Nés en 1995 Diversité des métamoteurs : En ligne / hors-ligne Généraux / spécialisés

24 Urfist de Rennes, Les métamoteurs Fonctionnement, éléments dun métamoteur : pas de base de données en propre outils intermédiaires : une seule requête posée sur différents outils Exploitation des résultats des autres outils Généralement, fusion des résultats et élimination des doublons Classement des résultats selon critères propres au métamoteur Présentation des résultats, selon différentes méthodes : linéaires, cartographiques

25 Urfist de Rennes, Les métamoteurs Utilisation, intérêt : Simplification : Une seule requête sur plusieurs outils Elargissement de la recherche : : Possibilité dinterroger plusieurs sources : dune dizaine à un millier (Copernic) Renforcement de la pertinence : Sélection des documents plus poussée, par le calcul de pertinence opéré sur plusieurs outils Utiles pour un panorama des ressources, des sites de référence sur un thème Exploitation parfois sophistiquée des résultats Outils paramétrables, personnalisables (surtout hors- ligne)

26 Urfist de Rennes, Les métamoteurs Exemples de métamoteurs : Francophones : Ixquick : Ixquick Kartoo : Kartoo Présentation cartographique Anglo-saxons : Clusty : : Clusty : Plusieurs modules spécialisés Techniques de clustérisation SurfWax : SurfWax

27 Urfist de Rennes, / Outils de recherche spécialisés selon loffre des ressources Au moins 3 critères de spécialisations : Selon les ressources internet : Moteurs de blogs, de forums, de listes de diffusion, de FAQ, de wikis, de fils RSS… Selon la nature du contenu : Moteurs scientifiques, dactualité, de personnes, de produits… Selon la nature du média : Moteurs dimages, de vidéos, de podcasts, de photos.. Autres critères possibles : langue, géographie, domaine thématique…

28 Urfist de Rennes, / Outils spécialisés : quelques exemples Selon les ressources internet : Moteurs de blogs : Technorati Google Blog Search Pour aller plus loin : Intelligence-CenterIntelligence-Center Selon la nature des informations : Moteurs dactualité (dépêches, articles…) : Wikio Yahoo Actualités

29 Urfist de Rennes, / Moteurs scientifiques, moissonneurs Moteurs spécialisés sur les ressources scientifiques Plusieurs types, plusieurs statuts… Moteurs de recherche scientifiques : Google Scholar : toutes disciplines Google Scholar Scirus : sciences exactes Scirus Academic Index : toutes disciplines Academic Index CiteSeer.IST : sciences physiques et de lingénieur CiteSeer.IST In-extenso.org : SHS In-extenso.org Moissonneurs OAI : OAIster : toutes disciplines OAIster Michael : culture, arts, patrimoine Michael

30 © URFIST de Rennes, Moteurs scientifiques : Google Scholar Stratégie de Google : « guichet universel » pour la science grand catalogue mondial Succès de Google Scholar : Très bon accueil dans les universités Ancrage dans les bibliothèques anglo- saxonnes, et européennes : Initiative Library Links Rivalité avec lISI : Même nombre de citations que lISI Intérêt de Google Scholar : Accès gratuit à lIST, même en référence secondaire Valorisation et visibilité des AO Intérêt des citations Visibilité des chercheurs Pas de publicité Problèmes posés : Situation dangereuse de monopole daccès Gratuité pour le moment, mais jusquà quand ? Effets pervers de lindice de popularité

31 Urfist de Rennes, Google Scholar : fonctionnalités dinterrogation Préférences : interface en français Lien vers bibliothèques Champs et opérateurs avancés dinterrogation : Sur lauteur : author: ou champ Auteur en mode avancé Sur le titre dune revue : Uniquement en mode avancé : champ Publication, Sur le titre dun article ou dun document : Opérateur intitle: Sur la date : Uniquement en mode avancé : champ Date Pour en savoir plus

32 Urfist de Rennes, Moteurs scientifiques : disciplinaires In-extenso.org : In-extenso.org Moteur de la plate-forme Revues.org Spécialisé sur les SHS Utilité pour ALL Recherche sur le web : pré-sélection de sites : pages de sites web en SHS Dans les dépôts OAI : articles

33 Urfist de Rennes, Moissonneurs OAI LOAI-PMH (Open Archives Initiative-Protocol for Metadata Harvesting) : protocole visant à favoriser léchange de données entre bases hétérogènes partage des métadonnées Entrepôts OAI : Fournissent les données Archives ouvertes, bibliothèques numériques, portails de revues… Agrégateurs OAI : Collectent les données par un « moissonneur »

34 Urfist de Rennes, Moissonneurs OAI : schéma de fonctionnement Source : François NawrockiFrançois Nawrocki

35 Urfist de Rennes, Moissonneurs OAI OAIster : OAIster Le plus grand moissonneur OAI Université du Michigan et OCLC (depuis janvier 09) Donne accès à plus de 19 millions de notices Alimenté par plus de 1000 organisations : archives ouvertes essentiellement Michael : Michael Moissonneur OAI européen Accès aux collections numériques : culture, arts, patrimoine

36 Urfist de Rennes, / Outils pour la veille Veille : au sens large, activité de surveillance de lenvironnement et de ses évolutions, dans un domaine donné Importance pour le chercheur : Se tenir informé des nouveautés dans son domaine Suivre lactualité dun site, dune source, dun auteur… Nombreux outils existants : Métamoteurs, outils professionnels Syndication de contenus

37 Urfist de Rennes, Outils pour la veille : la syndication de contenus Définition : Agrégation de contenus divers sur un même navigateur possibilité de publier automatiquement sur un site web des informations issues dautres sites web Outils : Agrégateur de fils RSS : en lecture Editeur de fils RSS : pour lédition Format RSS = Rich Site Summary, ou Really Simple Syndication Très nombreuses applications, liens avec les blogs Explosion du phénomène du RSS

38 Bibliobsession38 RSS (Really Simple Syndication = syndication vraiment simple) Moyen de syndication, capable de récupérer le contenu brut d'un site web sans s'occuper des données liées à sa forme On parle de Flux RSS, Fil RSS, liens RSS, RSS feed, canaux RSS Source : BibliobsessionBibliobsession

39 Urfist de Rennes, Outils de syndication de contenus Plusieurs fonctions des fils RSS : Suivre lactualité dun site : réception de toutes les nouveautés Se tenir informé : Sur lactualité : tous les journaux proposent des fils RSS Presse : ex. de LibérationLibération Sur un domaine : suivi de blogs et de sites spécialisés ex. de UrfistInfoUrfistInfo Outil de veille et de surveillance, technique du push

40 Urfist de Rennes, Outils de syndication de contenus : les « pages perso » Pages personnalisables : Fourniture gratuite de pages web, personnalisables pour la gestion et la recherche dinformation Choix personnel des sources : sites web, blogs, fils RSS… Divers services : calendrier, agenda… Exemple de NetvibesNetvibes

41 Urfist de Rennes, / Les plates-formes de partage de signets Le principe de la folksonomie : Forme de « classification collaborative décentralisée spontanée », sappuyant sur les termes choisis par les utilisateurs Objectif : faciliter lindexation des contenus et la recherche dinformation Tags peuvent sappliquer à des signets web, à des photos, à des projets, des vidéos, ou encore des billets de blogs (nuages de tags) Constitution dune communauté de « spécialistes » parmi les internautes

42 Urfist de Rennes, / Les plates-formes de partage de signets Intérêt pour la recherche : Recherche parmi les sources jugées pertinentes par une groupe dutilisateurs Identifier des leaders de veille Juger de la popularité dune source (combien de fois a-t-elle été mise en signets)

43 Urfist de Rennes, Exemples de plate-formes de partage de signets Généralistes : Del.icio.us, Yahoo! MyWeb2, Furl, Blogmarks, BlinklistDel.icio.usYahoo! MyWeb2Furl BlogmarksBlinklist Scientifiques : Connotea, CiteUlikeConnoteaCiteUlike Recherche sur le titre des signets de tous les autres utilisateurs et sur leurs tags Problème : logiques de classement et dindexation différentes selon les internautes Solution partielle sur Del.icio.us : description des tags 6.1 Les plates-formes de partage de signets

44 Urfist de Rennes, Les plates-formes de partage de signets del.icio.us : del.icio.us La plus ancienne Créée en 2004 par Joshua Schachter, revendue à Yahoo en 2005 partage de signets tous publics Création de réseaux LiveMarks : LiveMarks pour suivre la création de signets sur Del.icio.us en temps réel Connotea : Partage de signets dans le monde académique Lancé par revue Nature En 2008, liens, tags et utilisateurs, dont 4811 actifs. pour létablissement de favoris, extraction automatique des références bibliographiques issus de sites tels que Nature, Science, PubMed

45 Urfist de Rennes, Les plates-formes de partage de documents multimédias Les images : Flickr : Flickr racheté par Yahoo! en 2OO5 Plus grande base de données de photos Mise en ligne de collections photographiques de bibliothèques : Cf la collection de la Library of CongressLibrary of Congress Les vidéos YouTube, DailyMotion YouTubeDailyMotion Les diaporamas SlideShare partage et récupération de présentations powerpoint + quelques formats alternatifs

46 Urfist de Rennes, / Ressources pour aller plus loin URFIST de Rennes : Supports de formation sur la recherche dinformation Supports de formation sur la recherche dinformation Sélection de ressources sur les outils de recherche Sélection de ressources sur les outils de recherche URFIST de Lyon : Ressources pédagogiques URFIST de Paris : Guides et tutoriels FORMIST REPERE SAPRISTI SISTEM CALIS DEFIST MethoDoc (Univ. De Gembloux) MethoDoc InfoSpheres (en SHS) InfoSpheres AERIS (en sciences) AERIS


Télécharger ppt "Urfist de Rennes, 20091 M odule de formation à la maîtrise de linformation scientifique 2008-2009 Ecoles Doctorales, URFIST, SCD Rennes 2 Module 1, TD."

Présentations similaires


Annonces Google