La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Module 1, TD 2 : Outils de recherche du web Session ALL

Présentations similaires


Présentation au sujet: "Module 1, TD 2 : Outils de recherche du web Session ALL"— Transcription de la présentation:

1 Module 1, TD 2 : Outils de recherche du web Session ALL
Maîtrise de l’information scientifique Ecoles Doctorales, URFIST, SCD Rennes Module 1, TD 2 : Outils de recherche du web Session ALL Alexandre Serres, Marie-Laure Malingre URFIST de Rennes

2 Googlisation ? Annuaires thématiques ? Bookmarking social ?
Syndication de contenus ? Folksonomie ? Googlisation ? Fils RSS ? Moteurs ? Indice de popularité ? Métamoteur ? Moissonneurs ? Web 2.0 ?

3 PLAN Introduction Panorama, typologies des outils de recherche
Outils de repérage et d’accès : annuaires thématiques, portails… Moteurs de recherche Généralistes Spécialisés Scientifiques Moissonneurs OAI Outils pour la veille : syndication de contenu, pages personnalisables… Outils de gestion et de partage : de signets, les plateformes de « social bookmarking »; de références ; de documents Réseaux sociaux Ressources pour aller plus loin

4 Introduction Le contexte : Le besoin :
Infobésité et surcharge informationnelle / question de l’évaluation Tout n’est pas visible par les moteurs de recherche = web invisible Multiplicité des dispositifs et des outils de recherche Hybridation des outils : difficulté des typologies Le besoin : Nécessité de bien connaître les outils disponibles Compétences informationnelles à développer

5 1/ Panorama, typologies des outils de recherche
Existence de milliers d’outils de recherche : Voir :ISEDB, Vite tous les outils Nombreuses catégories d’outils : Annuaires thématiques Moteurs de recherche Moteurs spécialisés Métamoteurs Outils de veille, agents intelligents Portails, sites de référence Moissonneurs Plates-formes de signets Pages personnalisables ... Quelles typologies ?

6 1/Typologies des outils de recherche du web
Distinguer d’abord : Outils propres au web : moteurs de recherche, métamoteurs, moteurs de blogs… Outils accessibles par le web : bases de données, catalogues… Deux critères essentiels : Offre des ressources : outil généraliste / spécialisé Mode d’indexation : outil humain / automatisé

7 1/ Typologies des moteurs de recherche : l’offre des ressources
Critère : type de ressources collectées Distinction principale : Moteurs généralistes : Google, Yahoo, Exalead, Ask, Bing… Caractéristique historique des grands moteurs : collecte et indexation de tous les types de ressources Moteurs spécialisés : Tendance lourde des moteurs : Modules spécialisés à l’intérieur des moteurs généralistes Infinité des types de spécialisations Explosion du nombre d’outils

8 1/ Typologies des outils de recherche : la spécialisation
Plusieurs types de spécialisation : géographique : Breizoo, Annuaire Recherche France / linguistique Allemagne : Google.de, Espagne : Yahoo pour l’Espagne … selon le contenu des ressources indexées : littérature grise (Google Scholar), presse (Google News) disciplinaire : Scirus en Sciences exactes, Search Pigeon en SHS par domaine : portails thématiques : Culture.fr, Fabula

9 1/ Typologies des outils de recherche : la spécialisation
Plusieurs types de spécialisation (suite) : par type de ressources Internet : forums (Google Groups) listes de diffusion (CataList ; JISCmail, listes la communauté scientifique anglaise) blogs (Blogonautes) Selon les parties du web : web invisible (DADI) selon les supports : images, vidéos (Google ou Yahoo), fichiers son…

10 2. Outils de repérage 2.1 Les annuaires thématiques
Premiers outils du web : Virtual Library (1991), Yahoo (1994) Des principes communs : Sélection humaine de ressources : Caractère très sélectif des annuaires Recensement de sites web (et non de pages web) Pré-catégorisation des ressources Arborescence Description manuelle des sites Moteur de recherche interne à l’annuaire : Possibilités de requêtes

11 2. Outils de repérage 2.1 Les annuaires thématiques
Annuaires tous publics: Open Directory : annuaire collaboratif plus important annuaire généraliste Annuaires scientifiques multidisciplinaires : Virtual Library : annuaire collectif de ressources scientifiques Les Signets de la BNF : sélection de sites de référence Infomine. Scholarly Internet Resource Collection > Arts and Humanities Répertoire réalisé par des bibliothécaires d’universités américaines Boîte de recherche avec filtrage, description de la ressource BUBL Link, Catalogue of Internet Resources (toutes les thématiques universitaires) DOAJ (Directory of Open Access Journals) : 3849 revues en libre accès

12 2. Outils de repérage 2.2 Les portails
Définition : "Ressource accessible via Internet, constituant un point d'accès unique, simplifié, facile d'emploi et unifié, pour un public cible, à des ressources (services, produits) électroniques distantes, variées et hétérogènes". (Sylvie Dalbin, Instruments de recherche sur le Web, in La Recherche d'information sur les réseaux, cours INRIA 2002) Dispositif : documentaire (ressources informationnelles), communicationnel, éditorial, technique... Diversité des ressources et services : recherche d’information, achats/ventes, informations générales, spécialisées, personnalisation, messagerie, forums, services d’alerte… Portails généralistes / spécialisés

13 2. Outils de repérage 2.3 Annuaires et portails en ALL
Répertoires, Portails, sélections de liens : quelques exemples Intute Humanities, Intute Psychology… : Sélection de ressources web pour l’éducation et la recherche Voice of the Shuttle (Alan Liu, University of California, Santa Barbara) Open Science Directory (EBSCO) Signets des universités (BU) DIRT, Digital Research Tools

14 2. Outils de repérage 2.3 Annuaires et portails en ALL
Le portail Fabula (Association de chercheurs) Informations /théorie et critique littéraires Ressources scientifiques (atelier, revues, cours et colloques en ligne Outils collaboratifs Offres de postes et de bourses, etc. The Linguist List Archeophile, Annuaire de l’archéologie francophone La clé des langues (DGES / ENS LSH) Pour enseignants du secondaire / Ouverture sur le monde de la recherche universitaire Les liens de la Société française de musicologie Musicologie toutes époques, tous domaines

15 3. Moteurs de recherche Premiers points d’accès à Internet
Outils également anciens : 1995 Également appelés : robots de recherche, spiders, crawlers, worms, search engines Différence avec les annuaires : indexent automatiquement les ressources indexent les pages web et/ou les documents, et non les sites

16 3. Moteurs de recherche 3.1 Fonctionnement
Source : R. Viseur, CETIC

17 3. Moteurs de recherche Maîtriser l’interrogation avancée
Nombreuses possibilités de filtrage des résultats : géographique du web : mondial, francophone linguistique : choix de la langue des ressources des types de ressources : images, audio… des ressources internet : web, forum, messagerie, weblogs des formats : HTML, PDF, DOC, PPT, XLS, RTF… des dates : plusieurs options (mais problématique) des champs : titre, URL, host, domaine… thématique : choix du domaine de recherche

18 3. Moteurs de recherche 3.1 Fonctionnement Maîtriser l’interrogation avancée
Opérateurs booléens : AND : implicite ; différent de + + : prend en compte l’orthographe exacte - : exclut un ou plusieurs termes (SAUF) OR (ou |) : l’un ou l’autre ou tous les termes Opérateurs linguistiques : «… » : recherche d’expression exacte * : astérisque permet de remplacer un terme sur Google : ~ : recherche sur les synonymes (dans version anglaise) define: : pour trouver la définition d’un mot Règle : limite des 10 mots

19 3. Moteurs de recherche 3.1 Fonctionnement Méthodes de classement des résultats
Enjeux du « relevance ranking », du classement des résultats selon leur pertinence Trois grandes méthodes (imbriquées) de classement : tri par indice de pertinence : calculs statistiques sur la fréquence des termes… tri par popularité : indice de popularité, indice de clic tri par calcul dynamique de catégories …. + positionnement payant...

20 3. Moteurs de recherche 3.1 Fonctionnement Classement par l’indice de pertinence
Principes : classement des résultats fondé sur la fréquence d’apparition et la localisation des termes de la requête dans une page web affichage des résultats à partir du calcul d’un score pour chaque réponse : Retourne en premier les documents contenant le plus de fois les mots de la requête Utilisation : première méthode de classement utilisée sur le web ; Utilisée, partiellement ou non, sur tous les moteurs de recherche Problèmes : détournement par le spamdexing

21 3. Moteurs de recherche 3.1 Fonctionnement Classement par l’indice de popularité
Principes, origines : utilisation de la nature hypertextuelle du web : prise en compte des liens entre sites, considérés comme des liens de parenté sémantique calcul de la notoriété d’un site en fonction du nombre de liens pointant vers le site Utilisation : indice de popularité lancé par Google en 98 originalité et succès de Google et de son PageRank

22 3. Moteurs de recherche 3.1 Fonctionnement classification automatique des résultats
Principes : organisation d’un lot de résultats pour donner possibilité d’affiner ou étendre la requête répartition des documents dans des classes Intérêt pour la recherche : aide à la sélection d’un mot-résultat aide à l’élimination des corrélations inintéressantes suggestion d’idées et de pistes nouvelles Exalead différentes possibilités d'affinement de la requête : Rubriques associées Limitation par zones géographiques Différents types de fichiers Recherches spécialisées : actualité, RSS...

23 3. Moteurs de recherche 3.1 Fonctionnement Marketing publicitaire, positionnement payant
Position occupée par un site ou une page web dans la page de résultats d’un outil de recherche Positionnement naturel Selon le contenu, la notoriété… du site parcouru par le robot Positionnement payant : Achat de mots-clés, pour garantir une visibilité en tête des résultats d’un outil de recherche  Principale source du financement des moteurs

24 3. Moteurs de recherche 3.2 Les métamoteurs
Définition : Un métamoteur est un outil de recherche qui interroge en parallèle plusieurs outils (moteurs et annuaires), rapatrie leurs réponses et les organise, selon des méthodes de classement spécifiques, pour fournir aux utilisateurs une présentation structurée des résultats. Nés en 1995 Diversité des métamoteurs : En ligne / hors-ligne Généraux / spécialisés *

25 3. Moteurs de recherche 3.2 Les métamoteurs
Fonctionnement, éléments d’un métamoteur : pas de base de données en propre outils intermédiaires : une seule requête posée sur différents outils Exploitation des résultats des autres outils Généralement, fusion des résultats et élimination des doublons Classement des résultats selon critères propres au métamoteur Présentation des résultats, selon différentes méthodes : linéaires, cartographiques

26 3. Moteurs de recherche 3.2 Les métamoteurs
Utilisation, intérêt : Simplification : Une seule requête sur plusieurs outils Elargissement de la recherche : Possibilité d’interroger plusieurs sources : d’une dizaine à un millier (Copernic) Renforcement de la pertinence : Sélection des documents plus poussée, par le calcul de pertinence opéré sur plusieurs outils Utiles pour un panorama des ressources, des sites de référence sur un thème Exploitation parfois sophistiquée des résultats Outils paramétrables, personnalisables (surtout hors-ligne) Exemples de métamoteur : Ixquick : Kartoo : (présentation cartographique)

27 4. Outils de recherche spécialisés selon l’offre des ressources
Au moins 3 critères de spécialisations : Selon les ressources internet : Moteurs de blogs, de forums, de listes de diffusion, de FAQ, de wikis, de fils RSS… Selon la nature du contenu : Moteurs scientifiques, d’actualité, de personnes, de produits… Selon la nature du média : Moteurs d’images, de vidéos, de podcasts, de photos.. Autres critères possibles : langue, géographie, domaine thématique…

28 4. Outils spécialisés : quelques exemples
Selon les ressources internet : Moteurs de blogs : Technorati Google Blog Search Pour aller plus loin : Intelligence-Center Selon la nature des informations : Moteurs d’actualité (dépêches, articles…) : Wikio Yahoo Actualités

29 4. Outils spécialisés quelques exemples La Blogosphère scientifique
Plateformes de blogs scientifiques L’exemple d’Hypothèses.org CLEO / Revues.org en 2008 Principe des carnets de recherche 74 carnets Accès par un moteur de recherche interne

30 4. Outils spécialisés : quelques exemples
Moteurs spécialisés sur les ressources scientifiques Plusieurs types, plusieurs statuts… Moteurs de recherche scientifiques : Google Scholar : toutes disciplines Scirus : sciences exactes Academic Index : toutes disciplines CiteSeer.IST : sciences physiques et de l’ingénieur Search Pigeon : SHS Moissonneurs OAI : Scientific Commons Base Moteurs de recherche des Archives ouvertes Moteurs de recherche dans les revues scientifiques en libre accès

31 4.1 Moteurs scientifiques : Google Scholar
Stratégie de Google : « guichet universel » pour la science grand catalogue mondial Succès de Google Scholar : Très bon accueil dans les universités Ancrage dans les bibliothèques anglo- saxonnes, et européennes Initiative Library Links Rivalité avec l’ISI : Même nombre de citations que l’ISI Intérêt de Google Scholar : Accès gratuit à l’IST, même en référence secondaire Valorisation et visibilité des AO Intérêt des citations Visibilité des chercheurs Pas de publicité Problèmes posés : Situation dangereuse de monopole d’accès Gratuité pour le moment, mais jusqu’à quand ? Effets pervers de l’indice de popularité Google comme « Superstructure bibliographique »

32 4.1 Moteurs scientifiques : Google Scholar
Préférences : interface en français Lien vers bibliothèques Champs et opérateurs avancés d’interrogation : Sur l’auteur : author: ou champ Auteur en mode avancé Sur le titre d’une revue : Uniquement en mode avancé : champ Publication, Sur le titre d’un article ou d’un document : Opérateur intitle: Sur la date : Uniquement en mode avancé : champ Date Pour en savoir plus : la fiche de l’URFIST de Lyon, celle de Julien Sicot

33 4.1 Moteurs scientifiques : Scirus
Scirus, Moteur scientifique : Pluridisciplinaire Forte représentation des STM Ressources : Journal Sources Preferred Web Sources Other Web Sources Types de documents : Articles, pré-publications, thèses, rapports, actes de congrès, monographies…

34 4.1 Moteurs scientifiques : disciplinaires
Exemples pour les Humanités Search Pigeon Open access journals and research tools for researchers in the humanities JURN A curated academic search-engine, indexing 6565 free ejournals in the arts & humanities

35 4.2 outils / Archives ouvertes
Ex : L’archive ouverte HAL (Hyper Article en ligne) et HAL-SHS, TEL (Thèses en ligne) Identifier les archives ouvertes (+ de 1400 dans le monde) OpenDOAR : The Directory of Open Access Repositories Registry of Open Access Repositories (ROAR) : Rechercher des articles scientifiques à l’aide des moissonneurs (harvesters) = « moteurs pour les archives ouvertes » OAIster : (versé dans le WorldCat depuis 2009) Scientific Commons : Driver (Digital Repository Infrastructure Vision for European Research) : Base (Bielefeld Academic Search Engine) : Évaluer une Archive Ouverte Ranking repositories :

36 4.2 outils / Archives ouvertes Moissonneurs OAI
L’OAI-PMH (Open Archives Initiative-Protocol for Metadata Harvesting) : protocole visant à favoriser l’échange de données entre bases hétérogènes partage des métadonnées Entrepôts OAI : Fournissent les données Archives ouvertes, bibliothèques numériques, portails de revues… Agrégateurs OAI : Collectent les données par un « moissonneur »

37 4.2 outils / Archives ouvertes Moissonneurs OAI : schéma de fonctionnement
Source : François Nawrocki

38 4.2 outils / Archives ouvertes Moissonneurs OAI
L’exemple de Scientific Commons, de Base Michael : Moissonneur OAI européen Accès aux collections numériques : culture, arts, patrimoine

39 4.3 Accès aux Revues électroniques en libre accès
Annuaires : Ex du DOAJ, Directory of Open Access Journals Plateformes : Revues.org Persée Erudit

40 4.4. Accès aux bibliothèques numériques
Europeana Gallica Google Book Search Hathi Trust

41 5. Outils pour la veille Veille : au sens large, activité de surveillance de l’environnement et de ses évolutions, dans un domaine donné Importance pour le chercheur : Se tenir informé des nouveautés dans son domaine Suivre l’actualité d’un site, d’une source, d’un auteur… Nombreux outils existants : Métamoteurs, outils professionnels Syndication de contenus

42 5. Outils pour la veille 5.1 Le système d’alerte
L’exemple des alertes Google Compte Google Termes sur lesquels portera la veille Choix du type : actualités / blogs / web / groupes / tout Fréquence de la surveillance Nombre de résultats Multiplication des systèmes d’alerte sur différentes plateformes

43 5. Outils pour la veille : 5.2 la syndication de contenus
Définition : Agrégation de contenus divers sur un même navigateur possibilité de publier automatiquement sur un site web des informations issues d‘autres sites web Outils : Agrégateur de fils RSS : en lecture Editeur de fils RSS : pour l’édition Format RSS = Rich Site Summary, ou Really Simple Syndication Très nombreuses applications, liens avec les blogs Explosion du phénomène du RSS : blogs, sources d’actualités, portails de revues, sites web ... Un ex. De syndication de tables des matières de revues avec TiCToCs Voir billet sur

44 Les fils RSS RSS (Really Simple Syndication = syndication vraiment simple) Moyen de syndication, capable de récupérer le contenu brut d'un site web sans s'occuper des données liées à sa forme On parle de Flux RSS, Fil RSS, liens RSS, RSS feed, canaux RSS Source : Bibliobsession 44

45 5. Outils pour la veille : syndication de contenus
Plusieurs fonctions des fils RSS : Suivre l’actualité d’un site : réception de toutes les nouveautés Se tenir informé : Sur l’actualité : tous les journaux proposent des fils RSS Presse : ex. de Libération Sur un domaine : suivi de blogs et de sites spécialisés ex. de Urfistinfo Outil de veille et de surveillance, technique du push

46 5. Outils pour la veille : syndication de contenus / « pages perso »
Pages personnalisables : Fourniture gratuite de pages web, personnalisables pour la gestion et la recherche d’information Choix personnel des sources : sites web, blogs, fils RSS… Divers services : calendrier, agenda… Exemple de Netvibes Le portail Netvibes de l’URFIST de Rennes

47 6. Les plates-formes de partage 6.1 Signets / Réferences
Le principe de la folksonomie : Forme de « classification collaborative décentralisée spontanée », s’appuyant sur les termes choisis par les utilisateurs Objectif : faciliter l’indexation des contenus et la recherche d’information Tags peuvent s’appliquer à des signets web, à des photos, à des projets, des vidéos, ou encore des billets de blogs (nuages de tags) Constitution d’une communauté de « spécialistes » parmi les internautes

48 6. Les plates-formes de partage 6.1 Signets / Références
Intérêt pour la recherche : Recherche parmi les sources jugées pertinentes par une groupe d’utilisateurs Identifier des leaders de veille Juger de la popularité d’une source (combien de fois a-t-elle été mise en signets)

49 6. Les plates-formes de partage 6.1 Signets / Références
Exemples de plate-formes de partage de signets Généralistes : Delicious Scientifiques : Connotea, CiteUlike Recherche sur le titre des signets de tous les autres utilisateurs et sur leurs tags Problème : logiques de classement et d’indexation différentes selon les internautes Solution partielle sur Del.icio.us : description des tags

50 6. Les plates-formes de partage 6.1 Signets / Références
delicious : La plus ancienne Créée en 2004 par Joshua Schachter, revendue à Yahoo en 2005 partage de signets tous publics Création de réseaux Connotea : Partage de signets dans le monde académique Lancé par revue Nature pour l’établissement de favoris, extraction automatique des références bibliographiques issus de sites tels que Nature, Science, PubMed

51 6. Les plates-formes de partage 6.2 documents
Documents de recherche Open Notebook Science Les images : Flickr : racheté par Yahoo! en 2OO5 Plus grande base de données de photos Mise en ligne de collections photographiques de bibliothèques : Cf la collection de la Library of Congress Les vidéos YouTube, DailyMotion Les diaporamas SlideShare partage et récupération de présentations powerpoint + quelques formats alternatifs

52 7. Les réseaux sociaux Réseaux sociaux généralistes
Facebook Twitter, outil de réseau social et de microblogging Réseaux sociaux scientifiques SciLink

53 8. Ressources pour aller plus loin
FORMIST REPERE SAPRISTI SISTEM CALIS DEFIST MethoDoc (Univ. De Gembloux) InfoSpheres (en SHS) AERIS (en sciences) URFIST de Rennes : Supports de formation sur la recherche d’information Sélection de ressources sur les outils de recherche URFIST de Lyon : Ressources pédagogiques URFIST de Paris : Guides et tutoriels


Télécharger ppt "Module 1, TD 2 : Outils de recherche du web Session ALL"

Présentations similaires


Annonces Google