Les Outils de Recherche du Web Gabriel Gallezot Université de Nice Sophia Antipolis URFIST
Imaginez la situation suivante : Vous êtes actuellement stagiaire dans un organisme. En vue de la réalisation d'un prochain projet, le responsable vous demande : De produire une bibliographie sur de le thème de la anthropocene De lui fournir sur la base de la bibliographie réalisée une dizaine de documents significatifs afin de mieux cerner ce thème. De surveiller un certain nombre de sites sur ce même thème. De lui proposer un moyen simple de partager des références (liens sur textes ou sites) avec les autres membres du projet de recherche qui travaillent sur d'autres thèmes connexes. Intro Pull Push
Plan Introduction générale à la recherche dinformation Outils de recherche sur le web Mon environnement de travail Methode Push (la veille) > déroulement du stage
1 Introduction générale à la recherche dinformation
Base Bibliographiques Banques de données Revues, ouvrages Colloques Site web, page perso, blog Liste de discussion Editeurs, agrégateurs Archives Ouvertes Bibliothèques Accès aux documents … Usage de linformation Resssources Typologie de linfo Vue usagers de linfo Réprésentations
Source : La RI en contexte - différentes sources - différents outils - différents contextes Appréhension de linfo
Matching : correspondance des mots-clés dune requête avec les mots-clés représentant « le(s) document(s) résultat » (système documentaire). Watching : une « vue » des résultats introduite par une organisation spécifique (ex. page rank, clusterisation, etc) (monde des moteurs) >>>>> Nécessité dinterroger le rapport entre la (re)quête dun individu et la (re)présentation dune connaissance >>>>> Met aussi en avant lappropriation des outils de recherche : le choix de loutil + son usage
Information-seeking Process (Marchionini, 1995) The information-seeking process is both systematic and opportunistic. The degree to which a search exhibits algorithms, heuristics, and serendipity depends on the strategic decisions that the information seeker makes and how the information-seeking factors interact as the search progresses.
Actions parallèles pour la recherche dinformation (Marchionini, 1995) « Les systèmes hautement interactifs de recherche et les bases de données en texte intégral ont commencé à brouiller les frontières qui séparent les sous-processus et ont tendance à diminuer la linéarité de leur progression. » (trad.) lénonciation du problème le choix de la source dinformation lextraction de linformation lexamen des résultats
Appropriation des outils The Machine is Us/ing UsIntroducing the book
Où chercher ? Web visible et Web 2.0 (web surfacique) Web invisible (web profond) P2P Contenu indexable, contenu taggé bases de données spécialisées Contenu dynamique Index partiel des sites Interdiction dindexation Information contenue sur les ordinateurs individuels plusieurs millions dordinateurs inter-connectés Milliards de Pages web ? Forum de discussion À partir de source : Eric Boutin
Les opérateurs (les booléens et les autres) ORANDAND NOT GIRI : ( ) link:site: as_qdr=d15 filetype: allinurl: mais surtout de plus en plus dinterfaces à comprendre, à appréhender, à suivre,... Exemple avec Google => + google dashboard Fonctionnalités :
La Galaxie Google -Les options de recherche (temps réel, roue magique, timeline, recherches associées,...) -Google Trends (comparaison de termes, de sites) : -Google Insight ( tendances de recherches : termes catégories,...) : -Google Alerte : -Google Custom Search :
2 Les outils de recherche sur le Web
Le Web chercher des références et les textes associés Le « monde de Bibliothèques » (cat. et BN) Les Dictionnaires et les encyclopédies (Dico & Co) Les Archive Ouvertes et Revues en ligne (AO & Co) Les outils du « web2.0 » Les Moteurs et Annuaires Les outils « embarqués » (extensions navigateur) « son » moteur La méthode Push (la veille) (selon déroulement du stage)
Le « monde des bibliothèques » Catalogues Sudoc Worldcat Ne pas oublier Amazon, chapitre.com, decitre.. Bibliothèques Numérique Gallica : Europeana : Wikisource : Google book : Le projet Gutenberg (ebook): Internet Archive (le web) : Liste des Bibliothèques numériques : et
Dico & Co Wikipedia : Scholarpedia : Les dictionnaires : TermScience (lexiques, dictionnaires, thesaurus) : CNRTL : Centre National de Ressources Textuelles et (Morphologies, Lexicographie, Etymologie, Synonymie, Antonymie, Proxémie, Concordance)
OA & Co HAL : Revues.org : Persee : OAIster (cf. Worldcat) : OpenDOAR : Scientific commons DOAJ :
Le web2.0 Recherche « verticale » Signets : Del.ici.ous digg PearlTrees : Ref biblio : CiteUlike Bibsonomy Connotea : LibraryThing : Zotero … Illustrations : Flickr youtube … : Présentations : PPT :
Les outils de recherche du web (quelques exemples) Moteurs « academics » Google scholar : Scirus : Scitopia : : Google patent : Cf aussi dia AO & co « Clustering » Exalead Cluuz : Eyeplorer :
Les outils de recherche du web (quelques exemples - suite) MétaMoteurs Ixquick Clusty : ALL+ : Interfaçage Viewzi : Yebol : SearchCube : Moteurs de médias Vidéos : Images :
« Verticaux » selon plateforme Choix du « vertical » : Selon les droits associés : Divers searchtwitter Wayback machine Voxalead : Lecdi : Annuaire Open directory project Intute : Autres Moteurs : Comprendre la relation entre les moteurs :
Exercices je cherche si l'ouvrage : « La biosphère de l'anthropocène » …. Est disponible dans ma BU...comment faire ? je souhaite lire l'ouvrage « The Origin of Species » comment faire ? Conseillez-moi. Je souhaite lire larticle «Serendipity and information seeking: an empirical study » (2003), de A Foster, N Ford, comment faire ? Je souhaite trouver des informations datées du 11 sept 2001 sur les Twin towers ? Je cherche des illustrations libre de droit, comment faire Je souhaite rechercher ce qui se dit sur « la serendipity et la science » dans les blogs, comment faire ? Je souhaite connaître ce que « se dit » en ce moment sur le sujet « google », comment faire ? Je souhaite être averti de ce qui se dit sur moi sur le web, comment faire ? Quel est le titre de louvrage dont lisbn est :
Outils embarqués : des extensions FireFox Tous les outils dans un menu déroulant Add to search : Ajout de fonctionnalité sur certain outils de recherche. search Cloudlet : … Sur mesure : créer son moteur de recherche (ex : LeMien)LeMien sur google custom search (ex co-op), équivalent de lopérateur site: multiplié à souhait :
Methode Push (la veille)
Veille et alerte Update scanner Google Alert : …
RSS Contexte (cms…) Pourquoi faire ? Outils (local, en ligne) En pratiques (OPML, …) Voir vidéo :
Adhérer/Créer un réseau de veilleurs ( cf : Liste de discussion / les « groups » Chat et Instant messager Annuaires pro (linkedIn, viadéo,...) Un blog Un wiki Twitter Zotero... Pensez « interfaçage ». 1 opération : alimentation de 4 plateformes Delicous + twitter + groups + facebook
Mashup Pour faire quoi ? Quels outils –Xfruits : –yahooPipe : –… Diffusion ?
Vos questions ?