Les Outils de Recherche du Web Gabriel Gallezot Université de Nice Sophia Antipolis URFIST
Imaginez la situation suivante : Vous êtes actuellement chercheur dans un labo. En vue de la réalisation d'un prochain projet, le patron du labo vous demande : 1. De produire une bibliographie sur de le thème de la anthropocene 2. De lui fournir sur la base de la bibliographie réalisée une dizaine de documents significatifs afin de mieux cerner ce thème. 3. De surveiller un certain nombre de sites sur ce même thème. 4. De lui proposer un moyen simple de partager des références (liens sur textes ou sites) avec les autres membres du projet de recherche qui travaillent sur d'autres thèmes connexes. Intro Pull Push
Plan 1.Introduction générale à la recherche dinformation 2.Outils de recherche sur le web 3.Mon environnement de travail 4.Methode Push (cf. stage veille)
1 Introduction générale à la recherche dinformation
Base Bibliographiques Banques de données Revues, ouvrages Colloques Site web, page perso, blog Liste de discussion Editeurs, agrégateurs Archives Ouvertes Bibliothèques Accès aux documents … Usage de linformation Ressources Typologie de linfo Vue usagers de linfo
Source : La RI en contexte - différentes sources - différents outils - différents contextes Appréhension de linfo
Matching : correspondance des mots-clés dune requête avec les mots-clés représentant « le(s) document(s) résultat » (système documentaire). Watching : une « vue » des résultats introduite par une organisation spécifique (ex. page rank, clusterisation, recommandation, etc) (monde des moteurs) et classements affinitaires personnalisés (monde des réseaux sociaux) >>>>> métriques d'autorités, métriques d'affinités >>>>> Met aussi en avant lappropriation des outils de recherche : le choix de loutil + son usage
Dans la pratique Gwizdka, Jacek « Distribution of cognitive load in Web search ». Journal of the American Society for Information Science and Technology 61(11):
Appropriation des outils The Machine is Us/ing Ushttp://youtu.be/NLlGopyXT_ghttp://youtu.be/NLlGopyXT_g Introducing the book Un producto revolucionariohttp://youtu.be/K9Ve rawwV_khttp://youtu.be/K9Ve rawwV_k Ajoutée par ZrednaZ le 21 févr Sous-titre FR : Ajoutée par devaudp le 13 mai 2007 Ajoutée par mwesch le 8 mars 2007 "Web 2.0" in just under 5 minutes. Ajoutée par leerestademoda le 16 mars 2010
Où chercher ? Web visible et Web 2.0 (web surfacique) Web invisible (web profond) P2P Contenu indexable, contenu taggé bases de données spécialisées Contenu dynamique Index partiel des sites Interdiction dindexation Information contenue sur les ordinateurs individuels plusieurs millions dordinateurs inter-connectés Milliards de Pages web ? Forum de discussion À partir de source : Eric Boutin
Les opérateurs (les booléens et les autres) ORANDAND NOT Formadoct : ( ) link:site: as_qdr=d15 filetype: allinurl: mais surtout de plus en plus dinterfaces à comprendre, à appréhender, à suivre,... Exemple avec Google => Fonctionnalités :
La Galaxie Google -Google Trends (comparaison de termes, de sites) : Ex : -Google Alert : -Google Custom Search : Google Knwoledge Graph (interface en anglais) : not.html not.html
2 Les outils de recherche sur le Web
Le Web chercher des références et les textes associés Le « monde de Bibliothèques » (cat. et BN) Les Dictionnaires et les encyclopédies (Dico & Co) Les Archive Ouvertes et Revues en ligne (AO & Co) Les outils du « web2.0 » Les Moteurs et Annuaires Les outils « embarqués » (extensions navigateur) « son » moteur La méthode Push (cf stage veille, selon déroulement du stage) Voir la liste : whitepapers.virtualprivatelibrary.net/Scholar.pdf
Le « monde des bibliothèques » Catalogues Dédié aux thèses : Worldcat JournalTOC : Ne pas oublier Amazon, chapitre.com, decitre.. Bibliothèques Numérique Gallica : Europeana : Hathi trust : Wikisource : Le projet Gutenberg (ebook): Internet Archive (le web) : Google book : Liste des Bibliothèques numériques : et
Dico & Co Wikipedia : Scholarpedia : CNRTL : Centre National de Ressources Textuelles et (Morphologies, Lexicographie, Etymologie, Synonymie, Antonymie, Proxémie, Concordance) Dicorama :
OA & Co HAL : OpenAire : Dart : PMC : BMC : Revues.org : Plos one : Persee : Numdam : OAIster (cf. Worldcat) : Base : ISIDORE : OpenDOAR : Scientific commons DOAJ :
Le web2.0 Recherche « verticale » Signets : Diigo : PearlTrees : Ref biblio : CiteUlike LibraryThing : Mendeley … Illustrations : Flickr youtube … : Présentations : PPT :
Les outils de recherche du web (quelques exemples) Moteurs « academics » Google scholar : Scirus : Microsoft academic Search ScienceResearch.com : FreefullPDF : CiteSeer : ChemBiofinder : JURN LARA : Cf aussi dia AO & co « Clustering » Exalead Cluuz : Eyeplorer :
Les outils de recherche du web (quelques exemples - suite) MétaMoteurs Ixquick Clusty : ALL+ : Interfaçage. biblimed : SearchCube : Oamos : Moteurs de médias Vidéos : Images : « Verticaux » selon plateforme Choix du « vertical » : ou Selon les droits associés : Divers. à partir d'une image : searchtwitter Wayback machine Voxalead : Lecdi : Autres Moteurs :
Exercices 1.Je dois me déplacer à l'université de Nice, indiquez-moi la(es) références bibliographique(s) des ouvrages de Bruno latour, (postérieur à 2010) que je pourrai consulter sur place. 2.Je souhaite me procurer l'article : Agnihotri, R. & al., « Stable carbon and nitrogen isotopic composition of bulk aerosols over India and northern Indian Ocean », Atmospheric Environment, vol.45(17); 2011; Conseillez moi ! 3.Sur Google, Je cherche des documents en pdf qui comportent le mot-clé « énergie » sur le site du « ministère de l'environnement ».(rédigez la requête) 4.Sur Google, comment trouver des documents qui comportent le mot clés «biodiversité marine» qui datent d'après le 1 janvier 2011 sur le site de l'univeristé de nouvelle calédonie 5.Je cherche des images libre de droits pour illustrer mon cours sur « Bacillus subtilis » 6.Je cherche des images similaires à Quelle est la référence bibliographique originale du document comportant l'extrait suivant : […] Since estuaries are low diversity ecosystems characterized by the accumulation of organic matter, the detection of anthropogenic stress can be more difficult […]
1. je souhaite lire l'ouvrage « l'origine des espèces » de C. Darwin comment faire ? Conseillez-moi. 2. Je souhaite être averti par mail des nouvelles publications de la revue dont l'ISSN est : ? Conseillez-moi. 3. Quel est le titre de louvrage dont lisbn est : Je cherche le document dont le titre est : Préparation et stabilisation de systèmes quantiques. Conseillez-moi. 5.Je veux lire la totalité de l'ouvrage dont le titre est « The Pacific Northwest Research Station's biodiversity initiative [...] ». Conseillez-moi. Exercices (suite)
Outils embarqués : des extensions FireFox Tous les outils dans un menu déroulant -Add to search : Ajout de fonctionnalité sur certain outils de recherche. search Cloudlet : … Sur mesure : créer son moteur de recherche (ex : LeMien)LeMien sur google custom search (ex co-op), équivalent de lopérateur site: multiplié à souhait :
Vos questions ?