Méthodologie de la recherche documentaire Gabriel Gallezot Université de Nice Sophia Antipolis URFIST
Imaginez la situation suivante : Intro Imaginez la situation suivante : Vous êtes actuellement stagiaire dans un organisme . En vue de la réalisation d'un prochain projet, le responsable vous demande : De produire une bibliographie sur de le thème de la anthropocene De lui fournir sur la base de la bibliographie réalisée une dizaine de documents significatifs afin de mieux cerner ce thème. De surveiller un certain nombre de sites sur ce même thème. De lui proposer un moyen simple de partager des références (liens sur textes ou sites) avec les autres membres du projet de recherche qui travaillent sur d'autres thèmes connexes. Pull Push
Processus documentaire Lié à la recherche Chercher des références Chercher des documents [ Lire ] Mettre en place une veille documentaire [ Travail de recherche ] Gérer ses références et ses documents (ce dernier point est en réalité transversal aux autres)
Un processus à décomposer En terme méthodologique En terme de ressources à connaître En terme d’outils à maîtriser
(A) A1) Vous chercher un sujet Votre thématique scientifique est une première orientation La lecture des conclusions de mémoires, de Thèses et d’HDR devrait vous donner quelques pistes. [où trouver les thèses et autre littérature grise ?] A cette étape rédiger une ébauche de sujet et passer à l’étape suivante A2) Vous avez un sujet « décomposez » votre sujet en relevant les mots-clés, puis « creusez » chacun de ces mots en concepts ou thématiques associés. Cet exercice d’association d’idées [forme hypertextuelle de la pensée, d’autres exercices ?] permet de dresser les axes et l’environnement de votre recherche d’information, de reformuler l’ébauche de sujet de l’étape A1) A l’aide des concepts trouvés vous pouvez maintenant rechercher de l’information. N’oubliez pas de traduire ces termes en anglais (ou d’autres langues) pour une recherche plus exhaustive [ dico, thésaurus, traducteur auto ? ].
(B) Où trouver de l’information. L’information se trouve dans les documents [Cf cycle IST et flux IST]. Il s’agit donc de trouver des documents [typologie(s) des doc] qui contiennent des informations correspondantes aux concepts et thèmes dégager en « A». Pour obtenir des documents vous devez trouver leurs références [indexation, référencement] ; - parmi les références d’un autre document (bibliographie) [nécessite déjà le full text : revues en ligne, BU, ...] - catalogue des bibliothèques, des librairies, banque bibliographique, current - sur internet (moteur de recherche, annuaires, signets, archive ouverte, liste de diff…) Pour trouver ces références vous devrez certainement effectuer une équation de recherche avec des opérateurs booléens. [opérateurs, équations] Avec vos références vous pouvez obtenir le document : - En bibliothèque (lieu) [classification, prêt] , sur abonnement des BU) banque full text) [doc électronique] - Sur le web [pages web perso/institutionnelles, serveur de préprint, revues en libre accès, ...]
( C ) et (D) C) A la lecture des documents : - Re-formulation du sujet (cf. étape A1) - Précision de la problématique, des hypothèses de recherche D) La veille Comment mettre en place un veille documentaire ? [Alerte, RSS, réseaux sociaux, ...]
(E) et (F) Travail de recherche : [cf cycle IST et flux IST] - Etude de terrain, expérimentation, synthèse d’ouvrage - Détermination de résultats - Diffusion des résultats Gérer ses références Comment gérer ses références ? (Url et biblio) [ logiciel de gestion de références bibliographiques >> cf. Module TIC avec Zotero]
1 Le cycle de vie de l'information, et RI
L’objectif, pour l’IR, c’est de repérer et de ramener des infos pertinentes. Pour l’épistémé c’est de découvrir, de produire de nouvelles connaissances. Appréhender la complexité d’un phénomène nécessite le repérage et la gestion d’un corpus de documents pertinent et volumineux pour extraire des informations et ensuite les transformer en nouvelles connaissances. utilisation d’un binôme indissociable d’outils et de méthodes (technologies intellectuelles)
Le cycle de l‘IST (description) Le « bouclage » d'un cycle induit la contruction de connaissances, d'informations et de documents La collecte peut être réalisée à partir de banques de données , de sites web, d’expériences dans les laboratoires, de “butinage” (browsing) dans les rayonnages, d’une bibliothèque... Le traitement correspond à l’activité cognitive des chercheurs ou à des manipulations par des outils informatiques La diffusion est définie comme l’ensemble des opérations nécessaires à la propagation des connaissances
… Vue usagers de l’info Resssources Usage de l’information Base Bibliographiques Banques de données Revues, ouvrages Colloques Site web, page perso, blog Liste de discussion Editeurs, agrégateurs Archives Ouvertes Bibliothèques Vue usagers de l’info … Resssources Usage de l’information Typologie de l’info Accès aux documents Réprésentations
Appréhension de l’info La RI en contexte - différentes sources - différents outils - différents contextes Source : Info@vis
Matching : correspondance des mots-clés d’une requête avec les mots-clés représentant « le(s) document(s) résultat » (système documentaire). Watching : une « vue » des résultats introduite par une organisation spécifique (ex. page rank, clusterisation, etc) (monde des moteurs) >>>>> Nécessité d’interroger le rapport entre la (re)quête d’un individu et la (re)présentation d’une connaissance >>>>> Met aussi en avant l’appropriation des outils de recherche : le choix de l’outil + son usage
Information-seeking Process (Marchionini, 1995) The information-seeking process is both systematic and opportunistic. The degree to which a search exhibits algorithms, heuristics, and serendipity depends on the strategic decisions that the information seeker makes and how the information-seeking factors interact as the search progresses.
Actions parallèles pour la recherche d’information (Marchionini, 1995) l’énonciation du problème le choix de la source d’information l’extraction de l’information l’examen des résultats « Les systèmes hautement interactifs de recherche et les bases de données en texte intégral ont commencé à brouiller les frontières qui séparent les sous-processus et ont tendance à diminuer la linéarité de leur progression. » (trad.)
Appropriation des outils Introducing the book The Machine is Us/ing Us
La Recherche d’Information Bien appréhender votre question (mind mapping) - Bien appréhender ce que vous cherchez et où vous le cherchez (connaître les types de doc, d’info et les ressources) - Comprendre l’envers du “décor” (indexation, aspects commerciaux, stratégie des différents outils, …) Bien gérer ses requêtes (fonctionnalités des outils et méthodes) - S’interroger sur la validiter de l’info (paratexte, contenu, …)
Types de documents > Def du document ? Articles scientifiques Brevets Documents numérisés Thèses et HDR Rapports et études Cours Données primaires et adjuvants à la recherche Ouvrages Notices bibliographiques Documents multimédias (audio, vidéo, ..) … > Def du document ? > Notion d’unité documentaire ?
Quelques questions Quels documents sont d'intérêt pour moi (ma question) ? Est-ce que d'autres documents assez proches de mon intérêt peuvent être également considérés ? Les titres d'autres documents pourraient-ils déclencher des idées valables pour ma recherche d'information ? Comment mes mots-clés sont-ils réellement distribués dans un des document ? .... Trois notions à considérer : Relevance (correspondance a ma question) Pertinence (ce qui m'intéresse vraiment !) Serendipity (quelle chose que je ne recherchais pas mais qui pourrait également m'intéresser)
Aiguille(s) et botte(s) de foin Chercher une aiguille dans une botte de foin c’est : trouver une aiguille connue dans une botte de foin connue trouver une aiguille connue dans une botte de foin inconnue trouver une aiguille inconnue dans une botte de foin inconnue trouver n'importe quelle aiguille dans une botte de foin trouver […] [Koll, 00] Aiguille(s) et botte(s) de foin => 3 façons de recherche l’information « chercher de l'information sur un objet bien défini ; chercher de l'information sur un objet incomplètement décrit mais qui sera reconnaissable dès qu'un le rencontrera ; trouver de l'information de manière fortuite. » (Toms)
Où chercher ? P2P Web invisible Web visible et Web 2.0 (web profond) Information contenue sur les ordinateurs individuels plusieurs millions d’ordinateurs inter-connectés P2P bases de données spécialisées Contenu dynamique Index partiel des sites Interdiction d’indexation Web invisible (web profond) Web visible et Web 2.0 (web surfacique) + 1000 Milliards de Pages web ? Forum de discussion Contenu indexable, contenu taggé À partir de source : Eric Boutin
La notion d’indexation (une notion transversale et centrale) Indexer/classer pour retrouver (mots clés/répertoire, …) Les métadonnées (entête) La structuration du document (corps) Classification : Index Thésaurus Taxonomie Facette Ontologie
Les opérateurs (les booléens et les autres) OR AND AND NOT ( ) GIRI : http://www.bibliotheques.uqam.ca/GIRI/mod3/booleen.htm link: site: filetype: allinurl: as_qdr=d15 Fonctionnalités : http://www.google.fr/intl/fr/help/features.html mais surtout de plus en plus d’interfaces à comprendre, à appréhender, à suivre, ... Exemple avec Google => + google dashboard
La Galaxie Google Les options de recherche (temps réel, roue magique, timeline, recherches associées, ...) Google Trends (comparaison de termes, de sites) : http://trends.google.com Google Insight ( tendances de recherches : termes catégories, ...) : http://www.google.com/insights/search/ Google Alerte : http://www.google.com/alerts Google Custom Search : http://www.google.fr/cse/ ... http://www.google.fr/intl/fr/options/
Exercices Faire un « conceptogramme » (mindmap) sur un sujet de votre choix Rédiger une dizaine d’équations de recherche en précisant à chaque étape les résultats obtenus (quantité de documents trouvés) sur un outil de votre choix (ex google ;-))
2 Les outils de recherche En Bibliothèque (ex de l’UNS) Sur le Web
Ressources en BU
Les catalogues (chercher des références) à la BU Nice : http://catalogue.unice.fr/ Le Sudoc, une fédération de catalogues nationaux : http://www.sudoc.abes.fr Worldcat, une fédération de catalogues internationaux : http://www.worldcat.org/
Les abonnements de la BU Voir sur l’ENT de l’Uns , onglet “bibliothèque” AtoZ : revues scientifiques (revues en ligne) Les bases de données (Factiva et autres bases en SHS) Encyclopaedia Universalis Livres numériques
Exercice avec les outils de la bibliothèque je cherche si l'ouvrage : Boillot-Grenon, Francine- Voyages en littoral : les salins d'Hyères, l'île de Porquerolles, l'île de Port-Cros, le cap Lardier - 2003 …. Est-il disponible dans une BU de l'univ de Nice...comment faire ? Dans quelle(s) autre(s) BU en France l'ouvrage est-il disponible ? ... comment faire ? je souhaite lire l'ouvrage « Changer de société. Refaire de la sociologie, de Bruno Latour ? » comment faire ? Conseillez-moi.
je cherche à savoir ce qu'est le "Dreaming" pour les Aborigènes d’Australie ... comment faire ? je cherche un article du Courrier International intitulé : Le livre à l'ère du numérique; Attention, le livre électronique décolle !... (13 avril 2008) comment faire ? savez-vous si je peux consulter les articles (full-text) des revues "Journal of the American Society for Information Science and Technology" ? et "Journal of Documentation »
Ressources sur le web Exemples d’outils (panorama sur le web) http://delicious.com/Gallezot_Urfist/Rweb-Dec
Le Web chercher des références et les textes associés Le « monde de Bibliothèques » (cat. et BN) Les Dictionnaires et les encyclopédies (Dico & Co) Les Archive Ouvertes et Revues en ligne (AO & Co) Les outils du « web2.0 » Les Moteurs et Annuaires Les outils « embarqués » (extensions navigateur) « son » moteur La méthode Push (la veille) (selon déroulement du stage)
Le « monde des bibliothèques » Catalogues Sudoc http://www.sudoc.abes.fr/ Worldcat http://worldcat.org/ Ne pas oublier Amazon, chapitre.com, decitre... Bibliothèques Numériques Gallica : http://gallica.bnf.fr/ Europeana : http://www.europeana.eu/portal/ Wikisource : http://fr.wikisource.org/wiki/Wikisource:Accueil . Google book : http://books.google.com/ Le projet Gutenberg (ebook): http://www.gutenberg.org/wiki/Main_Page Internet Archive (le web) : http://www.archive.org/ Liste des Bibliothèques numériques : http://www.science.gouv.fr/fr/bibliotheques-numeriques/ et http://signets.bnf.fr/html/categories/c_011textes_num.html
Dico & Co Wikipedia : http://fr.wikipedia.org/wiki/Accueil Scholarpedia : http://www.scholarpedia.org/ Les dictionnaires : http://www.dictionnaire-mediadico.com/ http://www.les-dictionnaires.com/ TermScience (lexiques, dictionnaires, thesaurus) : http://www.termsciences.fr CNRTL : Centre National de Ressources Textuelles et (Morphologies, Lexicographie, Etymologie, Synonymie, Antonymie, Proxémie, Concordance) http://www.cnrtl.fr/lexicographie/
OA & Co HAL : http://hal.archives-ouvertes.fr/ Revues.org : http://www.revues.org/ Persee : http://www.persee.fr/web/guest/home/ OAIster (cf. Worldcat) : http://oaister.worldcat.org/ OpenDOAR : http://www.opendoar.org/ Scientific commons http://www.scientificcommons.org/ DOAJ : http://www.doaj.org/
Le web2.0 Recherche « verticale » Signets : Del.ici.ous http://delicious.com, digg http://www.digg.com/ , PearlTrees http://www.pearltrees.com, ... : Ref biblio : CiteUlike http://www.citeulike.org/ , Bibsonomy http://www.bibsonomy.org/ , Connotea : http://www.connotea.org/, LibraryThing : http://www.librarything.com, Zotero http://www.zotero.org/ … Illustrations : Flickr http://www.flickr.com/ , youtube http://www.youtube.com/ , … : Présentations : PPT : http://www.slideshare.net
Les outils de recherche du web (quelques exemples) Moteurs « academics » Google scholar : http://scholar.google.com Scirus : http://www.scirus.com Scitopia : http://www.scitopia.org/scitopia/ Esp@cenet : http://www.espacenet.com Google patent : http://www.google.com/patents Cf aussi dia AO & co « Clustering » Exalead http://www.exalead.fr Cluuz : http://www.cluuz.com Eyeplorer : http://eyeplorer.com
Les outils de recherche du web (quelques exemples - suite) MétaMoteurs Ixquick http://www.eu.ixquick.com/fra/ Clusty : http://clusty.com/ ALL+ : http://www.allplus.com Interfaçage Viewzi : http://www.viewzi.com/ Oamos : http://www.oamos.com/ SearchCube : http://search-cube.com/ Moteurs de médias Vidéos : http://www.blinkx.com/ Images : http://www.picsearch.com/
« Verticaux » selon plateforme Choix du « vertical » : http://socialmention.com/ Selon les droits associés : http://search.creativecommons.org/ Divers searchtwitter http://search.twitter.com/ Wayback machine http://www.archive.org/ Voxalead : http://voxaleadnews.labs.exalead.com/ Lecdi : http://www.lecdi.net/ Annuaire Open directory project http://www.dmoz.org/ Intute : http://www.intute.ac.uk/resources.html Calames : http://calame.ish-lyon.cnrs.fr/ Autres Moteurs : http://en.wikipedia.org/wiki/List_of_search_engines http://www.altsearchengines.com/ Comprendre la relation entre les moteurs : http://www.search-this.com/search-engine-decoder/
Exercices je cherche si l'ouvrage : « La biosphère de l'anthropocène »…. Est disponible dans ma BU...comment faire ? je souhaite lire l'ouvrage « The Origin of Species » comment faire ? Conseillez-moi. Je souhaite lire l’article «Serendipity and information seeking: an empirical study » (2003), de A Foster, N Ford, comment faire ? Je souhaite trouver des informations datées du 11 sept 2001 sur les Twin towers ? Je cherche des illustrations libre de droit, comment faire Je souhaite rechercher ce qui se dit sur « la serendipity et la science » dans les blogs, comment faire ? Je souhaite connaître ce que « se dit » en ce moment sur le sujet « google », comment faire ? Je souhaite être averti de ce qui se dit sur moi sur le web, comment faire ? Quel est le titre de l’ouvrage dont l’isbn est : 9782915825053 ...
Outils embarqués : des extensions FireFox Tous les outils dans un menu déroulant Add to search : https://addons.mozilla.org/en-US/firefox/addon/3682 Ajout de fonctionnalité sur certain outils de recherche. search Cloudlet : http://getcloudlet.com/ … “Sur mesure” : créer son moteur de recherche (ex : LeMien) sur google custom search (ex co-op) , équivalent de l’opérateur site: multiplié à souhait : http://www.google.com/coop/cse/
Methode Push (la veille)
Veille et alerte Update scanner https://addons.mozilla.org/fr/firefox/addon/3 362 Google Alert : http://www.google.fr/alerts … 45
RSS Contexte (cms…) Pourquoi faire ? Outils (local, en ligne) En pratiques (OPML, …) Voir vidéo : http://www.youtube.com/watch?v=240u_FoIHc8 46
Adhérer/Créer un réseau de veilleurs (cf : http://wiki-urfist. unice Liste de discussion / les « groups » Chat et Instant messager Annuaires pro (linkedIn, viadéo, ...) Un blog Un wiki Twitter Zotero ... Pensez « interfaçage ». 1 opération : alimentation de 4 plateformes Delicous + twitter + groups + facebook 47
Mashup Pour faire quoi ? Quels outils Diffusion ? Xfruits : http://www.xfruits.com/?lg=fr yahooPipe : http://pipes.yahoo.com/pipes/ … Diffusion ? 48
Vos questions ?