La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

1 La Recherche dInformation sur le Web De la documentation électronique de votre université aux outils du Web Gabriel Gallezot - Urfist Paca-c ED avril.

Présentations similaires


Présentation au sujet: "1 La Recherche dInformation sur le Web De la documentation électronique de votre université aux outils du Web Gabriel Gallezot - Urfist Paca-c ED avril."— Transcription de la présentation:

1 1 La Recherche dInformation sur le Web De la documentation électronique de votre université aux outils du Web Gabriel Gallezot - Urfist Paca-c ED avril 2008 Gallezot-at-unice.fr 29/11/07

2 2 Programme : Rappel sur la Recherche dInformation (RI) –contexte de la RI, Usage de linfo, Appropriation des outils –formulation des requêtes (des questions) –lIndexation : notion centrale Panorama et utilisation des outils de recherche du web –les bases de données –Dico & co –OA & co –Outils 2.0 –Moteurs –les répertoires

3 Le contexte de la Recherche d'Information Le contexte de la Recherche d'Information

4 Base Bibliographiques Banques de données Revues, ouvrages Colloques Site web, page perso, blog Liste de discussion Editeurs, agrégateurs Archives Ouvertes Bibliothèques Types de documents Formats de documents Accès aux documents … Usage de linformation Rechercher: IR/épistémè

5 Source : La RI en contexte - différentes sources - différents outils - différents contextes

6 6 Appropriation des outils The Machine is Us/ing UsIntroducing the book

7 La Recherche dInformation - Bien appréhender votre question - Bien appréhender ce que vous cherchez et où vous le cherchez - Comprendre lenvers du décor : lindexation - Bien gérer ses requêtes

8 Quelques questions Quels documents sont d'intérêt pour moi (ma question) ? Est-ce que d'autres documents assez proches de mon intérêt peuvent être également considérés ? Les titres d'autres documents pourraient-ils déclencher des idées valables pour ma recherche d'information ? Comment mes mots-clés sont-ils réellement distribués dans un des document ?.... Trois notions à considérer : Relevance (correspondance a ma question) Pertinence (ce qui m'intéresse vraiment) Serendipity (quelle chose que je ne recherchais pas mais qui pourrait également m'intéresser)

9 Chercher une aiguille dans une botte de foin cest : trouver une aiguille connue dans une botte de foin connue trouver une aiguille connue dans une botte de foin inconnue trouver une aiguille inconnue dans une botte de foin inconnue trouver n'importe quelle aiguille dans une botte de foin trouver […] [Koll, 00] Aiguille(s) et botte(s) de foin => 3 façons de recherche linformation « chercher de l'information sur un objet bien défini ; chercher de l'information sur un objet incomplètement décrit mais qui sera reconnaissable dès qu'un le rencontrera ; trouver de l'information de manière fortuite. » (Toms)

10 Où chercher ? Web visible et Web 2.0 Web invisible P2P Contenu indexable, contenu taggé bases de données spécialisées Contenu dynamique Index partiel des sites Interdiction dindexation Information contenue sur les ordinateurs individuels plusieurs millions dordinateurs inter-connectés 10 Milliards de Pages web Forum de discussion À partir de Source : Eric Boutin

11 La notion dindexation (une notion transversale et centrale) Indexer/classer pour retrouver (mots clés/répertoire, …) Les métadonnées (entête) La structuration du document (corps) Classification : –Index –Thésaurus –Taxonomie –Facette –Ontologie

12 Gestion du bruit et du silence Documents non relevants Documents relevants Corpus Bien gérer VOS REQUETES !

13 non relevants (bruit) relevants Documents retrouvés Documents non retrouvés Relevants (silence) non relevants Documents retrouvés Document non retrouvés Optimiser sa recherche d'information Bien gérer VOS REQUETES !

14 Les opérateurs booléens Exemple Ensemble A cours tutorial Ensemble B tutorial gratuit Ensemble C Payant Tutorial Cours gratuit tutorial payant Protection cours ou tutorial tutorial et gratuit cours sauf payant cours OR AND AND NOT Les booléens sur GIRI :

15 Les types de recherche La recherche lexicale (+morphologique) : la recherche d'un mot ou d'un groupe de mots, notamment par le biais de requêtes booléennes (et, ou, etc.). Une fonction à laquelle s'ajoutent des opérateurs d'adjacence et de proximité. Tous des moteurs proposent en général ce type de possibilités. La recherche syntaxique : elle permet de retrouver un terme quelle que soit sa déclinaison (plurielle, conjuguée, etc.), et d'étendre la recherche aux mots synonymes ou de même racine étymologique. Cette recherche offre également des modules de recherche floue ou de phonétisation. La recherche statistique : lorsque la recherche s'effectue sur les mots, une analyse statistique permet de calculer la pertinence de ces mots par rapport au référentiel documentaire. La recherche sémantique : l'opération s'effectue à partir d'une analyse du sens de la requête, c'est-à-dire en recherchant les mots sémantiquement proches de ceux qu'elle utilise. La recherche s'appuie alors sur un dictionnaire sémantique qui, à chaque mot de la langue, associe leurs différents sens. La combinaison des recherches sémantique, syntaxique, lexicale et statistique permet aux éditeurs de proposer des fonctions avancées : résumé de documents, classement et sélection optimisés des réponses, jusqu'aux assistants de requêtes (conçus pour permettre à l'utilisateur d'affiner sa demande en lui proposant des requêtes connexes ou enrichies)

16 Exemples doutils (panorama)

17 Les bases de données Worldcat : (catalogues Article Inist : (catalogues : Images : ou Sons : Lencyclopedie Sonore, sonore/main.php?daj=search_small&sid=&ref=CAE92LEG08 sonore/main.php?daj=search_small&sid=&ref=CAE92LEG08 Librairies en ligne (Amazon, chapitre.com, …)

18 Dico and Co Wikipedia : Les dictionnaires : mediadico.com/ dictionnaires.com/http://www.dictionnaire- mediadico.com/http://www.les- dictionnaires.com/ TermScience (lexiques, dictionnaires, thesaurus) : CNRTL : Centre National de Ressources Textuelles et (Morphologies, Lexicographie, Etymologie, Synonymie, Antonymie, Proxémie, Concordance)

19 OA & Co HAL : Revues.org : OAIster :

20 20 Outils du web2.0 (fonction recherche uniquement) Signets : Del.ici.ous (http://del.icio.us/ ), digg (http://www.digg.com/ ), … :http://del.icio.us/http://www.digg.com/ Ref biblio : CiteUlike (http://www.citeulike.org/ ), Bibsonomy (http://www.bibsonomy.org/ ), … :http://www.citeulike.org/http://www.bibsonomy.org/ illustrations : Flickr (http://www.flickr.com/ ), youtube (http://www.youtube.com/ ), … :http://www.flickr.com/http://www.youtube.com/ Présentations (PPT : )http://www.slideshare.net

21 21 Les outils de recherche du web (moteurs, annuaires et autres) Google scholar : Google book : Lecdi : In extenso : Exalead Kvisu : Ixquick Wayback machine Wikio (blogs) : Yahoo (Mindset) : Open directory project

22 Les répertoires Répertoire critique en SHS Répertoire de Bases de données en SHS, CALAME : Répertoire de revues Open Access, DOAJ : Répertoire d'Archive Ouverte, OpenDOAR : Répertoire du patrimoine numérique : Répertoire de ressources « academiques » : Bubl, Répertoire de BdD gratuites (Dadi) : Répertoire web2.0 : Search engines watch :

23 « Mon environnement de recherche » Quelques exemples Mes extensions FF (mes moteurs, zotero,…) Mon moteur de recherche (co-op/customsearch) Mon portail : Ning, netvibe, Igoogle, facebook, …

24 24 Vos questions ?

25 25 … et en plus

26 Moteurs (remarques) Interfaçage : Searchmash : Comprendre la relation entre les moteurs : this.com/search_engine_decoder.asphttp://www.search- this.com/search_engine_decoder.asp

27 Méthodologie de recherche 2 guides CERISE : InfoSphere : ences_humaines/index1.htmlInfoSphere : ences_humaines/index1.html Et aussi REPERE :

28 Stratégie de requête (exemple) Inurl:durand in title « durand pierre » Site: durand inurl:durand intitle: « durand pierre » « durand pierre » Durand pierre Google Source : Eric boutin

29 Les deux aspects des outils de recherche Base de données Propagation electrons : Collecte et stockage Fournir à Linternaute 10 à 20 réponses pertinentes 2 1 Source : Eric Boutin

30 Le point de départ de Google « un article scientifique tire sa légitimité de la reconnaissance par ses pairs » Analyse de la citation : SCI Eugène Garfield Duchemin Bla bla bla Dugenet(89) Dugenet Bla bla bla Dumoulin(79) Article 1 Article 2 Chaque page web a un poids appelé Pagerank PAGERANK (Google) A B C Yahoo! E F Linux.org A better than B A is linked to by more popularsites than B ( whatever the query is ) PAGERANK (Google) A B C Yahoo! E F Linux.org A est meilleur que B A reçoit des liens émanant de sites plus populaires que B quelle que soit la requête Source : Eric Boutin Comprendre le ranking :


Télécharger ppt "1 La Recherche dInformation sur le Web De la documentation électronique de votre université aux outils du Web Gabriel Gallezot - Urfist Paca-c ED avril."

Présentations similaires


Annonces Google