La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Recherche d'Information Gabriel Gallezot Université de Nice Sophia Antipolis URFIST

Présentations similaires


Présentation au sujet: "Recherche d'Information Gabriel Gallezot Université de Nice Sophia Antipolis URFIST"— Transcription de la présentation:

1 Recherche d'Information Gabriel Gallezot Université de Nice Sophia Antipolis URFIST

2 Imaginez la situation suivante : Vous êtes actuellement chercheur dans un labo. En vue de la réalisation d'un prochain projet, le responsable du labo vous demande : 1. De produire une bibliographie sur de le thème de l'anthropocene 2. De lui fournir sur la base de la bibliographie réalisée une dizaine de documents significatifs afin de mieux cerner ce thème. 3. De surveiller un certain nombre de sites sur ce même thème et d'être attentif à l'image de l'organisme sur le web. 4. De lui proposer un moyen simple de partager des références (liens sur textes ou sites) avec les autres membres du projet de recherche qui travaillent sur d'autres thèmes connexes. Intro Pull Push

3 Plan 1.Introduction générale à la recherche dinformation 2.Outils de recherche 1.En Bu 2.Sur le web 3.Mon environnement de travail 4.Methode Push

4 1 Introduction générale à la recherche dinformation

5 « Lécriture nous a permis d« externaliser » en partie notre mémoire. Limprimerie nous a permis de transmettre cette mémoire externe. La Toile a diminué considérablement les coûts de transmission de linformation. Surtout, elle a permis à chacun dapporter sa contribution personnelle au patrimoine collectif» ABITEBOUL, Serge. Sciences des données : de la logique du premier ordre à la Toile. Nouvelle édition [en ligne]. Paris : Collège de France, Disponible sur Internet :.

6 Données, informations, connaissances … et document Une donnée est une description élémentaire, typiquement numérique pour nous, dune réalité. Cest par exemple une observation ou une mesure.* À partir de données collectées, de linformation est obtenue en organisant ces données, en les structurant pour en dégager du sens.* En comprenant le sens de linformation, nous aboutissons à des connaissances, cest-à-dire à des « faits » considérés comme vrais dans lunivers dun locuteur, et à des « lois » (des règles logiques) de cet univers.* "Toute connaissance mémorisée, stockée sur un support, fixée par l'écriture ou inscrite par un moyen mécanique, physique, chimique, électronique, constitue un document. [...] tant que le document est créé mais n'est pas encore utilisé par un récepteur, il reste un document virtuel. Dès lors qu'il est employé et décodé par un récepteur, le document devient réel : il a trouvé son utilisateur" ** (voir dia : « la tridimensionnalité du document ») *ABITEBOUL, Serge. Sciences des données : de la logique du premier ordre à la Toile. Nouvelle édition [en ligne]. Paris : Collège de France, Disponible sur Internet : .

7 Tridimensionnalité du document Signe ou forme Texte ou contenu Médium ou relation Ou repéré Ou compris Ou retenu « document = support + inscription » Document est une promesse « contrat de lecture » « document = objet mémoriel » Le document est « une trace permettant dinterpréter un événement passé à partir dun contrat de lecture… cest une « construction sociale », le vu (la trace, laspect matériel), le lu (linterprétation, la dimension intellectuelle) et le su (la dimension mémorielle de lévénement) Pédauque R-T, Salaün J-M. Le document à la lumière du numérique. C&F Editions; 2006.

8 L'accès à l'information Les "techniques intellectuelles" sont des méthodes et des outils ayant la capacité de repérer et de retrouver l'information ; Invariant ;-) Source : C. Fauré

9 Repérage / indexation de d'information Référents externes Liste Taxinomie Thésaurus Ontologie (graph) Référents internes métadonnées structures

10 taxinomie / thésaurus / ontologie

11 Index Le principe de stockage des informations dans l'index est celui d'un annuaire inversé : Chaque terme est associé a une liste de documents y contenant une occurrence -> critère de rapidité de recherche L'index stocke les informations sur les sources dans un format pivot : La richesse de ce format pivot, qui structure l'index, va être garante de la qualité de recherche. Source : C. Fauré

12 Répères pour appréhender le Web 1991 (public) Tim Berners-Lee et Robert Cailliau Système métastable (métaphore du rocher), distribué et ouvert Pb du web : croissance rapide, création de désorientation du web classique => proposition d'un web sémantique (web de données) en Autres solutions en attendant le web de données Les moteurs Web 2.0 réseaux sociaux API (Application Programming Interface, web services)

13 Pourquoi un moteur de recherche est-il si rapide pour chercher dans des milliards de pages ? Réponse : il ne cherche pas ! Il a déjà toutes les réponses aux requêtes qui lui sont formulées. Source : C. Fauré Chaque requête est une métadonnée

14 Moteur de recherche et texte mining Texte mining : art de générer automatiquement des métadonnées.=> plusieurs méthodes - Recherche « plein texte » (occurrences) - Recherche associative (statistique : les vecteurs) - Recherche linguistique (tokenisation, lemmatisation, entity extraction) - Recherche sémantique (structurée) : le moteur s'appuie sur des référentiels (à partir d'un référentiel métier par exemple) Source : C. Fauré

15 Principe des moteurs Pour trouver de l'information, certes. Mais surtout pour : trouver rapidement l'information trouver de l'information dans des sources diverses et hétérogènes rechercher dans des informations peu ou faiblement structurées

16 Complémentarité des approches Source : C. Fauré

17 Source : Appréhension de linfo

18 Matching : correspondance des mots-clés dune requête avec les mots-clés représentant « le(s) document(s) résultat » (système documentaire). Watching : une « vue » des résultats introduite par une organisation spécifique (ex. page rank, clusterisation, recommandation, etc) (monde des moteurs) et classements affinitaires personnalisés (monde des réseaux sociaux) >>>>> la question des algorithmes et des « outils de visualisation » de l'information

19

20 Où chercher ? Web visible et Web 2.0 (web surfacique) Web invisible (web profond) P2P Contenu indexable, contenu taggé bases de données spécialisées Contenu dynamique Index partiel des sites Interdiction dindexation Information contenue sur les ordinateurs individuels plusieurs millions dordinateurs inter-connectés Milliards de Pages web ? Forum de discussion À partir de source : Eric Boutin

21 Usages des moteurs Infographiclabs, 2010, GO-Gulf, 2012, Médiamétrie, % des internautes utilisent les moteurs de recherche pour trouver et accéder aux sites 21 % du temps passé en ligne est consacré à la recherche 57 % des internautes cherchent sur le web chaque jour 46 % des recherches concernent des informations sur des produits ou des services (e-commerce) 50 % du trafic dun site vient dun moteur de recherche (France) Source : A. Bouchard

22 Sites les plus visités Paul Jacionis, 05/2012 Source : A. Bouchard

23 Nombre de requêtes Etude comScore, 2013 Source : A. Bouchard

24 La personnalisation de la recherche Personnalisation sur Google (étude A. Hannak et al., 2013)étude A. Hannak et al., % des résultats différents - basée surtout sur lidentification au service et sur ladresse IP (localisation) « Lalgorithme [de Google] utilise plus de 200 paramètres pour affiner une requête. Cela inclut le PageRank du site internet, la localisation géographique de linternaute, les liens sur lesquels il clique généralement, la façon dont il modifie ses requêtes quand il nest pas satisfait, ainsi que son historique de recherche » (T. Vanderbilt, 2013, voir également infographie)T. Vanderbilt, 2013infographie

25 Les opérateurs (les booléens et les autres) ORANDAND NOT Formadoct : ( ) link:site: as_qdr=d15 filetype: allinurl: mais surtout de plus en plus dinterfaces à comprendre, à appréhender, à suivre,... Exemple avec Google => Fonctionnalités :

26 La Galaxie Google -Google Trends (comparaison de termes, de sites) : Ex : -Google Alerte : -Google Custom Search : Google Knwoledge Graph : things-not.html things-not.html - Attention google and your memory : and-your-memory/http://www.onlinecolleges.net/2011/09/19/google- and-your-memory/

27 2 Les outils de recherche 1.En Bibliothèque (ex de lUNS) 2.Sur le Web

28 Ressources en BU Catalogue et ressources électroniques

29 Exercice avec les outils de la bibliothèque je cherche si l'ouvrage : « Nous n'avons jamais été modernes : essai d'anthropologie symétrique » de Latour Bruno …. Est disponible dans une BU de l'université...comment faire ? Dans quelle(s) autre(s) BU en France l'ouvrage est-il disponible ?... comment faire ? je souhaite lire l'ouvrage « Sociologie de la traduction : Textes fondateurs, de Latour, Bruno.; Callon, Michel.; Akrich, M. ? » comment faire ? Conseillez-moi.

30 je cherche à savoir ce qu'est le "Dreaming" pour les Aborigènes dAustralie... comment faire ? je cherche un article du Courrier International intitulé : Le livre à l'ère du numérique; Attention, le livre électronique décolle !... ( 13 avril 2008) comment faire ? savez-vous si je peux consulter les articles (full-text) des revues "Agricultural and Forest Meteorology" et "Journal of Documentation » ? (précisez)

31 Ressources sur le web Exemples doutils (panorama sur le web)

32 Le Web chercher des références et les textes associés Le « monde de Bibliothèques » (cat. et BN) Les Dictionnaires et les encyclopédies (Dico & Co) Les Archive Ouvertes et Revues en ligne (AO & Co) Les outils du « web2.0 » Les Moteurs Les outils « embarqués » (extensions navigateur) « son » moteur La méthode Push (selon déroulement du cours)

33 Le « monde des bibliothèques » Catalogues Dédié aux thèses : Worldcat JournalTOC : Ne pas oublier Amazon, chapitre.com, decitre.. Bibliothèques Numérique Gallica : Europeana : Hathi trust : Wikisource : Le projet Gutenberg (ebook): Internet Archive (le web) : Google book : Liste des Bibliothèques numériques : et

34 Dico & Co Wikipedia : Scholarpedia : CNRTL : Centre National de Ressources Textuelles et (Morphologies, Lexicographie, Etymologie, Synonymie, Antonymie, Proxémie, Concordance) (accès à TLFI et d'autres dictionnaire)http://www.cnrtl.fr/lexicographie/ Dicorama :

35 OA & Co HAL : Revues.org : Persee : OAIster (cf. Worldcat) : Base : ISIDORE : OpenDOAR : Scientific commons DOAJ :

36 Le web2.0 Recherche « verticale » Signets : Diigo : Delicioushttp://www.diigo.com/ Ref biblio : CiteUlike LibraryThing : Mendeley …http://www.citeulike.org/http://www.librarything.com, Illustrations : Flickr youtube … :http://www.flickr.com/ Présentations : PPT : Tweets : search de twitter et Topsy Transversaux (avec choix) : Qwant, socialmention,...

37 Les outils de recherche du web (quelques exemples) Moteurs « academics » Google scholar : Microsoft academics search : (voir aussi ) (ex avec UPF) Scirus : JURN Cf aussi dia AO & co

38 Les outils de recherche du web (quelques exemples - suite) MétaMoteurs Ixquick Clusty : Interfaçage SearchCube : Oamos : Moteurs de médias Vidéos : Images : Sur mobile phone Google googles Shazam, Soundhound... « Verticaux » selon plateforme choix du « vertical » : Selon les droits associés : Moteurs inversés Tineye : Midomi : Moteur collaboratifs : Blekko Moteur « anomysé » : Duckduckgo Moteur « vocal » : google sur chrome Recherche dans la vidéo : Voxalead : Moteur de réponses : Wolfram|Alpha, https://www.wolframalpha.com https://www.wolframalpha.com

39 Outils embarqués : des extensions FireFox Tous les outils dans un menu déroulant Add to search : https://addons.mozilla.org/en-US/firefox/addon/3682https://addons.mozilla.org/en-US/firefox/addon/3682 Ajout de fonctionnalités sur certain outils de recherche. search Cloudlet : https://addons.mozilla.org/fr/firefox/addon/search-cloudlet-for- google-yah/https://addons.mozilla.org/fr/firefox/addon/search-cloudlet-for- google-yah/... Sur mesure : créer son moteur de recherche (ex : LeMien)LeMien sur google custom search (ex co-op), équivalent de lopérateur site: multiplié à souhait :

40 Exercices 1.Je dois me déplacer à l'université de Nouvelle Calédonie, indiquez-moi la(es) références bibliographique(s) des ouvrages de Bruno latour, (postérieur à 2010) que je pourrai consulter sur place. 2.Je souhaite me procurer l'article : Zalasiewicz, J., P.J. Crutzen, et W. Steffen « Chapter 32 - The Anthropocene ». In The Geologic Time Scale, Boston: Elsevier, p Conseillez moi ! 3.Je souhaite me procurer l'article : Slaughter, Richard A « Welcome to the anthropocene ». Futures 44(2): Conseillez moi ! 4.Sur Google, Je cherche des documents en pdf qui comportent le mot-clé « énergie » sur le site du « ministère de l'environnement ».(rédigez la requête) 5.Sur Google, comment trouver des documents qui comportent le mot clés «anthropocene» et sont datés de 2011 sur le site de l'université de Nice 6.Je cherche des images libre de droits pour illustrer mon cours sur «anthropocene » 7.Je cherche des images similaires à files/ours_polaire.jpghttp://grandquebec.com/upl- files/ours_polaire.jpg 8.Quelle est la référence bibliographique originale du document comportant l'extrait suivant : […] La maîtrise de lénergie mécanique a été le fait dartisans et de techniciens souvent étrangers aux cercles scientifiques […]

41 1. je souhaite lire l'ouvrage « l'origine des espèces » de C. Darwin comment faire ? Conseillez-moi. 2. Je souhaite être averti par mail des nouvelles publications de la revue dont l'ISSN est : ? Conseillez-moi. 3. Quel est le titre de louvrage dont lisbn est : Je cherche le document dont le titre est : « Conservation and social-ecological systems in the 21st century of the Anthropocene era ». 5.Je cherche l'article de la revue « Nonprofit and Voluntary Sector Quarterly » de l'éditeur « Sage journals » intitulé « Volunteerism Research A Review Essay », Conseillez-moi. 6.Je veux lire la totalité de l'ouvrage dont le titre est « The Pacific Northwest Research Station's biodiversity initiative [...] ». Conseillez-moi. 7.Je souhaite avoir un aperçu des publications de Stevan Harnad, conseillez-moi 8.Quelle est l'invention notable de Theodore Maiman ? conseillez-moi Exercices (suite)

42 Vos questions ?


Télécharger ppt "Recherche d'Information Gabriel Gallezot Université de Nice Sophia Antipolis URFIST"

Présentations similaires


Annonces Google