Recherche d'Information Gabriel Gallezot Université de Nice Sophia Antipolis URFIST

Slides:



Advertisements
Présentations similaires
La recherche documentaire
Advertisements

Les Outils de Recherche du Web Gabriel Gallezot Université de Nice Sophia Antipolis URFIST Gallezot.
A l'aise pour renseigner les lecteurs Gabriel Gallezot Université de Nice Sophia Antipolis URFIST
UE 102 (M1.CE) Communication d’entreprise
dispositif SIST et l’accès à l’information scientifique et technique
EBSCO Host Bases de données et revues en texte intégral en ligne
Atelier Wiki 1.Introduction 2.Définition 3.Fonctionnement 4.Ecrire sur un wiki 5.En pratique 6.Glossaire 7.Ressources.
Chercher pour trouver Nous quittons l'ère où on courait après l'information pour entrer dans celle où l'information nous court après"Nous quittons l'ère.
Internet.
Se repérer et organiser sa veille dans la recherche en éducation Module 2 « Maîtriser laccès aux ressources scientifiques en éducation » Outils de veille.
« ARCHEODOC, un portail dynamique pour la recherche d’information en archéologie » Véronique HUMBERT (Lattes) Blandine.
Cours n°1ue304b (S. Sidhom) UE 304 b Cours_L2.documentation_n°1 Gestion des documents : Technologies de lInformation et de la Communication Par : Sahbi.
Recherche dinformation sur le web Gabriel Gallezot Université de Nice Sophia Antipolis URFIST.
Recherche d'information sur le Web Gabriel Gallezot Université de Nice Sophia Antipolis URFIST.
Exercices Recherche dinformation. Méthodo ? Connaissance des ressources Prise dindices (mots clès, type de doc, langue,...) Connaître les opérateurs /
Recherche dinformation sur le web ( de la documentation électronique de votre université aux outils du Web ) Gabriel Gallezot Université de Nice Sophia.
Imaginez la situation suivante :
Faire sa veille avec les outils web2.0
Les Outils de Recherche du Web Gabriel Gallezot Université de Nice Sophia Antipolis URFIST
Outils de recherche pour les SHS sur web Gabriel Gallezot Université de Nice Sophia Antipolis URFIST.
Imaginez la situation suivante :
Les Outils de Recherche du Web Gabriel Gallezot Université de Nice Sophia Antipolis URFIST
Méthodologie de la recherche documentaire Gabriel Gallezot Université de Nice Sophia Antipolis URFIST.
Les Outils de Recherche du Web Gabriel Gallezot Université de Nice Sophia Antipolis URFIST
La Recherche dInformation en Ligne Quelques outils Gabriel Gallezot.
Recherche d’information (panorama des outils) Gabriel Gallezot Université de Nice Sophia Antipolis URFIST.
La Recherche d’Information sur le Web
Les Outils de Recherche du Web Gabriel Gallezot Université de Nice Sophia Antipolis URFIST
Les Outils de Recherche du Web Gabriel Gallezot Université de Nice Sophia Antipolis URFIST
Gallezot Veille Documentaire Gabriel Gallezot Université de Nice Sophia Antipolis URFIST.
Gallezot Veille Documentaire Gabriel Gallezot Université de Nice Sophia Antipolis URFIST.
SECURITE DU SYSTEME D’INFORMATION (SSI)
1 Bibdoc 37 – Regards croisés Bibliothèques virtuelles, usages réels 7 avril 2009 – Tours « Les usages des bibliothèques virtuelles » Jean-Philippe Accart.
Comment trouver sur Internet?
Lycée Louis Vincent Séance 1
Recherche d'Information Gabriel Gallezot Université de Nice Sophia Antipolis URFIST
La communication sur Internet Assemblée générale des associations françaises de Belgique 29 Avril 2014.
Plus haut, plus fort, plus wiki… Plénière Izida Khamidoullina.
Échéancier # E) Bilan réflexif /rapport individuel (cours # 15 individuel disponible sur le site section travaux (Attention : rédiger votre travail.
Le Web 1.0 et 2.0. Un monde de différences Web 1.0 Web 1.0 Consommation dinformation Consommation dinformation Centralisation : quelques producteurs-diffuseurs.
Page 1 © Jean Elias Gagner en agilité numérique. Page 2 © Jean Elias Les fournisseurs.
Intégration des TIC et nouveaux outils
La veille numérique : un outil pour s'informer intelligemment &
Stage Veille sur Internet
Page 1 © Jean Elias Recherche et veille. Page 2 © Jean Elias Les fournisseurs.
METHODOLOGIE DOCUMENTAIRE MUC1 Vendredi 12 septembre.
Formation ADBS – septembre 2014 – 1 Approfondir son expertise en recherche d'information 3-4 & 5 septembre 2014.
CRÉER ET ALIMENTER UN BLOG A PARTIR DE LA PLATE FORME OVER BLOG
Tous droits réservés 04 octobre 2005© présente Les Moteurs de Recherche.
L’ ACCESSIBILITE « C’est mettre le Web et ses services à la disposition de tous les individus, quels que soient leur matériel ou logiciel, leur infrastructure.
Ressources et outils de recherche sur le web Gabriel Gallezot Université de Nice Sophia Antipolis URFIST
LA GESTION DOCUMENTAIRE BTS Assistant de direction 2e année, Janvier 2007.
LA RECHERCHE DOCUMENTAIRE
Science2.0 Gabriel Gallezot. Sommaire Définition (tentative) Web2.0 → Science2.0 (outils/services) Chercheur → Chercheur2.0 (activités) Questions associées.
INTERNET Un réseau informatique mondial : ce sont des millions d'ordinateurs en permanence allumés (reliés entre-eux par des lignes téléphoniques, fibres.
Ministère de l’enseignement Supérieur et de la Recherche Scientifique
Développement d’application Web.  Internet  WWW  Client/Serveur  HTTP.
Recherche d’information
B2i école : domaines, aptitudes et pistes d’activités
Techniques documentaires et veille stratégique Anne Pajard, avril 2008
Daniel Peraya Choï Jenni TECFA – Université de Genève.
Gallica 2 : Les pratiques collaboratives dans l’environnement d’une bibliothèque numérique et les développements web 2.0 de la BNF Rencontres 2008 des.
Le web 2.0 coopératif LES WIKIS.
Gallezot Les outils du Web Gabriel Gallezot Université de Nice Sophia Antipolis URFIST
Se repérer et organiser sa veille dans la recherche en éducation Module 2 « Maîtriser l’accès aux ressources scientifiques en éducation » Introduction.
Cours n°1ue102.M1.com-ent(S. Sidhom) UE 102 (IUP.M1) Communication d’entreprise Infographie : TIC & communication d’entreprise Par : Sahbi SIDHOM MCF.
Gallezot Veille Documentaire Gabriel Gallezot Université de Nice Sophia Antipolis URFIST.
 Web 2 et Projet éditorial Janvier 2012– Eric Giraudin.
Master 1 « diffusion de la culture » Formation à la maîtrise de l’information scientifique et technique Séance 2 Jeudi 02/10/2014 SID2 1.
Organiser l’information trouvée sur internet Félix Langevin Harnois Bibliothécaire Service de la bibliothèque École de technologie supérieure Hiver 2016.
Transcription de la présentation:

Recherche d'Information Gabriel Gallezot Université de Nice Sophia Antipolis URFIST

Imaginez la situation suivante : Vous êtes actuellement chercheur dans un labo. En vue de la réalisation d'un prochain projet, le responsable du labo vous demande : 1. De produire une bibliographie sur de le thème de l'anthropocene 2. De lui fournir sur la base de la bibliographie réalisée une dizaine de documents significatifs afin de mieux cerner ce thème. 3. De surveiller un certain nombre de sites sur ce même thème et d'être attentif à l'image de l'organisme sur le web. 4. De lui proposer un moyen simple de partager des références (liens sur textes ou sites) avec les autres membres du projet de recherche qui travaillent sur d'autres thèmes connexes. Intro Pull Push

Plan 1.Introduction générale à la recherche d’information 2.Outils de recherche 1.En Bu 2.Sur le web 3.Mon environnement de travail 4.Methode Push

1 Introduction générale à la recherche d’information

« L’écriture nous a permis d’« externaliser » en partie notre mémoire. L’imprimerie nous a permis de transmettre cette mémoire externe. La Toile a diminué considérablement les coûts de transmission de l’information. Surtout, elle a permis à chacun d’apporter sa contribution personnelle au patrimoine collectif» ABITEBOUL, Serge. Sciences des données : de la logique du premier ordre à la Toile. Nouvelle édition [en ligne]. Paris : Collège de France, Disponible sur Internet :.

Données, informations, connaissances … et document Une donnée est une description élémentaire, typiquement numérique pour nous, d’une réalité. C’est par exemple une observation ou une mesure.* À partir de données collectées, de l’information est obtenue en organisant ces données, en les structurant pour en dégager du sens.* En comprenant le sens de l’information, nous aboutissons à des connaissances, c’est-à-dire à des « faits » considérés comme vrais dans l’univers d’un locuteur, et à des « lois » (des règles logiques) de cet univers.* "Toute connaissance mémorisée, stockée sur un support, fixée par l'écriture ou inscrite par un moyen mécanique, physique, chimique, électronique, constitue un document. [...] tant que le document est créé mais n'est pas encore utilisé par un récepteur, il reste un document virtuel. Dès lors qu'il est employé et décodé par un récepteur, le document devient réel : il a trouvé son utilisateur" ** (voir dia : « la tridimensionnalité du document ») *ABITEBOUL, Serge. Sciences des données : de la logique du premier ordre à la Toile. Nouvelle édition [en ligne]. Paris : Collège de France, Disponible sur Internet : < **ESTIVAL (Robert), MEYRIAT (Jean).- "La dialectique de l'écrit et du document. Un effort de synthèse".- in : Schéma et schématisation, nº14, 2e trim p >.

L'accès à l'information Les "techniques intellectuelles" sont des méthodes et des outils ayant la capacité de repérer et de retrouver l'information ; Invariant ;-) Source : C. Fauré

Repérage / indexation de d'information Référents externes Liste Taxinomie Thésaurus Ontologie (graph) Référents internes métadonnées structures

taxinomie / thésaurus / ontologie

Index Le principe de stockage des informations dans l'index est celui d'un annuaire inversé : Chaque terme est associé a une liste de documents y contenant une occurrence -> critère de rapidité de recherche L'index stocke les informations sur les sources dans un format pivot : La richesse de ce format pivot, qui structure l'index, va être garante de la qualité de recherche. Source : C. Fauré

Base de données, késako ? Stockage ? Quels types de données ? SGBD ? Schémas (« à plat », relationnel, objet,...)? Enregistement ? Quelles applications ?

Répères pour appréhender le Web 1991 (public) Tim Berners-Lee et Robert Cailliau Système métastable (métaphore du rocher), distribué et ouvert Pb du web : croissance rapide, création de désorientation du web classique => proposition d'un web sémantique (web de données) en Autres solutions en attendant le web de données Les moteurs Web 2.0 réseaux sociaux API (Application Programming Interface, web services)

Pourquoi un moteur de recherche est-il si rapide pour chercher dans des milliards de pages ? Réponse : il ne cherche pas ! Il a déjà toutes les réponses aux requêtes qui lui sont formulées. Source : C. Fauré Chaque requête est une métadonnée

Moteur de recherche et texte mining Texte mining : art de générer automatiquement des métadonnées.=> plusieurs méthodes - Recherche « plein texte » (occurrences) - Recherche associative (statistique : les vecteurs) - Recherche linguistique (tokenisation, lemmatisation, entity extraction) - Recherche sémantique (structurée) : le moteur s'appuie sur des référentiels (à partir d'un référentiel métier par exemple) Source : C. Fauré

Principe des moteurs Pour trouver de l'information, certes. Mais surtout pour : trouver rapidement l'information trouver de l'information dans des sources diverses et hétérogènes rechercher dans des informations peu ou faiblement structurées

Complémentarité des approches Source : C. Fauré

Source : Appréhension de l’info

Matching : correspondance des mots-clés d’une requête avec les mots-clés représentant « le(s) document(s) résultat » (système documentaire). Watching : une « vue » des résultats introduite par une organisation spécifique (ex. page rank, clusterisation, recommandation, etc) (monde des moteurs) et classements affinitaires personnalisés (monde des réseaux sociaux) >>>>> la question des algorithmes et des « outils de visualisation » de l'information

Où chercher ? Web visible et Web 2.0 (web surfacique) Web invisible (web profond) P2P Contenu indexable, contenu taggé bases de données spécialisées Contenu dynamique Index partiel des sites Interdiction d’indexation Information contenue sur les ordinateurs individuels plusieurs millions d’ordinateurs inter-connectés Milliards de Pages web ? Forum de discussion À partir de source : Eric Boutin

Usages des moteurs Infographiclabs, 2010Infographiclabs, 2010, GO-Gulf, 2012, Médiamétrie, 2012GO-Gulf, 2012 Médiamétrie, % des internautes utilisent les moteurs de recherche pour trouver et accéder aux sites 21 % du temps passé en ligne est consacré à la recherche 57 % des internautes cherchent sur le web chaque jour 46 % des recherches concernent des informations sur des produits ou des services (e-commerce) 50 % du trafic d’un site vient d’un moteur de recherche (France) Source : A. Bouchard

Sites les plus visités Paul Jacionis, 05/2012 Source : A. Bouchard

Nombre de requêtes Etude comScore, 2013 Source : A. Bouchard

Les opérateurs (les booléens et les autres) ORANDAND NOT Formadoct : ( ) link:site: as_qdr=d15 filetype: allinurl: mais surtout de plus en plus d’interfaces à comprendre, à appréhender, à suivre,... Exemple avec Google => Fonctionnalités :

La Galaxie Google -Google Trends (comparaison de termes, de sites) : Ex : -Google Alerte : -Google Custom Search : Google Knwoledge Graph : things-not.html things-not.html - Attention google and your memory : and-your-memory/ and-your-memory/

2 Les outils de recherche 1.En Bibliothèque (ex de l’UNS) 2.Sur le Web

Onglet « bibliothèque » Onglet « ressources » Ressources en BU

Ressources sur le web Exemples d’outils (panorama sur le web)

Le Web chercher des références et les textes associés Le « monde de Bibliothèques » (cat. et BN) Les Archive Ouvertes et Revues en ligne (AO & Co) Les outils du « web2.0 » Les Moteurs Les outils « embarqués » (extensions navigateur) « son » moteur La méthode Push (selon déroulement du cours)

Le « monde des bibliothèques » Catalogues Dédié aux thèses : Worldcat JournalTOC : Ne pas oublier Amazon, chapitre.com, decitre.. Bibliothèques Numérique Gallica : Europeana : Hathi trust : Wikisource : Le projet Gutenberg (ebook): Internet Archive (le web) : Google book : Liste des Bibliothèques numériques : et

OA & Co HAL : Revues.org : Persee : OAIster (cf. Worldcat) : Base : ISIDORE : OpenDOAR : Scientific commons DOAJ :

Le web2.0 Recherche « verticale » Signets : Diigo : Ref biblio : CiteUlike LibraryThing : Mendeley … Illustrations : Flickr youtube … : Présentations : PPT : Tweets : search de twitter et topsy Transversaux (avec choix) : Qwant, socialmention,...

Les outils de recherche du web (quelques exemples) Moteurs « academics » ● Google scholar : ● Microsoft academics search : (voir aussi ) ● Scirus : ● JURN Cf aussi dia AO & co

Les outils de recherche du web (quelques exemples - suite) MétaMoteurs Ixquick Clusty : Interfaçage SearchCube : Oamos : Moteurs de médias Vidéos : Images : Sur mobile phone ● Google googles ● Shazam, Soundhound ●... « Verticaux » selon plateforme choix du « vertical » : Selon les droits associés : Moteurs inversés Tineye : Midomi : Moteur collaboratifs : Blekko Moteur « anomysé » : Duckduckgo Moteur « vocal » : google sur chrome Recherche dans la vidéo : Voxalead : Moteur de réponses : Wolfram|Alpha,

Outils embarqués : des extensions FireFox  Tous les outils dans un menu déroulant  Add to search :  Ajout de fonctionnalité sur certain outils de recherche. search Cloudlet : … “Sur mesure” : créer son moteur de recherche (ex : LeMien)‏LeMien sur google custom search (ex co-op), équivalent de l’opérateur site: multiplié à souhait :

Methode Push (la veille)

Veille et alerte Update scanner Google Alert : …

RSS Contexte (cms…) Pourquoi faire ? Outils (local, en ligne) En pratiques (OPML, …) Voir vidéo :

La recherche collaborative « Quand on cherche quelque chose de compliqué, c'est à dire quelque chose que l'on sait que l'on ne trouvera pas directement sur Google, ou alors au prix d'une reformulation complexe en différents mots-clés séparés entre eux par des opérateurs variés autant que booléens, bref quand on a une question longue en langage naturel et qu'on a la flemme... on va poser sa question sur Twitter. Et on obtient en général presqu'immédiatement la réponse. […] Twitter est le nouveau Google. […]. Mais Twitter n'est pas que le nouveau Google. » (O. Ertzscheid)O. Ertzscheid source Source : A. Bouchard

Adhérer/Créer un réseau de veilleur ( cf : Liste de discussion / les « groups » Annuaires pro (linkedIn, viadéo,...) Un blog Un wiki Twitter Diigo... Pensez « interfaçage » avec des applications tierces 1 opération : alimentation de plusieurs comptes Diigo + twitter + facebook

Mashup Pour faire quoi ? Quels outils –yahooPipe : –… Diffusion ?

Vos questions ?