Recherche d’information

Slides:



Advertisements
Présentations similaires
La recherche documentaire
Advertisements

Les formateurs en documentation Rectorat de Lille Maîtrise de linformation au collège Compétences informationnelles et disciplines partenaires.
ETAPES DE LA RECHERCHE Sujet L’effet de serre :
La recherche documentaire sur internet au cycle 3 : quelques pistes de travail. Consultation et recherche documentaire en cycle 3 - Emmanuel Labadie -
1 ICSI Ingénierie des Connaissances et des Supports dInformation Organiser et exploiter le capital de connaissances des entreprises et des organisations.
Maîtrise de chimie : Travaux d Etudes et de Recherche Découvrir la nécessité, à partir dun exemple sur internet, détayer une information, un résultat,
Chercher pour trouver Nous quittons l'ère où on courait après l'information pour entrer dans celle où l'information nous court après"Nous quittons l'ère.
BCDI UTILISER LE THESAURUS POUR FAIRE UNE RECHERCHE
Cours n°1ue304b (S. Sidhom) UE 304 b Cours_L2.documentation_n°1 Gestion des documents : Technologies de lInformation et de la Communication Par : Sahbi.
Les outils du TAL Par RIGAUD Anaïs RALLIER Armelle SANTIAGO Gwendoline
Indexation textuelle : Systèmes de recherche d’informations
IronWEB : Une architecture distribuée
ETAPES DE LA RECHERCHE DOCUMENTAIRE
Vers une approche de construction de composants ontologiques pour le web sémantique – synthèse et discussion. Nesrine Ben Mustapha (RIADI, ENSI Tunis)
Nouvelles Pratiques des catalogues. Rendre les données plus utiles sur le web. Publier des pages HTML sur lesquelles les utilisateurs et les moteurs de.
Laboratoire Sciences Pour l’Environnement
Interfaces de recherche usager
INTELLIGENCE COLLECTIVE : RENCONTRES 2006Nîmes mai 2006 CENTRE DE RECHERCHE LGI2P 1- Doctorante Ecole des mines de Paris, 2- Maitre de Conférences.
Approche critique des produits IdL Master 1 IdL Année
L'ORIENTATION UN CHANTIER A PARTAGER
Comment trouver sur Internet?
CDI Lycée Marguerite Yourcenar La recherche d’information
Les étapes de la recherche documentaire
Annuaires et moteurs de recherche d’information sur Internet
Annotations sémantiques pour le domaine des biopuces
Le portail des MSH
Recherche Documentaire et traitement de l’information
LA RECHERCHE DOCUMENTAIRE AVEC BCDI CLASSE DE 2nd
Moteur de recherche d’information
Gouvernement du Québec Présentation par : Alain Thibault : PDG Efoé Wallace : Directeur du développement.
La recherche sur le Web Améliorer sa performance Compétences informationnelles – Activité 13 - Documentation Module 3: les moteurs académiques: Google.
La recherche sur le Web Améliorer sa performance Compétences informationnelles – Activité 13 - Documentation Module 3: les moteurs académiques: Google.
CUME 330: Didactique des études sociales à lélémentaire Les ressources dapprentissage et la recherche dans les outils de Présenté par David Martin Préparé.
VOUS ALLEZ ASSISTER A UNE DEMONSTRATION DU FONCTIONNEMENT DE LA BASE DE DONNEES DIPOUEST OUBLIEZ SOURIS ET CLAVIER ET LAISSEZ-VOUS GUIDER.
La face cachée des systèmes de recherche Martin Bouchard, président Janvier 2003.
IFT6255 – Recherche d’information Jian-Yun Nie
Les techniques des moteurs de recherche
Réaliser et diffuser un projet intégrant les TIC
Balzac, L’auberge rouge, 1831.
METHODOLOGIE DOCUMENTAIRE MUC1 Vendredi 12 septembre.
Tous droits réservés 04 octobre 2005© présente Les Moteurs de Recherche.
Les grandes étapes de la recherche
LA GESTION DOCUMENTAIRE BTS Assistant de direction 2e année, Janvier 2007.
SGBD Système de gestion de Base documentaire (Logiciel documentaire)
1. Se poser des questions Prendre du temps au départ
LA RECHERCHE DOCUMENTAIRE
INTERNET Un réseau informatique mondial : ce sont des millions d'ordinateurs en permanence allumés (reliés entre-eux par des lignes téléphoniques, fibres.
Dominique LAURENT Patrick SEGUELA
Veille informationnelle «branchée» de l’enseignement collégial Isabelle Laplante Bibliothécaire Colloque APOP en ligne 10 janvier 2007.
Techniques documentaires et veille stratégique Anne Pajard, avril 2008
MODULE 1 OÙ CHERCHER? 1 La recherche simple Catalogue de la bibliothèque Koha Moteur de recherche La recherche avancée Catalogue de la bibliothèque Koha.
Reveal-This Ou comment générer des métadonnées utiles automatiquement.
4 mars 2004Journée d’information-débat sur le livre électronique Les produits Des bibliothèques complètes par matière du droit (fiscalité, droit social,
TEXT MINING Fouille de textes
JDD 2005 Utilisation et Constitution de Ressources Sémantiques pour la Recherche d'Informations Précises. Vincent Barbier, groupe LIR Langues, Information.
Se repérer et organiser sa veille dans la recherche en éducation Module 2 « Maîtriser l’accès aux ressources scientifiques en éducation » Introduction.
Moteurs et métamoteurs de recherche
Cours n°1ue102.M1.com-ent(S. Sidhom) UE 102 (IUP.M1) Communication d’entreprise Infographie : TIC & communication d’entreprise Par : Sahbi SIDHOM MCF.
Initiation à la recherche documentaire Mardi 14 octobre 2014
Christian LUPOVICI Agence bibliographique nationale
L’identité numérique dans les organisations. L’usurpation de l’identité sur le web.
Compétences informationnelles Activité 5 : Choisir ses sources Connaître les outils de repérage Activité 5 Documentation Produit par Danielle Perreault,
Apéro Techno Romain Maragou - Aliou Sow Web sémantique.
Introduction générale
Bibliothèque Centrale de l’École Polytechnique PSC X2014 Mai 2015 Formation Recherche documentaire PSC X2014 Denis Roura 20 mai 2015.
Internet et la recherche documentaire Comment utiliser Internet de façon pertinente ?
CNRS Images / Photothèque 2008 La Photothèque du CNRS.
La recherche documentaire & internet Sport, sciences et technologie Octobre 2009 Délimiter et définir son sujet Dictionnaires (Google, define:sport, sciences,
1 4th International Conference on Arabic Language Processing, May 2–3, 2012, Rabat, Morocco Titre Mohamed El Amine ABDERRAHIM Mohamed Alaedine ABDERRAHIM.
Compétences informationnelles Choisir ses sources Connaître les outils de repérage.
Transcription de la présentation:

Recherche d’information

Plan Recherche d’information Modélisation de l’information/du document Les SRI Evaluation

Recherche d’information Chercher De l’information dans un document Un document (img, son, txt…) Dans une base de données Relationnelle, externe Mise en réseau

Recherche d’information Action de recherche : Procédures, techniques, méthodes En fonction de critères propres à l’usager (besoin) Pré-requis à la recherche : Modélisation du doc et de son contenu Interrogation du fonds Faire un point sur le besoin de l’usager !

Tâches associées Interactions avec l’utilisateur : expansion de requête Classification des documents par thématique Extraction d’information en vue d’une réponse à une question

Modélisation du document 1. Avant l’informatique Le « document » Pictural : sur des murs, des pierres Ecriture Tablettes, Papyrus (V), parchemin (A), papier (V) Palimpsestes, Livres Imprimerie (La Bible de Gutemberg : 1500) Journaux, magazines, microfilms Conservation Monastères, couvents, bibliothèques

Modélisation du document 1. Avant l’informatique Techniques documentaires Traiter le document : catalogage = méta-données Traiter son contenu : indexation = mot-clés Besoin de ressources adéquates Accès « Systèmes à aiguille » Ouvrages de référence : bibliographies, catalogues, dictionnaires, cartes, chronologies, encyclopédies Techniques : ne pas oublier les ressources qui permettait de faire ce travail à la main : Thésaurus, index, classification. D dans objectif de rationalisation (et efficacité, Taylor et les années 1850 !), les langages contrôlés, SYSTÈMES POUR CODER LE SAVOIR. Avec CC, documentaliste (donc spécialiste) lit le doc, et va choisir qq mots d’un vocabulaire contrôlé pour décrire son contenu. Lorsque utilisateur cherche document : 1) il connaît le document, ses références | 2) il a une idée du thème > va devoir utiliser le vocabulaire de la classfct doc pour accéder au document. Ouvrages de références: produits documentaires (ressources) pour s’instruire sur un domaine et conseiller accès vers autres documents

Modélisation du document 2. Avec l’informatique Un nouveau document : le document numérique Avec le Web 1.0 Hypertexte : Liens entre documents et document « interactif » Avec le Web 2.0 Document « collaboratif » : multiples sources, multiples auteurs Avec le Web 3.0 ? Document numérique, contenu peut être composite, et bornes ne sont pas physiques (ex la feuille de papier). Lié à la dématérialisation (passage du papier au numérique). Pose la question de la définition et homogénéité de son contenu, de ses limites, et du même coup des utilisations qu’il est possible d’en faire. 2.0 : Web collaboratif. Outils de com et d’apprentissage médiés. Interaction entre doc et différents utilisateurs qui enrichissent le document par leurs connaissances et leurs interventions. Autre conception du WEB 2.0 : web collaboratif fait par les utilisateurs, par leurs usages : folksonomie, tagging, détournement des outils initialement prévus. 3.0 : patrimoines : ici pas tant le document et sa construction qui est en question, mais sa place, son intégration à des projets plus vastes. Non plus de la description du document, mais la description de son contenu par le contexte de lecture et rapports entre individu, contexte et document? Notion de musées virtuels, de galeries.

Modélisation du document 2. Avec l’informatique Techniques documentaires Méta-données Indexation par mot-clé Mais pour les ressources ? Standardisation forte : ontologies Vs Collaboratif : folksonomie Accès : les SRI 2.0 : Normaliser la représentation du contenu. Ne plus accéder par index, mais par la substantifique moelle du document, ses « concepts », son SENS. Attention, pour Berners Lee & Co, aucune notion d’interprétation : juste réalisation d’une représentation générale du monde une ontologie standard (conçue main dans la main avec l’armement et le commerce US!). Puis chaque concepteur de document vient placer son doc dans l’ontologie.

Les SRI (systèmes de recherche d’information) Logiciel qui assure la tâche de recherche d’information Au centre : un moteur de recherche Pivot entre représentation des documents Et représentation du besoin des utilisateurs Expression d’un besoin d’utilisateur : requête Résultats obtenus Requête -----> Moteur de recherche ------> réponse Ce qui nous intéresse ici c’est ce pivot. Quelle représentation est adoptée ? Représentation en plain texte ? Seulement des méta données ? Des mots clés ?

Les SRI Calculatoires et algorithmiques Vers un nouveau paradigme ? Approche performative Représentation fondée sur étude statistique du texte Vers un nouveau paradigme ? Approche sociale et cognitive Études des comportements informationnels Nouveau paradigme : récent, volonté de replacer l’utilisateur au centre de ce processus

Logiciels de RI Moteurs de recherche à part entière Google, Yahoo!, Altavista, Bing Exalead, Boolgum Ujiko, Kartoo Moteurs de recherche « intégrés » ou dédiés Spinoo (éducation) Intégrés : site du CNRS, Encyclopédie Universalis, etc…

Le TAL en RI Où intervenir ? Comment ? Modélisation des documents/info Aide à la reformulation de requête Comment ? Extraction automatique de termes Construction d’index, d’ontologies Extract : LSA / pondération, loi de Zipf. Statistiques pour extraire pour chauqe texte les mots « saillants » Construction : à artir de voca de spécialité, par extraction ou à la main, en plein texte ou sur meta données ? Quelle correspondance entre index et expression de l’utilisateur? Capacité à reformuler dmd user ?

Evaluation de la RI Deux approches différentes Centré système Centré utilisateur Deux pratiques différentes Méthodes de laboratoire Etude des usages Enjeu : place de l’utilisateur dans l’éval Etude des usages : prise en compte du comportement réel des usagers

Evaluation de la RI Qu’est-ce qu’on évalue ? La pertinence des résultats ? La pertinence de l’index ? La construction de la requête ? L’ergonomie ? La prise en compte de l’utilisateur ? Pertinence des résultats > métrique binaire, bon ou pas bon Pertinence de l’index > cas de langue naturelle -> traitement des pluriels irréguliers (œil/yeux), entrée par lemme ou pour chaque forme, ttmt des verbes… Construction requête > utilisation d’opérateurs ? (define: ) utilisation de booléens ? Prise en compte des caractères spéciaux ? Exécution de calcul ? Ergonomie : simple ? Chargée? RA ? … Prise en compte user dans personnalisation des propositions ? Possibilité de paramétrer le moteur ?

Campagnes d’évaluation Campagnes les plus connues TREC (NIST) Recherche documentaire, extraction de données, fouille de textes Test de la pertinence des résultats Réponse à des requêtes +/- courtes NTCIR Recherche d’information

Evaluation : la pertinence Ecueils principaux en RI Bruits Silence Mesures utilisées Précision Rappel

Evaluation : Rappel et Précision Nombre de documents pertinents trouvés par rapport au nombre de documents total Précision Nombre de documents pertinents parmi tous les documents trouvés F-mesure 2(P*R)/P+R

Evaluation : L’index Langage naturel / contrôlé ? Plein texte ou champs limités ? Ambiguïtés : quel traitement ? Traitement syntaxique ? Sémantique ?

Evaluation : Les modes de recherche Recherche simple Recherche simple avec opérateurs Recherche avancée Recherche à partir d’un index