Comme une renégociation des espaces documentaires. Etude exploratoire des pratiques dindexation sociale.

Slides:



Advertisements
Présentations similaires
Peut-on vivre sans Google ? (oui mais c’est moins pratique)
Advertisements

Ressources documentaires électroniques
Définitions Analyse documentaire
La recherche documentaire
UE 102 (M1.CE) Communication d’entreprise
Indexation sociale & Bibliothéconomie de masse Session 5 : Les usages à distance Quelle distance ? Quels usagers ? Quels usages ? . Olivier Ertzscheid.
Projet Présentation du projet
Urbanisation de Systèmes d'Information
Dalila CHIADMIIFISI TIC et le développement de la recherche scientifique Revue scientifique : le modèle du libre accès Dalila Chiadmi.
Se repérer et organiser sa veille dans la recherche en éducation Module 2 « Maîtriser laccès aux ressources scientifiques en éducation » Outils de veille.
Documentation numérique sur l’Internet
Usages pédagogiques des Espaces Numériques de Travail Mars 2009.
Cours n°1ue304b (S. Sidhom) UE 304 b Cours_L2.documentation_n°1 Gestion des documents : Technologies de lInformation et de la Communication Par : Sahbi.
Eric BONJOUR, Maryvonne DULMET
Mettre en place une démarche de recherche documentaire
Faire sa veille avec les outils web2.0
Indexation textuelle : Systèmes de recherche d’informations
Institut national du cancer Mise en place de la veille sur le cancer Lyon, 26 octobre 2005 Ingrid Aubry.
Plateforme de revues et d’articles en sciences humaines et sociales
Nouvelles Pratiques des catalogues. Rendre les données plus utiles sur le web. Publier des pages HTML sur lesquelles les utilisateurs et les moteurs de.
1 Lyon juin 2008 Articuler l'enseignement et la formation... ou comment aider à la formation dans l'action. L'exemple du site PEGASE.
Christian Ollivier IUFM / Université de La Réunion
Cartes Conceptuelles Daniel Peraya
Traitement de données socio-économiques et techniques d’analyse :
Processus DE Capitalisation
1 Bibdoc 37 – Regards croisés Bibliothèques virtuelles, usages réels 7 avril 2009 – Tours « Les usages des bibliothèques virtuelles » Jean-Philippe Accart.
C. FORESTIER Journée d'étude sur les Archives Ouvertes Couperin 21 mai 2007 THESES EN LIGNE : comment faire simple !
La veille informationnelle : principes et pratique
Plan la séance 4 La problématique d’une recherche
Le Travail Collaboratif ...
RDF(S)
Assises du GDR- I3 Présentation du GRCE Groupe de Recherche en communication Ecrite.
Standards pour les ressources documentaires description – organisation – diffusion – production Séminaire Normes et standards pour les TICE Saint-Clément-les-Places.
Chercher et trouver Module 1 Déroulement : Souhaiter la bienvenue
Ressources web : évaluer leur validité et leur fiabilité... © Français et Informatique
BIO1530 Lab2 Littérature scientifique. Objectifs de lexercice Après avoir complété cet exercice, vous devriez être en mesure de: Déterminer si une publication.
Activité 6 : Les étapes d’une démarche de recherche efficace
École de bibliothéconomie et des sciences de linformation 1 Gestion de linformation électronique (GIE) Maîtrise en sciences de linformation EBSI Université.
La face cachée des systèmes de recherche Martin Bouchard, président Janvier 2003.
Solution Athena accès sémantique à linformation MATI Montréal, Avril 2012.
Sensibilisation a la modelisation
La bibliothèque électronique. Préambule. Dans tous les cas, tout se passe toujours à partir de la page d’accueil du site web des BU.
UN THESAURUS Pourquoi ? Pour qui ? Comment ?
La veille numérique : un outil pour s'informer intelligemment &
Littérature scientifique
UFD 62. EC2 : cours n° 3 Gestion Electronique des Documents Par : Sahbi SIDHOM MCF. Université Nancy 2 Equipe de recherche KIWI – LORIA
Les archives en ligne et l'histoire
Formation ADBS – septembre 2014 – 1 Approfondir son expertise en recherche d'information 3-4 & 5 septembre 2014.
Diaporama réalisé par Damienne PIN, Documentaliste Collège Barbara Hendricks 226 Rue du Limousin Orange LE PROBLEME DE LA QUALITE DE L ’INFORMATION.
OUTILS DE PARTAGE ET CLASSE DE FRANÇAIS Marie-France Laberge / Élyse Dion Plan d’action pour l’amélioration du français MELS André Roux RÉCIT _ Domaine.
LA GESTION DOCUMENTAIRE BTS Assistant de direction 2e année, Janvier 2007.
Science et technologie pour le préscolaire / primaire
Ministère de l’enseignement Supérieur et de la Recherche Scientifique
Recherche d’information
Techniques documentaires et veille stratégique Anne Pajard, avril 2008
Gallica 2 : Les pratiques collaboratives dans l’environnement d’une bibliothèque numérique et les développements web 2.0 de la BNF Rencontres 2008 des.
Le web 2.0 coopératif LES WIKIS.
Les principales approches d’organisation et D’accès aux ressources électroniques sur le Web Lalthoum Saàdani EBSI - Université de Montréal 32 è congrès.
Comment élaborer une politique documentaire ?
Se repérer et organiser sa veille dans la recherche en éducation Module 2 « Maîtriser l’accès aux ressources scientifiques en éducation » Introduction.
Cours n°1ue102.M1.com-ent(S. Sidhom) UE 102 (IUP.M1) Communication d’entreprise Infographie : TIC & communication d’entreprise Par : Sahbi SIDHOM MCF.
.Olivier Ertzscheid. Maître de Conférences..IUT La Roche sur Yon. Université de Nantes..Laboratoire DOCSI. La communauté comme.
Copyright, 1996 © Dale Carnegie & Associates, Inc. Com7114 Technologies de la communication Objectifs de ce cours ? Sa place dans le programme ? La communication.
France Bilodeau Bibliothécaire-conseil 19 octobre 2015 La recherche d’information en éducation.
Introduction Module 1.
RÉFÉRENCES SCIENTIFIQUES
Bibliothèque cantonale et universitaire de Fribourg Compétences documentaires pour étudiants – lundi 30 mai 2016 Recherche documentaire.
Bibliothèque Centrale de l’École Polytechnique La Recherche Documentaire Economie - HSS Session pratique Ressources Documentaires en Economie-Gestion Vanessa.
Bibliothèque Centrale de l’École Polytechnique Session pratique Recherches documentaires en sciences dures PSC 2013 septembre/octobre 2013 Denis Roura,
Compétences informationnelles Choisir ses sources Connaître les outils de repérage.
Transcription de la présentation:

comme une renégociation des espaces documentaires. Etude exploratoire des pratiques dindexation sociale

Gabriel Gallezot. Maître de Conférences Université de Nice - Sophia Antipolis Urfist PacaC. Laboratoire I3M (EA 3820) Olivier Ertzscheid. Maître de Conférences. Université de Nantes. IUT de la Roche sur Yon. Equipe CREC. Laboratoire DOCSI (Université de Lyon). Conférence DocSoc Document numérique et société Fribourg / Septembre 2006

Observations « Indexation sociale » / Folksonomies Impactent durablement les pratiques dIR (accès, représentation, recherche, navigation) Contexte redocumentarisation : caractériser documents « tertiaires » Posent la question dune transition vers web (socio-)sémantique. Hétérogénéité des contenus Massification/marchandisation des accès Communautarisation des pratiques Economie « sociale » des documents numériques Web/documenet public Web/document` privé Web personnel (Desktop) Web intime (Mail) Web extime (blogs)

Dérive des continents « documentaires » ? Web public Web privé Web personnel (Desktop) Web intime (Mail) Quoi ? Web publicWeb privé Web personnel (Desktop) Web intime (Mail) Web extime (blogs) Qui ? Web publicWeb privé Web personnel (Desktop) Web intime (Mail) Web extime (blogs) ? Pourquoi ? indexé non-indexé

Tectonique documentaire « Eclaire » communautarisation des pratiques « Correspond » –Nouvelle échelle, nouveaux formats, nouvelles volumétries –Acculturation aux outils et aux pratiques de marchandisation des accès –Processus global de redocumentarisation : « Comme dans la précédente modernisation, le document participe au processus et même y joue un rôle clé, mais il sest transformé au point que lon peut se demander sil sagit encore de la même entité » Archive foucaldienne « Par archive, jentends dabord la masse des choses dites dans une culture, conservées, valorisées, réutilisées, répétées et transformées. Bref toute cette masse verbale qui a été fabriquée par les hommes, investie dans leurs techniques et leurs institutions, et qui est tissée avec leur existence et leur histoire » Hypothèse : émergence dune « indexation sociale » correspond au besoin de traitement, dappropriation, de partage, de mise en représentation de ces nouvelles configurations informationnelles.

Définition « Folksonomies désignent –un processus de classification collaborative –par des mots-clés librement choisis –Ou le résultat de cette classification. » (Wikipédia)

thesaurus « vocabulaire normalisé sur la base de termes génériques et de termes spécifiques à un domaine »

ontologie « ensemble structuré de concepts. (…) organisés dans un graphe (…) relations sémantiques et de composition ou d'héritage. »

4 écoles dindexation Web Full-text => Balises Méta => Métadonnées Web Sémantique Folksonomies : indexation sociale communautaire Standardisation => Dublin Core => OAI-PMH Ontologies (Ingénierie des connaissances) ? ? Standardisation Linguistique de corpus

Folksonomie thesaurus ontologie « Folksonomies désignent –un processus de classification collaborative –par des mots-clés librement choisis –Ou le résultat de cette classification. » Vocabulaire non-normalisé, non-structuré, non-spécifique à un domaine, sans relations sémantiques ou hiérarchiques.

? Avantages = Inconvénients ? Point de vue de lInformation Retrieval –En amont : Indexation humaine, à la volée, instantanée, cumulative Facile / Rapide / –En aval : filtrage collaboratif (communautaire - del.icio.us, connotea -, thématique - technorati - orienté-support - flickR - …) Avantages « de surface » : –Simplicité, Rapidité, –Coût 0 Expertise 0, –Tous types dobjets (documents, livres, photos, couriels …) FLickR : ) –Adéquation aux usages / pratiques de lIR (onebox, oneword)

? Avantages = Inconvénients ? Inconvénients : les mêmes … –Trop simple, trop peu coûteux, trop peu dexpertise, trop dhétérogénéité + –Confusion entretenue (IR) entre pertinence (autorité) et popularité (photos les plus vues les plus tagguées et réciproquement) –polysémie, synonymie, lemmatisation, orthographe, langue, redondance, univers de référence (« peinture » et/ou « louvre », etc.) … ET POURTANT …

… ça marche ! Ya-t-il un intérêt ? –Du point de vue des utilisateurs ? OUI. Adhésion massive. Généralisation des pratiques. –Du point de vue de lhétérogénéité et de la masse des corpus décrits ? OUI. Efficace sinon pertinent (empiriquement … théorie évoquée plus loin) –Du point de vue de la facilitation et/ou de nouvelles modalités du processus dIR ? OUI. Sérendipité. Adhésion utilisateurs, gain de temps, gain déchelle, économie dexpertise … ==> Pourquoi ? Pérennité des pratiques ?

3 modèles « inadaptés » Au regard des nouveaux continents documentaires du web. Web (= contenus indexables) oxymorique : –Homogénéité des processus (tout est lié à tout - ou peut lêtre) –Hétérogénéité des contenus, des éléments liés (mail, photos de vacances, textes, sites, signets, etc.) Finalité (religion ?) de laccès : –Accès au document. Accès au partage. Accès à une communauté. –Gratuit. Instantané. Full-text => Balises Méta => Métadonnées Standardisation => Dublin Core => OAI-PMH Ontologies (Ingénierie des connaissances) Web/documenet public Web/document` privé Web personnel (Desktop) Web intime (Mail) Web extime (blogs)

Finalité de laccès et bibliothéconomie de masse. Bibliothéconomie de masse : –quel modèle ? Marchand ? Raisonné ? –Quelles logiques : qualitatives ? Quantitatives ? Librarything (5 millions douvrages) –Indexation « standard » : notice au format MARC, indexation DEWEY, LC "subjects headings », –+ indexation sociale : des tags associés, des fiches de lecture et revues de la communauté, système de recommandation –

Science et folksonomies Interface –Bibliothèque & Catalogue –communautaire scientifique ( –Partage de signets (del.icio.us, connotea) Les 2 écoles ou le meilleur des deux mondes. –Interface BdD (

Science et folksonomies

? Approches complémentaires ? Construire des ontologies « sur » des folksonomies ? Web Socio- Sémantique Folksonomies : indexation sociale communautaire Ontologies (Ingénierie des connaissances) ? ?

Folksonomies et moteurs (IR) Illustration de la « puissance dinterface » –Tagnautica : – ica.phphttp:// ica.php Héritage de la linguistique de corpus – util-le-nbuloscope.htmlhttp://aixtal.blogspot.com/2006/01/o util-le-nbuloscope.html Moteurs dédiés (technorati) Fonctionalité intégrée (MyYahoo)

Folksonomies et IR Interfaçage « idéal » de tous types de requêtage –Requêtes informationnelles Information « précise » ou dédiée. –Requêtes transactionnelles Réserver un billet davion. –Requêtes navigationnelles Vue densemble (cartographie, clusters) –Requêtes « interactionnelles » « Search partys », social bookmarking, tagging Le mot contre son absence

Les raisons du succès (1/5) : Une temporalité (ré?)unifiée entre interface et indexation Temps consultation temps de laccès temps de lindexation Micro-temporalités successives, parfois simultanées, jamais contraintes, sans préalables. Langages documentaires & formels (Thésaurus & ontologies) pour laccès à linformation : –Interfaces asynchrones. –Nbre textes > nbre dindexeur = temporalité interfaçage longue –acculturation à rebours (des novices vers lexpert) Folksonomies –Interface synchrone. Le temps de lindexation est le même que celui de laccès et du repérage. –Nbre documents < = nbre dindexeurs = temporalité interfaçage courte (simultanée) –Acculturation a priori.

Les raisons du succès (2/5) : La fonction symbolique plutôt que la vocation analytique. Vocation analytique des langages documentaires & formels : –classer physiquement et/ou conceptuellement selon la nature de lobjet –Univers de référence « construit » par lindexeur, lexpert et létat des connaissances au moment de lindexation –Approche « objective », logique ou logiciste Fonction symbolique Folksonomies : –repérer spatialement et/ou sémantiquement pour accéder et/ou représenter lobjet. –Univers de référence induit par lobjet lui-même et le rapport objet/indexeur –Approche « subjective », empirique, « essai et erreur »

Les raisons du succès (3/5) : la sagesse des foules « (…) N'importe qui peut déposer n'importe quel tag sur n'importe quelle photo. Mais - et c'est la clé - Flickr offre un retour sur les tags les plus utilisés et les plus populaires, et les gens souhaitant attirer l'attention sur leurs photos (...) apprennent rapidement à utiliser ce lexique si celui-ci fait sens. Cela rend le système étonnamment stable. Del.icio.us fait la même chose. Le succès de Google pour rendre les recherches plus pertinentes reposait sur la puissance de cette sagesse populaire (PageRank)... » Adam Bosworth, VP ingénierie chez Google. Postule lexistence pour tout élément donné (texte, image, document) dune série de mots et termes composant le plus petit lexique commun (concensus) permettant de décrire l'objet ou le document.

Les raisons du succès (4/5) : un faible coût cognitif Marquage élimine la phase de décision (choix de la bonne catégorie) Dissipe la phase de paralysie danalyse (choix du mot-clé) Permet lancrage en contexte socio-cognitif immédiat. –Google image labeller : Hiérarchie centrée document VS anarchie centrée utilisateur MAIS … Confirmation de laxiomatique du memex : –« human mind doesnt work that way » –« association » Emergence de patterns stables et auto-régulés

Les raisons du succès (5/5) : Auto-régulation ? Golder Scott A. & Huberman Bernardo A., « The Structure of Collaborative Tagging Systems », Information Dynamics Lab, HP Labs, Méthodologie –Site Del.icio.us –Sur une période donnée (5 jours) –Corpus : Les plus populaires (212 URL présents dans signets) Échantillon aléatoire de 229 usagers ayant partagé durant période test + tous leurs signets y compris hors-période ( signets)

Auto-régulation ? Résultats –7 types de tags : Thématiques (orientés sujet) / Nature de lobjet (article, blog, livre) / Propriétaire (auteur du signet) / adjectifs de caractérisation (drôle, stupide, horreur) / auto-référence (messignets, monnom …) / orientés tâche (à lire, recherche demploi) Plus on possède (= partage), plus on taggue –(avec fortes variations selon individus) Motifs stables dans la proportion et le choix des tags. –Plus une ressource est partagée, plus le nombre de tags la décrivant se stabilise ainsi que leur nature. Subjectivation des adjectifs de caractérisation savère pertinente du fait de son inscription dans une communauté.

Documents primaires, secondaires … TERTIAIRES Un document « tertiaire » est porteur dune triple hybridation : –Mécanismes dinscription ET de navigation –Synchronicité des temporalités de repérage, danalyse ET daccès –Babélisation des pratiques expertes (indexation), individuelles (tagging) ET communautaires (filtrage) Continent documentaire « unifié » (usages) Force tectonique : indexabilité. Folksonomies : –creuset de nouvelles pratiques sociales du document. –Impact durable (à étudier) sur pratiques dIR

Folksonomies comme … « ontologies sémiotiques » ? –« acteurs divers + –compétences hétérogènes impliquant recours à des classifications partagées par le collectif –et représentées explicitement dans linterface du système ». (Zacklad) Partie usages émergés web socio-sémantique : –« codétermination des usages informationnels et communicationnels » (Zacklad) –« à lintérieur de communautés de pratique »

… MeRci … ? QuEsTioNs ?

Confusion des pratiques informationnelles chercher communiquer Tagger / indexer organiser sorienterpartager google talk earth print orkut APIs Web/documenet public Web/document` privé Web personnel (Desktop) Web intime (Mail) Web extime (blogs)

Question dindexabilité Réunion dUnivers informationnels distincts Questionnent lindexabilité de cette « masse » selon troix axes/modèles : –Bibliothéconomique. Gestion et accès raisonné des/aux contenus. –Marchand (prime à laccès. Ex. de Google books) –Communautaire et à la volée : indexation sociale. –Copie nuage de tags sur le meur ou autre, sur mon blog, del.icio.us.

PERONOMIES : Kekseksa ? Le dernier de ces néologismes dont le web 2.0 est friand. Dans la lignée (inverse) des folksonomies, les personomies se définissent comme "mon environnement informationnel personnel. C'est l'environnement informationnel que j'ai construit dans le temps (...) et qui inclue mes contacts, mes achats, mes historiques de recherche, mes s, mes fils rss, mes commentaires sur les blogs, etc... » Nota Bene de 10 minutes plus tard : la socionomie n'est pas seulement un synonyme de "folksonomie" ou de "potonomie", elle est une théorie scientifique qui intégre "une nouvelle approche de l'économie politique en intégrant le comportement des agents économiques et la psychologie de masse.", comme l'indique la seule publication francophone dénichée sur le sujet. Mais il en est sûrement d'autres et des meilleures que vous aurez l'obligeance de me signaler en commentaires :-) En tout cas et sous-réserve d'approfondissement, il se pourrait bien que cette socionomie là soit le champ de recherche encadrant idéalement l'ensemble des études sur les moteurs de recherche et leurs implications cognitives et sociétales. Et hop, une chaire de socionomie ! Comme un écho à celle d'intelligence collective initiée par Pierre Lévy.

Avantages folkso Taux de rappel (TR) nombre de documents pertinents retournés divisé par le nombre de documents pertinents existants. Taux de précision (TP) nombre de documents pertinents retournés divisé par le nombre de documents retournés. Mesures non adaptées : –nature des corpus (sites dactualité, taguage uniforme : « 11 Septembre »). Taux de recouvrement non-mesurable entre sites communautaires : tags sous del.icio.us, ne sont pas tags sous technorati ou sous MyYahoo!, et documents sont également différents. Juger de la pertinence des folksonomies dans un processus dIR réclamerait lajout de nouvelles métriques : –Taux de partage (nbre de doc. Pertinents par rapports aux nobre de documents partagés) –Taux de partage optimal (nbre de doc. Pertinents par rapports aux nombre de documents les plus partagés)

Les trois âges documentaires –Web 0 : ce qui est publié (navigateurs) –Web 1.0 : ce qui est accédé (moteurs) ou indexé pour être accédé. Ceux qui indexent (bots) nétant pas ceux qui accèdent (users) –Web 2.0 : ce qui est indexé pour être accédé pour/par/dans une communauté dusagers-indexeurs.