.Olivier Ertzscheid. Maître de Conférences..IUT La Roche sur Yon. Université de Nantes..Laboratoire DOCSI. La communauté comme indexeur
Définition « Folksonomies désignent –un processus de classification collaborative –par des mots-clés librement choisis –Ou le résultat de cette classification. » (Wikipédia)
≠ thesaurus « vocabulaire normalisé sur la base de termes génériques et de termes spécifiques à un domaine »
≠ ontologie « ensemble structuré de concepts. (…) organisés dans un graphe (…) relations sémantiques et de composition ou d'héritage. »
Folksonomie ≠ thesaurus ≠ ontologie « Folksonomies désignent –un processus de classification collaborative –par des mots-clés librement choisis –Ou le résultat de cette classification. » Vocabulaire non-normalisé, non-structuré, non-spécifique à un domaine, sans relations sémantiques ou hiérarchiques.
5 étapes d’indexation Web Communauté de pratique Web Sémantique FOLKSONOMIES Communauté D’usage DUBLIN-CORE OAI-PMH Communauté Métier / Ressources ONTOLOGIES Communauté compétences (Outils + métier) ? ? Standardisation Linguistique de corpus GOOGLE PageRank « Indexeurs sans le savoir »
Dél.icie.uses folksonomies
Qui indexe ? Usagers, Consommateurs, Producteurs, Auteurs, Novices, Experts. Textes Docs de travail Articles scientifiques Billets de blogs Photos Vidéos A moi Aux autres A la volée En surface En profondeur (deep tagging) En connaissance de cause Au hasard Pour moi (tags privés) Pour les autres (tags publics) Organiser, Partager, Chercher, Retrouver Associer, « Participer » Quoi ? Pourquoi ?Comment ?
? Avantages = Inconvénients ? Indexation humaine, à la volée, instantanée, cumulative, simple, rapide, gratuite Intérêt d’un filtrage collaboratif gain de temps, gain d’échelle, économie d’expertise (masse critique des indexeurs) … Couverture documentaire totale (documents, livres, photos, couriels, cartes géographiques …) Conforme aux usages (onebox, oneword) Trop simple, trop peu d’expertise, trop d’hétérogénéité Confusion entretenue entre pertinence (autorité) et popularité (photos les plus vues les plus tagguées et réciproquement) polysémie, synonymie, lemmatisation, orthographe, langue, redondance, univers de référence (« peinture » et/ou « louvre », etc.) = Méta-bruit
? Avantages = Inconvénients ? « Folksonomist are confusing cataloging structure with personal opinions (…). These are not the same thing and they need to be separated. » Non. Ils se servent (à dessein) de leurs opinions personnels comme d’une structure d’indexation. Sur le processus de classification : oui, sont plus floues, plus polysémiques, plus imprécises. Mais sur les objets ? –Qui va se lancer dans une entreprise de classification aristotélicienne des photos de vacances de personnes sur FlickR ? –Doit-on décider qu’elles sont inclassables ??
Les raisons du succès 1.Temporalité réunifiée entre interface et indexation 2.La fonction symbolique plutôt que la vocation analytique. 3.Sagesse des foules 4.Auto-régulation 5.Faible coût cognitif 6.(enfin une) Indexation orientée-tâche
Folksonom’IST & Bibliothèques –Indexation « standard » : notice au format MARC, indexation DEWEY, LC "subjects headings », –+ indexation sociale : des tags associés, des fiches de lecture et revues de la communauté, système de recommandation Bibliothèque & Catalogue Intégration dans SIGB –(open source ou propriétaires) Bibliothéconomie « de masse » ?
Folksonom’IST & Bases de données Meilleur des deux mondes ?
Folksonom’IST & communautés scientifiques Postgenomic.com Repérage de signets IST (CiteUlike) Folksonomies présentes partout –(accès, repérage, commentaire des ressources IST)
Folksonom’IST & Moteurs Plusiers « écoles » –Moteurs dédiés (technorati.com) –Fonctionalité intégrée (MyYahoo) –Illusion folksonomique (cloud.clusty.com)
Vers des modèles hybrides ? Amazon : « Collaborative structured tagging » = Amapedia Tags factuels –TagFactuel : valeur1, Valeur2, Valeur3... Tags catégoriels –Relation « is a » –Relation « like … » –Relation « partage des attributs essentiels »
Vers des modèles hybrides FlickR (& bientôt) Del.icio.us : « Machine Tags » flickr:user=straup flora:tree=coniferous medium:paint=oil geo:cartier="plateau mont royal" geo:neighbourhood=geo:cartier Nom : attribut = valeur.
Intérêt « fusionnel » Exporter … Vers un site collaboratif communautaire (del.icio.us) Des (méta)données documentaires (HubMed)
Problématiques ouvertes « indexabilité » de l’actuelle masse documentaire (dans laquelle tout est document, y compris … nous) Bibliothéconomie de masse Horizon de l’indexation : –Question n’est plus celle de l’autorité (qui a autorité pour indexer) –ni même de l’expertise (qui a compétence pour indexer), –mais celle de l’usage (qui a besoin d’indexer).
Conclusion … «It is neither Pandora’s box not panacea. Social tagging highlights the interstices of authorship, intertextuality, and context in indexing, and asks us to fill in the gaps. It is a catalyst for improvement and innovation in indexing. » –Joseph T. Tennis. Social tagging and the next stpe for indexing. 17th SIG/CR Classification Research Workshop, Novembre 4, La communauté comme indexeur a son rôle à jouer. Pour aller vers un juste milieu entre folksonomie débridée et rigidité taxonomique
… MeRci … ? QuEsTioNs ?
Deep tagging