Le catalogue de bibliothèque comme outil de filtrage collaboratif Sébastien Tremblay et Yves Marcoux <GRDS> École de bibliothéconomie et des sciences de l'information Université de Montréal Ce projet a bénéficié d'une subvention de recherche du FCAR Présentation des conférenciers par Madame Suzanne Rousseau-Dubois, animatrice de l’atelier. Merci infiniment Madame Rouleau-Dubois. Si vous le voulez bien, nous allons maintenant débuter la présentation.
Plan de la communication Introduction et justification de la problématique État de la question sur les systèmes de recommandation Défis soulevés par les systèmes de recommandation Modèle de système de recommandation pour les milieux documentaires Voici donc le plan de l’exposé d’aujourd’hui. Il se divisera en 7 parties. Premièrement, nous allons commencer par présenter le contexte d’émergence des systèmes de recommandation, contexte qui s’enracine dans les profondes mutations que l’avènement du Web a engendré notamment dans la recherche d’information. Deuxièmement, nous allons vous dresser un bref portrait des systèmes de recommandation en général, afin que vous saisissiez ce que sont ces systèmes, quelles sont leurs utilités de même que leurs modes de fonctionnement et quels en sont les types qui existent présentement. Troisièmement, suite à la synthèse, certaines limitations des systèmes actuels seront soulignées et nous énoncerons quelques directions futures à prendre afin d’améliorer ces outils. Quatrièmement, nous allons proposer un modèle général de système de recommandation que nous croyons adapté aux besoins précis des bibliothèques et centres de documentation et qui favorisera une utilisation maximale des données actuellement disponibles dans ce genre de milieu, que ce soit les données bibliographiques ou d’autorités, les données de prêt, les dossiers d’usagers, etc. Par ailleurs, nous allons vous décrire le fonctionnement du système que nous suggérons en insistant sur les différentes techniques de correction d’erreurs que nous avons adopté pour en faire un modèle performant.
Plan de la communication - suite Le système de recommandation comme outil de gestion de bibliothèque Conclusion et ouverture sur des travaux futurs En cinquième lieu, nous allons démontrer comment le système de recommandation, en plus de faciliter le processus de sélection de ressources documentaires par l’usager, pourrait servir à la gestion des activités courantes de la bibliothèque, notamment dans le développement de la collection et dans les études sur les usagers, et ainsi contribuer à améliorer la qualité des services dispensés à la clientèle. Nous allons enfin terminer par quelques pistes à suivre afin d’implanter le modèle que nous avons avancé dans un prototype fonctionnel, puis nous allons simplement conclure. Évidemment, vous serez invités, à la fin de notre exposé, à poser des questions ou à simplement réagir à notre propos.
Introduction et justification de la problématique Mutations de la publication, de l'organisation, de la recherche et de la sélection de l'information sur le Web Explosion de l'information Prolifération de ressources de formats divers Limites des engins de recherche et des répertoires Besoins d'information hétérogènes et compétences documentaires variables des usagers : un autre obstacle majeur
Introduction et justification de la problématique - suite La personnalisation des systèmes : une des approches envisagées Comment enrayer l'Information overload? Les systèmes de recommandation comme outil d'aide à la sélection de ressources Permettre aux usagers de bénéficier des opinions de leurs pairs Spécifier des paramètres personnels Nombreux projets sur Internet actuellement: MovieLens, Amazon.com
Introduction et justification de la problématique - suite L'utilisation massive d'Internet par les usagers des bibliothèques a façonné leurs manières d'accéder à l'information Impact sur l'utilisation des catalogues de bibliothèque: Intégration des ressources du Web dans le contenu L'OPAC est donc devenu un portail d'information
Introduction et justification de la problématique - suite Prochain pas à franchir: faire de l'OPAC un portail collaboratif Permettre que s'échangent des idées entre usagers Favoriser le transfert des connaissances Faciliter la sélection de l'information et automatiser le processus
État de la question sur les systèmes de recommandation Définitions: Peter R Wurman A system to provide recommendation to a user based on the opinions/behaviours of others Shardanand et Maes A technique for making personnalized recommendations from any type of database to a user based on similarities between the interest profile of that user and those of others
État de la question sur les systèmes de recommandation - suite Rôles d'un système de recommandation: Suggérer des ressources Inférer les goûts et intérêts des personnes Exploiter diverses sources de données explicites ou implicites pour y parvenir Prédire l'information intéressant les usagers
État de la question sur les systèmes de recommandation - suite Dresser des liens non-manifestes entre des ressources, ce qui permet d'enrichir la recherche en élargissant les perspectives documentaires Trois approches préconisées Filtrage par contenu Filtrage collaboratif Approche hybride
Le filtrage par contenu La plus ancienne approche But : établir une corrélation entre les ressources que les usagers consultent Fonctionnement : le système analyse le contenu des ressources, puis effectue des recommandations Avantages : Approprié pour du matériel textuel Facilite l'entrée d’un nouvel item dans le système
Le filtrage par contenu - suite Désavantages : Difficulté d'extraire le contenu ou les attributs de certains formats de fichiers Peu apte à recommander des items dissemblables Cold start Aucun aspect collaboratif dans cette approche
Le filtrage collaboratif Approche plus récente But : établir une corrélation entre les usagers (leurs profils) Postulat : l'usager apprécie des items semblables à ceux que des usagers comparables apprécient aussi Approche subjective : basée sur des jugements de valeur
Le filtrage collaboratif - suite Individus = intermédiaires entre les sources d'information Avantages : Capacité de recommander des items dissemblables Utilisation pour des formats variés de ressources Capacité de représenter des concepts abstraits comme les goûts ou les intérêts Cold start plus limité
Le filtrage collaboratif - suite Désavantages : L'ajout de nouveaux items est problématique: doit avoir été évalué avant d'être suggéré Nécessite un nombre suffisant d'évaluations et d'usagers Problème de dispersion des scores Difficulté à gérer les profils atypiques
L'approche hybride But : combiner les forces du filtrage par contenu et du filtrage collaboratif Plusieurs scénarios de fonctionnement Scénario typique : Le système dresse le profil de l'usager en analysant ses ressources Le système tente d'associer le profil de l'usager avec ceux de d'autres (constitution de groupes)
L'approche hybride - suite L'usager a la possibilité de dresser un profil explicite et de spécifier certains paramètres Le système effectue de façon combinatoire le filtrage par contenu et le filtrage collaboratif Approche dominante à l'heure actuelle
Défis soulevés par les systèmes de recommandation Incompréhension du fonctionnement du système Expliquer d’où viennent les recommandations: Expliciter les méthodes de compilation du profil de l'usager L'usager doit pouvoir réagir aux recommandations (correction d'erreurs) Mesures de sécurité et protection des renseignements personnels
Systèmes de recommandation Permet de proposer des ressources à des usagers selon divers critères: Situation démographique de l'usager (âge, sexe, lieu de résidence, revenu, etc.) Popularité globale d'une ressource Nouveauté de la ressource Habitudes de "consultation" de l'usager Etc.
Recommandation en milieux documentaires Référence Présentoir de nouveautés Affichage de critiques publiées "Coups de cœur" Chariots de rangement etc.
Réticence à la recommandation Neutralité, professionnalisme Réticence à la publicité Remise en question par les nouveaux contextes économiques Marketing des services d'information Continuum entre modèles économiques Gestion stratégique de l'information La réticence à la recommandation a toujours été implicitement en contradiction avec les missions de référence et de développement des collections. Cette contradiction est très explicite maintenant.
Filtrage collaboratif Technique particulière de recommandation Prédire automatiquement l'appréciation d'une ressource via l'opinion d'usagers de même "profil" Nouveau en milieux documentaires Forme "non intrusive" de recommandation N'est PAS que de la diffusion sélective de l'information (DSI) Convient bien au contexte d'un catalogue de bibliothèque
Principe de base 1: prédiction u1 u2 um X 1 ? r1 r2 r3 rn
Principe de base 2: recommandations À partir des prédictions, identifier les N ressources le plus susceptibles de correspondre aux besoins d'un usager Un seuil peut être appliqué pour éliminer les recommandations non pertinentes
Différentes approches Basées usagers Regroupent les usagers Basées ressources Regroupent les ressources Hybrides
Données exploitables en bibliothèque Données "démographiques" des usagers Vedettes-matières associées aux ressources Historiques de prêt Notices d'autorité d'auteurs et de sujets Avec la permission de chaque usager!
Nouvelles données possibles Profil d'intérêt explicite par l’usager Profil implicite (historique des recherches et transactions) Appréciations explicites de ressources par les usagers Toujours avec la permission de chaque usager!
Modèle de système de recommandation pour les milieux documentaires
Types de manifestations du système Recommandations "spontanées" (au branchement de l'usager) Enrichissement ou réordonnancement des résultats d'une recherche (utile si ressources non disponibles) Recherche est par ailleurs "classique" Utilisation des recommandations sur une base volontaire
Architecture générale Appréciations Profil démogr. Groupe Corrélations VM Profil d'intérêt Profil de groupe Appréciations enrichies
Architecture générale Catalogue Appréciations enrichies Recherche Profil d'intérêt Résultats Recommandations spontanées Résultats enrichis Réaction de l'usager
Moments d'intervention du système Inscription d'un nouvel usager Mise à jour du profil explicite d'un usager Réception d'un élément d'appréciation d'une ressource par un usager Insertion d'une nouvelle ressource Recommandations spontanées et à la recherche (enrichissement, ordon.) Réaction à une recommandation
Scénario de branchement Recommandations spontanées Modification du profil Participant / non-participant Données démographiques accessibles au système Profil d'intérêt explicite Types de manifestations désirés Appréciation des ressources retournées depuis le dernier branchement
Le système de recommandation comme outil de gestion de bibliothèque Applications indirectes Gestion de la collection Identification des secteurs populaires et impopulaires de la collection Recommandations d'acquisition / abonnement Recommandations d'élagage Base pour études d'usagers (Community analysis)
Conclusion et ouverture sur des travaux futurs Définir plus à fond le modèle théorique Prototypage Expérimentations (fonctions, ergonomie, etc.) Implantation
Conclusion et ouverture sur des travaux futurs - suite Rôle de "guide" dans la masse d'information Fonction de référence se virtualise Possibilité d'intégration forte avec la collectivité via la recommandation Le bibliothécaire comme usager - avec un statut particulier
Merci de votre attention ! Nous rejoindre Yves Marcoux yves.marcoux@umontreal.ca Sébastien Tremblay saccard@hotmail.com