Réseaux de lecteurs et outils de médiation ENSSIB – Mars 2014
Analyse de la prescription de livres en ligne La recommandation automatisée de lecture Lenrichissement dOPAC en contenus 2.0 Un réseau de lecteur : mécanique et contenus Réseaux de lecteurs et outils de médiation
Analyse de la prescription de livres en ligne La recommandation automatisée de lecture Lenrichissement dOPAC en contenus 2.0 Un réseau de lecteur : mécanique et contenus Réseaux de lecteurs et outils de médiation
Premier site français sur le livre lecteurs membres partagent leurs lectures, critiques et citations 1,8 million de visiteurs chaque mois consultent les notices enrichies du site à la recherche de leur prochaine lecture Première communauté de lecteursSite numéro 1 en trafic 12
La communauté des grands lecteurs (Source : Enquête de lectorat Babelio – juin 2011) 5 Lecteurs lisant plus dun livre par mois 96%16% de la communauté Babeliode la population française lecteurs membres Une communauté de très grands lecteursEn tous genres
6
7
8 Une notice enrichie avec les informations bibliographiques de base et…
critiques de lecteurs Plus de 500 nouvelles par jour
La labellisation externe : critiques de la presse généraliste et spécialisée 10 Encore besoin des vieilles autorités littéraires
vidéos de partenaires (médias, INA, éditeurs etc.) associés aux auteurs 11
1500 listes éditoriales communautaires 12
7 000 podcasts littéraires 13
Analyse de la prescription de livres en ligne La recommandation automatisée de lecture Lenrichissement dOPAC en contenus 2.0 Un réseau de lecteur : mécanique et contenus Réseaux de lecteurs et outils de médiation
15 … origine de la majorité des découvertes de livres Au moins une part importante de mes lectures Pour 79,3 % des lecteurs Une faible part de mes lectures Pour 21% des lecteurs Question : Diriez-vous que le bouche à oreille vous fait découvrir Une part très importanteUne part importante Une faible part Une part nulle … de mes lectures La totalité Base lecteurs Babelio (942 int.)
16 Les auteurs les plus découverts par bouche à oreille Encore plus jeune… Pourriez-vous citer entre un et trois auteurs que vous avez découverts par bouche à oreille? Top 30 des auteurs, classés par nombre doccurrences 1° Haruki Murakami 2° Maxime Chattam 3° Franck Thilliez 4° Suzanne Collins 5° Jean Teulé 7° Robin Hobb 6° Katherine Pancol 8° Guillaume Musso 9° Joël Dicker 10° Carlos Ruiz Zafon 11° Eric-Emmanuel Schmitt Et du 12° au 30° : George R R Martin, Katarina Mazetti, Stephenie meyer, Stieg Larsson, David Foenkinos, Henning Mankell, Ken Follett, Carole Martinez, Mary Ann Shaffer, Stefan Zweig, Anna Gavalda, Camilla Lackberg, Fred Vargas, Marc Levy, Delphine de Vigan, Amélie Nothomb, Barbara Constantine, Bernard Werber, Harlan Coben
17 Une forte présence des auteurs de genre Encore plus jeune… 1° Haruki Murakami 2° Maxime Chattam 3° Franck Thilliez 4° Suzanne Collins 5° Jean Teulé 7° Robin Hobb 6° Katherine Pancol 8° Guillaume Musso 9° Joël Dicker 10° Carlos Ruiz Zafon 11° Eric-Emmanuel Schmitt Et du 12° au 30° : George R R Martin, Katarina Mazetti, Stephenie Meyer, Stieg Larsson, David Foenkinos, Henning Mankell, Ken Follett, Carole Martinez, Mary Ann Shaffer, Stefan Zweig, Anna Gavalda, Camilla Lackberg, Fred Vargas, Marc Levy, Delphine de Vigan, Amélie Nothomb, Barbara Constantine, Bernard Werber, Harlan Coben
18 Des best-sellers de littérature générale 1° Haruki Murakami 2° Maxime Chattam 3° Franck Thilliez 4° Suzanne Collins 5° Jean Teulé 7° Robin Hobb 6° Katherine Pancol 8° Guillaume Musso 9° Joël Dicker 10° Carlos Ruiz Zafon 11° Eric-Emmanuel Schmitt Et du 12° au 30° : George R R Martin, Katarina Mazetti, Stephenie meyer, Stieg Larsson, David Foenkinos, Henning Mankell, Ken Follett, Carole Martinez, Mary Ann Shaffer, Stefan Zweig, Anna Gavalda, Camilla Lackberg, Fred Vargas, Marc Levy, Delphine de Vigan, Amélie Nothomb, Barbara Constantine, Bernard Werber, Harlan Coben
19 Des nouveaux auteurs découverts au premier roman 1° Haruki Murakami 2° Maxime Chattam 3° Franck Thilliez 4° Suzanne Collins 5° Jean Teulé 7° Robin Hobb 6° Katherine Pancol 8° Guillaume Musso 9° Joël Dicker 10° Carlos Ruiz Zafon 11° Eric-Emmanuel Schmitt Et du 12° au 30° : George R R Martin, Katarina Mazetti, Stephenie meyer, Stieg Larsson, David Foenkinos, Henning Mankell, Ken Follett, Carole Martinez, Mary Ann Shaffer, Stefan Zweig, Anna Gavalda, Camilla Lackberg, Fred Vargas, Marc Levy, Delphine de Vigan, Amélie Nothomb, Barbara Constantine, Bernard Werber, Harlan Coben
20 Au-delà du top 30 : la longue traîne du BO 1157 auteurs découverts
21 Davantage de bouche à oreille positif que négatif Il y a davantage de critiques de livres très positives que très négatives Comparatif sur la base des critiques Babelio associées à une note de 5/5 (positive) ou 1/5 (négative)
22 Le BO sert plus à qualifier quà disqualifier un livre Les critiques positives sont jugées plus utiles que les critiques négatives x 3,5 x 2,2
Analyse de la prescription de livres en ligne La recommandation automatisée de lecture Lenrichissement dOPAC en contenus 2.0 Un réseau de lecteur : mécanique et contenus Réseaux de lecteurs et outils de médiation
Bookrank : algorithme de rapprochement de livres 24 (Source : Google Analytics, mars 2012) Statistique, sémantique, sociologique, Algorithmique? Refaire société Vivre la fin des temps Après la crise Capitalisme Désir et serviture La fabrique de Lhomme endetté
Application : le moteur de recommandation personnel…
Application : le moteur de recommandation thématisé
Application : le moteur de recommandation justifié
Quelles difficultés? 28 1 Pertinence qualitative 2 Pertinence quantitative 3 Arbitrage sensibilité/précision Ex : GEB => Musique ? Logique? Intelligence artificielle? Ex : Favoriser la longue traîne? Rousseau => Voltaire ou Bachofen Prendre des risques?
Quelles difficultés? 29 4 Data sparsity 5 Scalabilité algorithmique 6 Performance Qualification dun nouvel entrant Livre avec peu dinfos/nouveautés Robustesse aux changements déchelle membres 2 millions de titres 3 millions de métadonnées …
Des problématiques propres au livre Répétition dauteur Répétition de série/collections Thématiques semi-structurées Titre de Kundera => Titre de Kundera? Gallimard Noire => Gallimard Noire ? BD/Essai/Roman … Besoin de mesurer les présupposés cognitifs du lecteur
Deux champs de R&D 31 Collecte et traitement de métadonnées Algorithme de ranking user/book centric Prime aux réseaux sociaux : captation de données Nouveaux enjeux : structuration de métadonnées
Métadonnées qualifiées 32 1 Métadonnées dusage (Source : Google Analytics, mai 2012) Lectures Notes Clics Visites Taux dajout, Etc. 2 Métadonnées descriptives 3 Métadonnées non structurées Critiques Extraits Résumés Titres 4 Métadonnées structurées Taxinomie Date Nationalité Ontologie, etc.
Exemples de traitements de métadonnées 33 Association des inflexions linguistiques : {roman, romans} Association derreurs orthographiques : {cuisine, cuisne} Association synonymique : {deuxième guerre mondiale, ww2} Association thématique de premier ordre : {roman policier, polar et roman noir} Algorithmie classique / Statistique Notation explicite/implicite Clusters de populations Corrélation statistique Analyse qualitative prédictive Traitements sémantiques
Traitement documentaire assisté 34 (Source : Google Analytics, mai 2012)
Clusterisation algorithmique 35 (Source : Google Analytics, mai 2012)
Algorithmes de filtrage 36 1 Filtrage collaboratif (Source : Google Analytics, mai 2012) Importance des notes, clusters de lecteurs «philosophie» => Musso «philosophie» => Schopenhauer Dimension temporelle 2 Filtrage CB 3 Réseau neuronal Feedback pertinence Identification des effets de bords Algorithmes autocorrectifs
Analyse de la prescription de livres en ligne La recommandation automatisée de lecture Lenrichissement dOPAC en contenus 2.0 Un réseau de lecteur : mécanique et contenus Réseaux de lecteurs et outils de médiation
Un service de
39 Un catalogue sans Babelthèque
40 5.Critiques de professionnels 3.Recommandations de lecture précises sur titres 2.Consultation et ajout de citations 6.Notes dinternautes 7.Vidéos et podcasts dauteur (entretiens, bandes-annonces etc.) 7.Vidéos et podcasts dauteur (entretiens, bandes-annonces etc.) 1. Consultation et ajout de critiques 4.Etiquettes de classement, avec navigation dans le catalogue Un catalogue avec Babelthèque
Les critiques de Babelio et dusagers Fenêtre daffichage des critiques de Babelio et dusagers LOPAC ne sera jamais un espace de contribution
42 La mise en avant des critiques de nouveautés Pour mettre en valeur les acquisitions et lenrichissement du catalogue Un module pour afficher sur le portail les critiques des dernières acquisitions
Un outil de navigation et de découverte utilisant le langage des usagers étiquettes en janvier 2014 La zone étiquettes associées La zone « livres portant cette étiquette » Traitement documentaire et algorithmique des étiquettes pour améliorer la qualification des œuvres et la navigation dans le catalogue Identification des étiquettes thématiques proches Les titres de votre catalogue portant cette étiquette Les étiquettes navigables de classement
44 Extrait de la convention entre Babelio et la bibliothèque « En cas de cessation du service Babelthèque, la Bibliothèque Contractante pourra obtenir sur demande une copie sous format Excel de lensemble des contenus saisis par les usagers dans lOPAC de la Bibliothèque Contractante via Babelthèque. La licence relative à ces contenus concédée à Babelio sera alors transférée à la Bibliothèque Contractante » 2 - La bibliothèque reste propriétaire des contenus générés dans lOPAC 1 - Intégration transparente, en marque blanche Sans logo Babelio, sans liens indésirables 3 - Vos usagers contribuent directement dans lOPAC Sans avoir besoin de sinscrire sur Babelio Intégration transparente et contrôlée
Testez Babelthèque dans les catalogues de Nîmes et de Toulouse Limonov, dEmmanuel Carrère, à Toulouse 45 Portugal, de Cyril Pedrosa, à Nîmes Découvrir Babelthèque