On the recommending of citations for Research Papers

Slides:



Advertisements
Présentations similaires
M. Bétrancourt et C. Rebetez - Méthodologie expérimentale Diplôme MALTT Année La méthodologie expérimentale Fondements et bases d’application.
Advertisements

1 Etude Statique sur l’axe horizontal du berce BB.
L’accès aux services de réadaptation et l’impact sur la santé et sur les pratiques Bonnie Swaine pht. Ph.D. Prof. Prog. de physiothérapie, École de réadaptation,
Outils et scénarios d’édition collaborative en Haute École Étienne Vandeput Projet HETICE © CRIFA - ULg.
Nouveau programme de 3ème Probabilités Document de travail – Académie de Rouen
Intégration et usages innovants de la vidéo dans les pratiques pédagogiques en Economie et Gestion. Réunion du 11 mars 2016 – Usages numériques et TRAAM.
La recherche.
Cahier des charges.
LES PRATIQUES D’EVALUATION EN SVT DEFINITIONS OBJECTIFS MODALITES
Recherche Summon - HINARI (Module 3)
LOG2420 – Automne 2016 Chargé de cours : Mathieu Laprise
Plan la séance 6 L’offre de service et l’entente contractuelle
Le rapport de laboratoire
Discussion de cas d’alcoologie
ELABORER UN CAHIER DES CHARGES Formuler une préconisation
Le commentaire de document(s)
07/05/2018 École de bibliothéconomie et des sciences de l'information
L’essentiel à retenir BUDI - Vision partenaires
Trois démarches pédagogiques complémentaires et imbriquées
Formation Classe Inversée
IFT 615 – Intelligence artificielle Recherche heuristique
Veille technologique Nassima Mahcer 17 MAI 2017.
04/06/2018 École de bibliothéconomie et des sciences de l'information
Plans d’expériences: Plans factoriels
FARAH.Z "Cours sécurité1" /2016
Tableau de bord des risques
E.DUVELSON, Y. BOUNOUARA, D. LEGROS
INTELLIGENCE ARTIFICIELLE
Des opportunités À découvrir Présentation aux journées annuelles de santé mentale. Roger Paquet Mai 2015.
3 MOIS DE FORMATION 1 MOIS DE STAGE EN ENTREPRISE prÉsentation …
Démarche d'investigation
Exploiter le Web Etape 2.
Rapport de laboratoire
Formation sur les bases de données relationnelles.
QUELQUES BONNES PRATIQUES FACILITANT L’ACCES
USER GUIDE : BASE DE DOCUMENTATION
Résultats PISA 2006 Quelques éléments
L’évaluation des dépenses fiscales
Comment lire et écrire un article scientifique
Modélisation objet avec UML
Organisation et évaluation
Information sur survies des patients en dialyse péritonéale, en France métropolitaine dans le RDPLF Année 2016.
Consignes pour une communication orale
Design et fabrication de kit constructif
Lois de Probabilité Discrètes
LE processus d’enquête
Filtrage collaboratif (Système de recommandation)
Bilan de projet pour [Nom du projet]
Affichage et tri des résultats
SCI6304 – Bibliométrie et communication savante Cours 10 Les réseaux
L’écriture d’un article scientifique
Un Mécanisme d‘Adaptation Guidé par le Contexte en Utilisant une Représentation par Objets Manuele Kirsch Pinheiro Laboratoire LSR – IMAG, Équipe SIGMA.
Rapport sur le projet [Nom du projet]
Reconnaissance de formes: lettres/chiffres
Présenté par: Souleymane MOUSSA Encadré par: M’hammed SAHNOUN
7- Nouveaux services pédagogiques pour les élèves
Grilles de communication et ECOS Checklist ou score global?
Démarrage du projet Préparer les fonds de plan
Quoi regarder dans un graphique des moyennes ?
Efficacité des jobs CMS en 2010
Panorama of Recommender Systems to Support Learning
Content-Boosted Collaborative Filtering for Improved Recommendations
INTELLIGENCE ARTIFICIELLE
Recrutement de Collaborateurs Commerciaux
STS Web Services libres Gérer les services libres
Evaluation partenariat: Organisation X + organisation Y
Les 4 dimensions de la lecture
Projet de fin d’études – Semestre 10
Gestion des destinataires (recipients)
Le droit de vote au fil du temps
Transcription de la présentation:

On the recommending of citations for Research Papers - Revue de Lecture - Présenté par Mikaël Perreault École Polytechnique Montréal 19 septembre 2017

Plan de la présentation Objectifs de l’article « Citation Web» Nomenclature (article vs citation) et hypothèses Approches explorées et algorithmes Méthodologie expérimentale Résultats et discussion Conclusion et suggestion de travaux futurs Recommending Research Papers Polytechnique Montréal

Objectifs, « citation web» et nomenclature But, problème et hypothèses Impulse Polytechnique Montréal

Objectifs Explorer l’usage de filtres collaboratifs (FC) pour recommander des citations pour plusieurs scénarios Utilisation d’une méthode qui ne souffre pas de problèmes de « cold start» (création peu d’utilisateurs aucun vote) Recommending Research Papers Polytechnique Montréal

« Citation Web» Se dit du réseau social formé par le graphe des citations Pour un article visé : quels articles le citent + quels articles sont cités Suppression du probème de « cold start» en populant le FC avec ces données Disponibles sur ResearchIndex (l’algorithme déjà en place est limitant) Recommending Research Papers Polytechnique Montréal

Hypothèse Les systèmes de recommandation, surtout ceux basés sur du FC, vont découvrir des relations plus puissantes dans la « Citation Web» que les méthodes existantes (ResearchIndex+Google) Recommending Research Papers Polytechnique Montréal

Nomenclature citations vs articles Citation : référence quelconque (on peut posséder le texte complet ou non) Article : citation dont nous avons accès au texte complet, y compris les citations de cet article Un article peut exister sans être considéré comme une citation (pas assez d’informations sur auteurs, date, statut) Recommending Research Papers Polytechnique Montréal

Approches explorées Tentatives, méthode sélectionnée, algorithmes Impulse Polytechnique Montréal

Approches tentées Classique Utilisateur-Item; U=auteur, I=citation « cold start» On choisit de miner directement la « Citation Web» Même approche, mais matrice de vote populée par la «Citation Web» : problème de généralisation (ex: Ben Shneiderman) et sérempidité non voulue dans le domaine Recommending Research Papers Polytechnique Montréal

Approche utilisée Utilisateur = Article, Item = citation Les articles « votent» pour les citations qu’ils contiennent, vote guidé par la « Citation Web» (population statique) Input : Lot de citations (citations présentes dans un article visé) Output: Liste ordonnée de citations recommandées (ne peut recommander des citations du lot initial) Recommending Research Papers Polytechnique Montréal

Algorithmes testés 1) Co-citation matching 2) User-Item CF Item-Item CF Naïve Bayesian Classifier Localized Citation Graph Search (Baseline) Keyword Search Google (Baseline) Recommending Research Papers Polytechnique Montréal

Méthodologie expérimentale, résultats et discussion Expérience offline/online Impulse Polytechnique Montréal

Expérience offline Pour chaque article, on retire aléatoirement une citation On vérifie si l’algorithme est capable de prédire la citation Limitations : Aucune garantie qu’il n’existe pas des citations plus pertinentes que celle enlevée. 5 des 6 algorithmes sont testés (sauf Google, car trop demandant en ressource) Recommending Research Papers Polytechnique Montréal

Métriques Rang: position de la citation test dans la liste de recommandation (précision) Couverture : % des cas où l’algorithme a été capable de fournir une recommandation incluant la citation test (rappel) Rang Effectif : Pénalité sur la couverture si le rang est en deçà d’un certain niveau (F1 score) Recommending Research Papers Polytechnique Montréal

Résultats de l’expérience offline Recommending Research Papers Polytechnique Montréal

Discussion de l’expérience offline Graphe : très bonne précision, moins bon rappel: choix facilement recommandables seulement Bayes : malgré des performances mitigées, il possède la meilleure couverture (beaucoup de recommandations) User-item semble être le meilleur choix général Recommending Research Papers Polytechnique Montréal

Expérience online Sondage où les auteurs notent la pertinence des citations recommandées pour un article qu’ils ont écrit 6 algorithmes utilisés, 5 recommandations présentées Les questions sont centralisées sur 2 thèmes : La pertinence La nouveauté Métrique : Compte des votes qualitatifs Recommending Research Papers Polytechnique Montréal

Résultats de l’expérience online Recommending Research Papers Polytechnique Montréal

Résultats de l’expérience online Recommending Research Papers Polytechnique Montréal

Discussion de l’expérience online Google/Bayes/Graphe : Pertinent (50%) Item-Item/User-Item/co-citation : Non pertinent (25%) Inverse pour la nouveauté (corrélation pertinence-nouveauté = -0.51) Qualité : Graphe Utilité : Google Nouveauté : User-Item Général : Graphe Recommending Research Papers Polytechnique Montréal

Discussion de l’expérience online 60% des utitlisateurs ont reçu au moins une recommandation qu’ils considéraient comme une bonne addition FC réussit à faire des recommandations sur tous les articles vs Graphe échoue sur 19% et Google échoue sur 39% Algorithmes de baseline fonctionnent bien, mais seulement sur la couverture limitée qu’ils possèdent Peu de nouveauté Recommending Research Papers Polytechnique Montréal

Conclusion Aucun algorithme absolu Corrélation inverse pertinence-nouveauté (-0.51) Choix optimal d’un algorithme en fonction d’un scénario : Complément de références pour un article = Google ou Bayes (pertinence maximisée) Groupe de lecture = User-Item (nouveauté maximisée) Nouveau chercheur voulant une compréhension générale = User-Item (combinaison maximisée) ou hybride Recommending Research Papers Polytechnique Montréal

Travaux futurs Algorithmes basés sur le texte et hybrides (plus de textes disponibles) Entraînement du modèle en fonctions des préférences Adapter les systèmes pour trouver des réviseurs d’articles Recommending Research Papers Polytechnique Montréal

Références   McNee, S. M., Albert, I., Cosley, D., Gopalkrishnan, P., Lam, S. K., Rashid, A., Konstan, J. A., and Riedl, J. 2002. On the recommending of citations for research papers. In Proceedings of the 2002 ACM Conference on Computer Supported Cooperative Work (New Orleans, Louisiana, USA, November 16 - 20, 2002). CSCW '02. ACM, New York, NY, 116-125. DOI=http://doi.acm.org/10.1145/587078.587096 Recommending Research Papers Polytechnique Montréal

QUESTIONS? Recommending Research Papers Polytechnique Montréal