System de recommandations

Slides:



Advertisements
Présentations similaires
Les technologies décisionnelles et le portail
Advertisements

Présentation du prototype :
1 IXERP consulting. L archivage consiste à extraire de la base de données opérationnelle les informations qu' il n est plus nécessaire de conserver «
Stratégies de financement des placements par emprunt Nom, TITRES PROFESSIONNELS Titre, Société Date.
Stratégies de financement des placements par emprunt Nom, TITRES PROFESSIONNELS Titre, Société Date.
Résolution de problèmes et logiciel de calcul symbolique
Managing Domain Knowledge and Multiple Models with Boosting Peng Zang – Charles Isbell.
Relational Learning as a Search in a Critical Region Lou Fedon 9 Mars 2006.
Formation de formateurs en sciences économiques URFIST PARIS 21 juin 2005 Véronique MESGUICH INFOTHEQUE POLE LEONARD DE VINCI.
Bonnafet Jean-Louis Académie de Lyon Décembre 2013 Interacadémiques de Mathématiques Lyon 2013 Algorithmique Un parcours pairformance.
De l'enseignement programmé à l'apprentissage adaptatif
Sélection automatique d’index et de vues matérialisées
Exemple de construction d’une séquence d’enseignement…
Bilan gestion de projet
Monétisation Aurélien Dubot. 2 Tendances, En-ligne vs. Hors ligne Source: Kelsey Group 2006 Global Yellow Pages Forecast; SIIA Market Research Forte croissance.
Maple, modélisation et résolution de problèmes
Apprendre à partir des observations
Systèmes de requêtes par billets
METHODE AGIL Présenté par : GRIOUI Haykel MILADI Hedi CHARFI Habib
LE REFERENCEMENT NATUREL S.E.O. (Search Engine Optimisation)
Management stratégique et management opérationnel
Algorithme de lecture critique: validité interne
CaDEA atelier 2 Input Brad cousins, university of ottawa
Universté de la Manouba
Algorithmes d ’approximation
PROJET RICM 4 SERIOUS GAME
Détection du meilleur format de compression pour une matrice creuse dans un environnement parallèle hétérogène Olfa HAMDI-LARBI.
Typo3? Un CMS ou pas de CMS, voilà la question…. Objectifs de la courte présentation Partager avec vous le cheminement actuel du MDEIE Mettre la table.
Solution Athena accès sémantique à linformation MATI Montréal, Avril 2012.
Typologie des outils L ’exerciseur Le tutoriel :
L’adaptativité pour un solveur de l’équation de Vlasov
Cas Senpoursan.
Pistes de réflexion sur la mise en place de partenariats inter-universitaires Les défis La définition des objectifs Les obstacles à surmonter Les facteurs.
Evaluation de l’apprentissage
Quel rendement pour quel risque? Jean Benetti 17 septembre Lausanne Enseignement des cent dernières années.
LES PROGICIELS DE GESTION INTÉGRÉS
ATELIER Finance V10 MARS 2010 TOTALINFO – Mars 2010.
Par Michel Raîche, Réjean Hébert et Marie-France Dubois
Thomas LOPEZ - Equipe BUNRAKU Candidature au monitorat INSA– Vendredi 10 Octobre 2008.
Nymble: High-Performance Learning Name-finder 1 Plan Introduction Modèle –Modèle conceptuel –Caractéristiques de mots –Modèle formel –Rétrogradation de.
Quelques recommandations pour la présentation Vraie Vie : - Mettez en avant systématiquement votre expérience concrète : difficultés, leçons apprises lors.
ROGAUDIT ® Logiciel d'Assistance des Responsables d'Audits.
Stage « Lire-écrire au cycle 2 dans un contexte bilingue »
Université de Cergy-Pontoise, 7 juin 2006 Aibo Compagnon.
Improving large-scale search engines with semantic annotations Damaris Fuentes-Lorenzo, Norberto Fernández, Jesús A. Fisteus, Luis Sánchez.
1ère séance de regroupement
2008/ Plan du cours 1.Introduction –Contenu du cours 2.Logique mathématique –Calcul propositionnel –Calcul des prédicats –Logique floue et aide à.
LE DATA WAREHOUSE.
RECHERCHE EN PARTENARIAT EXPERTS ET INSTITUTIONS D’ENSEIGNEMENT : LE CAS D’UBISOFT MONTRÉAL Yves Jacquier Directeur exécutif, studios de services de production.
L’enseignement de spécialité SLAM
Décision incertaine et logistique : Grille typologique
Jocelyne Cedillos, Joëlle Clar & Francis Lessard.
TEXT MINING Fouille de textes
GPA-779 Application des systèmes experts et des réseaux de neurones.
Project IDÉAL L’Université de Lisbonne et le procès de VAE Maryline de Almeida UL, Institut d´Orientation Professionnelle Novembre 2011.
ELE6306 : Test de systèmes électroniques Test intégré et Modèle de faute de délai Etudiante : S. BENCHIKH Professeur : A. Khouas Département de génie électrique.
Intégration des Tableaux Multidimensionnels en Pig pour
Informatique et Sciences du Numérique
Les ressources numériques en bibliothèque publique Philippe Colomb.
ÉVALUATION APPRENTISSAGE TEST DIAGNOSTIC amorce. ÉVALUATION APPRENTISSAGE Associer la définition au terme approprié : 1.1-b, 2-c, 3-a 2.1-c, 2-a, 3-b.
Création et Optimisation de Modules Audio avec les instructions SSE
UE4 : Méthodologie scientifique en EIAH
Le choix d’une stratégie
Proposition de possibilité d’évolution de nos spécialités Deux projets (liés) : Projet 1 : Informatique Computationnelle – Etudiants 4 e et 5 e IR Projet.
Memoire.
Logiciels et services pour les producteurs de portes et fenêtres.
Projet PAC France Efficacité Commerciale : focus Sales v0.1.
L’évaluation des politiques de traitement du décrochage scolaire : l’exemple de la MGI Séminaire INRP 3-4 février 2009, Nantes : Culture de l’évaluation.
Ecriture Cycle 3 Programmes 2015
L’APPROCHE AGILE AVEC SCRUM
Transcription de la présentation:

System de recommandations Xavier Dupré Microsoft / ENSAE

Bio Parcours professionnel Enseignement 2000-2004 - thèse, reconnaissance de l’écriture 2004 – 2007 - reconnaissance de l’écriture 2007 – 2008 - finance 2008 - 2010 - Yahoo – réécriture 2010 – 2015 – Microsoft - Bing, local, réécriture, suggestions 2015 - Microsoft - Azure ML Enseignement 2001- ENSAE, programmation (1A) 2014- ENSAE, voie datascience (2A + 3A) 2015 – organisation de hackathon (Microsoft / ENSAE / Croix-Rouge)

Formalisation d’un système de recommandation Tenseur = matrice multidimensionnelle Utilisateur Produit Temps Localisation Contexte … Quelle valeur pour les paires non observées ? Chaque dimension multiplie les possibilités sans multiplier les données.

Système de recommandation, ranking Ranking similaire à un système de recommandation Requête  résultats conseillés Requête  requêtes associées (Related Searches) Recommandation pure Le système n’utilise pas d’information sur le contenu Uniquement basée sur l’évaluation implicite faite par l’utilisateur (le clic) Recommandation en pratique Système de recommandation pure uniquement une feature Features extraites à partir du contenu et du contexte Utilisation de classifieur intermédiaire (annotation manuelle, catégorisation) Apprendre le feedback des utilisateurs, généraliser là où il n’est pas Feature = itération longue, ranking final = itération courte

Offline / online Offline – cycle long – beaucoup de map reduce Utilisation de logs d’événements (achats, clic) Génération de candidats : requête  liste de résultats, système de recommandations Extraction de caractéristiques (requête, résultat, paire requête résultats Machine learning, à partir des clics, annotation Construction d’une liste de recommandations à utiliser online Online – cycle très court – C++ Ranking online doit être rapide Utilisation du contexte

Mise en production Dans la pratique Black list Contexte  online ou offline Croissance régulière des jeux de données Suggestions trop proches et trop éloignées ne fonctionnent pas Evénement rares : proposer des suggestions pas toujours pertinentes ou les cacher Offline  grande liste de recommandations Online  réduction de la liste online

Durée de vie d’une implémentation Le plus longtemps possible (3-6 ans) car Difficulté de changer de plateformes Documentation manquante ou orale (black list, seuils…) Perte de savoir liée au turn over (interne / externe) Intrication des système et architecture logicielle approximative (exemple de la normalisation) Mais Accroissement naturel des données Implémentation pas forcément conçue pour tout volume de données Accumulation de patchs, features difficile à maintenir Nouvelle technos et algorithmes

Changement de plateforme, d’algorithme Plateforme - durée 6 mois – 1 an Deux plateformes en parallèles pendant quelques mois Migration progressive (1 marché, puis 2, puis…) Parité impossible à obtenir (gain > perte mais jamais identiquement =) Algorithme - durée 3 mois – 6 mois Articles scientifiques – jeux de données plus propres que la réalité La vitesse n’est pas le souci premier (la performance oui) Testés sur des volumes petits Code chercheur = une seule utilisation

Agilité et test A/B Amélioration quotidienne testée via des test A/B Améliorations contraintes par l’agilité Logging d’information Plus on logge, moins on est limité en terme d’idées Coût en terme de calculs : plus on logge, plus ça rame

Quelques paris sur l’avenir Métrique Rôle d’une suggestion dans le parcours utilisateur ? Clic sur une suggestion : est-elle drôle ou pertinente ? Appauvrissement des données dû aux suggestions Personnalisation renforcée Un utilisateur voit différentes suggestions même s’il fait la même requête Apprentissage par renforcement Randomisation des algorithmes Utiliser l’utilisateur pour faire converger le système MWT - http://research.microsoft.com/en-us/projects/mwt/

Questions / Réponses