Yann Chevaleyre et Jean-Daniel Zucker

Slides:



Advertisements
Présentations similaires
MOT Éditeur de modèles de connaissances par objets typés
Advertisements

QUALIFICATION COMPORTEMENTALE DES BASES DE DONNEES CLIENTS
Soutenance du stage de DEA.
S. Jouteau, A. Cornuéjols, M. Sebag (LRI)
Fabrice Lauri, François Charpillet, Daniel Szer
10/31/02 Leïla Merghem - LIP6 Une approche Multi-Agents pour la Simulation de Réseaux de Télécommunications Leïla Merghem (LIP 6) Dominique Gaïti (LIP.
A. Cornuéjols IAA (basé sur Rob Schapires IJCAI99 talk) Combiner des apprenants: le boosting.
Apprentissage supervisé à partir de séquences
Apprentissage relationnel Apprentissage Data Mining ILP.
LIRMM 1 Journée Deuxièmes années Département Microélectronique LIRMM.
Évaluation de la qualité d'une clusterisation
C1 Bio-statistiques F. KOHLER
Apprentissage de règles à partir de données multi-instances
Complexité et Classification
Systèmes Experts implémentation en Prolog
Règles significatives
R. Saint-Paul, G. Raschia and N. Mouaddib IRIN, Nantes (France)
A.Faÿ 1 Recherche opérationnelle Résumé de cours.
Bouyekhf Rachid-Lyuboumir Gruitch Laboratoire SeT UTBM
Utilisation des tableaux
UNIVERSITE DES SCIENCES ET DE LA TECHNOLOGIE D’ORAN
Mires Chevrons Paul JEAN
Introduction au Génie Logiciel
Karin Lundgren-Cayrol
Analyse lexicale Généralités Expressions rationnelles Automates finis
Programmation logique Logique des prédicats du premier ordre
Modélisation E/R des Données
Méthode des k plus proches voisins
Programmation logique Démonstrateur automatique
Construction de modèles visuels
Quelques Modèles de conception
MOT Éditeur de modèles de connaissances par objets typés
Rappels de logique des prédicats du 1er ordre
Courbes de Bézier.
Algorithmes d ’approximation
Vincent Thomas Christine Bourjot Vincent Chevrier
Optimisation linéaire
Karim-Cyril Griche LSR/IMAG
Design dun système de vision embarqué. Application:
Programmation non procédurale Le projet ECOLE 2000
ASI 3 Méthodes numériques pour l’ingénieur
Filtrage de Kalman et aperçu probabiliste
Les réseaux de neurones artificiels (RNA)
Analyse des Algorithmes
Patrons de conceptions de créations
INTRODUCTION.
Rencontre des écoles ciblées du secondaire 22 mars 2004
DUPLAN Julian Génie-civil Etude de la distribution du renforcement des structures en maçonnerie par fibres de carbone, en utilisant l’optimisation topologique.
Tests de boîte noire.
Méthodes de tri.
1 Alain Casali Christian Ernst Extraction de Règles de Corrélation Décisionnelles 29 Janvier 2009.
Présentation du marché obligataire
© Petko ValtchevUniversité de Montréal Février IFT 2251 Génie Logiciel Conception Hiver 2002 Petko Valtchev.
Extraction de segments pour la reconnaissance de symboles : Une approche robuste par Transformée de Hough Présenté par : Simon BERNARD Encadré par : Jean-Marc.
Modèles Mathématiques et représentation discrètes pour la description des images couleur Luc Brun.
Sériation et traitement de données archéologiques
Initiation à la conception des systèmes d'informations
2008/ Plan du cours 1.Introduction –Contenu du cours 2.Logique mathématique –Calcul propositionnel –Calcul des prédicats –Logique floue et aide à.
Olivier Leclair, Université Laval Un algorithme de fouille dans une représentation des données par objets: une application médicale SIMON, Arnaud.
Classification de données par l’algorithme FPSO-GA
TIPE Les dames chinoises
Recherche de motifs par projections aléatoires
Méthode des moindres carrés (1)
GPA-779 Application des systèmes experts et des réseaux de neurones.
ELE6306 : Test de systèmes électroniques Test intégré et Modèle de faute de délai Etudiante : S. BENCHIKH Professeur : A. Khouas Département de génie électrique.
PIF-6003 Sujets spéciaux en informatique I
OBJET ET METHODE 1 OBJET - malade et maladie - fonction soignante
Exemple et critique d’un système de vision simple Patrick Hébert (dernière révision septembre 2008) Référence complémentaire: Shapiro et Stockman: chap.
Café In: A quoi ca sert la recherche sur la programmation? Comment peut on faire travailler des ordinateurs ensemble? Ludovic Henrio SCALE TeamSCALE Team.
GEOMETRIE du cycle 1 au cycle 3 quelques pistes
Transcription de la présentation:

Algorithmes pour l’apprentissage de règles à partir de données multi-instance Yann Chevaleyre et Jean-Daniel Zucker Université de Paris VI – LIP6 - CNRS

Représentation Att/Val Représentation relationelle Motivations Le choix du langage de représentation des données a un effet déterminant sur l ’apprentissage + très expressif - difficilement apprenable, nécessite des biais forts description atomique description globale - peu expressif + algorithmes performants Représentation Att/Val Représentation MI Représentation relationelle La plupart des algorithmes d ’apprentissage MI utilisent des données numériques, et génèrent des hypothèses difficilement interprétables Notre but: concevoir des algorithmes efficaces, utilisant des données symboliques et numériques, et générant des hypothèses compréhensibles comme des listes de décision

Plan 1) L ’apprentissage multi-instances La représentation multi-instances, sources de données multi-instances, le problème d ’apprentissage multi-instances 2) Extension d ’un algorithme d ’apprentissage propositionnel Méthode, extension de l ’algorithme Ripper 3) Analyse de l ’extension multi-instances de Ripper Les littéraux contradictoires, les littéraux non significatifs, les littéraux indiscernables Conclusion et perspectives

La représentation multi-instances: définition Représentation Att/Val classique: Représentation multi-instance: est représenté par exemplei + Vecteur A/V xi labi  {0,1} Vecteur A/V xi,1 exemple i est représenté par Vecteur A/V xi,2 + labi  {0,1} Vecteur A/V xi,r instances sac

Sources de données multi-instances Les objets complexes (images, molécules, …) sont facilement représentables sous forme de sacs d ’instances Les Bases de données relationelles peuvent l ’être aussi 1 0,n Des langages de représentations plus complexes (faits datalog, clauses prolog,…) peuvent être MI-propositionalisés [zucker98], [Alphonse et Rouveirol 2000]

Le problème d ’apprentissage MI A partir de B+,B- ensembles de sacs positifs (resp. négatifs), trouver H, hypothèse consistante Problème d ’apprentissage multi-instances sans biais Il existe un fonction f, telle que : lab(b)=1 ssi x  b, f (x) biais single-tuple Trouver une fonction h qui couvre au moins une instancesde chaque sac positif et aucune instance des sacs négatifs Problème multi-instances [Dietterich 97] Note: la fonction h a pour domaine l ’espace des instances, et non plus l ’espace des sacs.

Extension d ’un algorithme d apprentissage de règles Représenter l ’ensemble des sacs sous la forme d ’un ensemble de vecteurs. b1+ ajout de bag-id et du label à chaque instance b2- Mesurer le degré de consistance au sens multi-instances de l ’hypothèse en cours de raffinement Au lieu de mesurer p(r), n(r), nombre de vecteurs couverts par r, on calcule p*(r), n*(r), le nombre de sacs dont r couvre au moins une instance

Extension de l ’algorithme Ripper (Cohen 95) Ripper (Cohen 95) est un algorithme d ’apprentissage de règles rapide, pouvant traiter un grand nombre d ’exemples, et se comparant à C4.5 Naive-RipperMi est l ’extension de Ripper au cas multi-instances Naive-Ripper-MI a été testé sur les bases multi-instances musk (Dietterich 97). Sur musk1 (5,2 instances par sac en moyenne), il obtint de bonnes performances. Sur musk2 (65 instances par sac), performances très moyennes (77%).

Analyse de l ’algorithme Naive-RipperMI Objectif: Analyse des pathologies liées au problème multi-instances et à l ’algorithme Naive-Ripper-MI. Les littéraux contradictoires Les littéraux non significatifs Les littéraux indiscernables Moyen: étude de NaiveRipperMi sur une BD simple Y X 2 4 6 8 10 12 le sac des triangles blancs le sac des carrés blancs ... 5 sacs positifs: 5 sacs négatifs: le sac des triangles noirs le sac des carrés noirs ...

Analyse de l ’algorithme Naive-RipperMI Tâche d ’apprentissage: découvrir une règle couvrant au moins une instance de chaque sac positif Concept cible : X > 5 & X < 9 & Y > 3 Y X 2 4 6 8 10 12

Analyse de Naive-RipperMi: les littéraux contradictoires 1ière étape: Naive-RipperMi génère une première règle X > 11 & Y < 5 Littéraux contradictoires Concept cible : X > 5 & X < 9 & Y > 3 Y X 2 4 6 8 10 12

Analyse de Naive-RipperMi: les littéraux contradictoires 2ième étape: Naive-RipperMi supprime le(s) sac(s) couvert(s) par la règle induite, et induit une nouvelle règle... Y X 2 4 6 8 10 12

Analyse de Naive-RipperMi: les littéraux contradictoires Phénomène spécifiquement multi-instances Contrairement aux autres pathologies mono-instances (overfitting, problèmes de sélection d ’attributs), l ’accroissement du nombre d ’exemples ne résout rien. On ne peut pas « rattraper » une règle comportant un littéral contradictoire par raffinage successifs Le principe de l ’algorithme par couverture élimine réduit les chances de trouver le concept cible Si le littéral l est contradictoire, alors l ne l ’est pas. Il suffit donc, lorsqu ’on choisit le littéral l d ’examiner en même temps l => partition de l ’espace des instances

Analyse de Naive-RipperMi: les littéraux contradictoires Construction d ’une partition de l ’espace des instances On extrait la meilleure règle : X < 11 & Y < 6 & X > 5 & Y > 3 Y X 6 8 10 2 4 2 4 12

Analyse de Naive-RipperMi: les littéraux non significatifs En apprentissage multi-instances, les littéraux non significatifs peuvent se trouver n ’importe où dans la règle, et non plus seulement à la fin Utiliser un élagage global Y < 6 & Y > 3 & X > 5 & X < 9 Y X 2 4 6 8 10 12

Analyse de Naive-RipperMi: les littéraux indiscernables Quand le nombre d ’instances par sac augmente, les littéraux initiaux couvrent tous les sacs. On ne dispose pas d ’assez d ’information pour en choisir un X Y 2 4 6 8 10 12

Analyse de Naive-RipperMi: les littéraux indiscernables Quand le nombre d ’instances par sac augmente, les littéraux initiaux couvrent tous les sacs. On ne dispose pas d ’assez d ’information pour en choisir un X Y 2 4 6 8 10 12

Analyse de Naive-RipperMi: les littéraux indiscernables Solution : Prendre en compte le nombre d ’instances couverts à l ’aide d ’un modèle sur les données Calculer Pr(instance couverte  concept cible) Y 6 Y > 5 4 Concept cible 2 2 4 6 8 10 12 X

Analyse de Naive-RipperMi: les littéraux indiscernables Modèle choisit: Un sac b+ ayant r instances est composé de: 1 instance  concept cible r-1 instances tirées aléatoirement d ’une distribution D Calcul de Pr(instance couverte  concept cible)

Ce phénomène est fréquent lorsque ne nombre d ’instances par sac est grand Construire une partition de l ’espace des instances

Taux d ’erreur (%) Nombre d ’instances par sac