Apprentissage semi-supervisé

Slides:



Advertisements
Présentations similaires
Définitions Analyse documentaire
Advertisements

Renforcer les relations et les réseaux
Apprentissage semi-supervisé
Apprentissage spectral
Algèbre de composants : une approche fonctionnelle à la sémantique de documents Bart Lamiroy LORIA/INPL QGar - École des Mines de Nancy.
Classification et prédiction
Classification et prédiction
Regroupement (clustering)
Apprentissage supervisé à partir de séquences
Regroupement (clustering)
Apprentissage relationnel Apprentissage Data Mining ILP.
RECONNAISSANCE DE FORMES
Évaluation de la qualité d'une clusterisation
Image et apprentissage
Diagram-Based Techniques
Académie de Grenoble. Après lutilisation en classe dune activité de type ressources accompagnées, des questionnaires ont été distribués aux élèves puis.
Application de réseaux bayésiens à la détection de fumées polluantes
Yann Chevaleyre et Jean-Daniel Zucker
E-Motion Group © Olivier Aycard (E. Gaussier) Université Joseph Fourier Méthodes de classification.
Le remplacement moléculaire
Laurent Labarre AGC - UMR Génoscope
Reconstruction de volume 3D
Classification automatique de documents
Apprendre à partir des observations
Classification automatique de documents XML : le système Semistix Alexandre Termier Marie-Christine Rousset Michèle Sebag Séminaire du 23/01/2001 Université
Concepts avancés en mathématiques et informatique appliquées MAP-6014.
Méthode des k plus proches voisins
Concepts avancés en mathématiques et informatique appliquées MAP-6014.
Construction de modèles visuels
La segmentation
RECONNAISSANCE DE FORMES
RDF(S)
Développer et évaluer l’oral en classe
Bioinformatique et Biologie Structurale I/ – Principes et techniques A/ Linformation structurale B/ Les différentes techniques de détermination de structure.
Présentation: Algorithme pour le web Article:« Scalable Techniques for clustering the Web » Professeur:José Rolim Assistant:Matthieu Bouget.
Design dun système de vision embarqué. Application:
Classification automatique de textes
Segmentation (1ère partie)
Introduction à la reconnaissance:
Classification automatique
LRI-INRIA Saclay LRI- UMR CNRS Univ Paris-Sud et UR-INRIA Saclay 12 Equipes au LRI - 7 projets INRIA Equipe IASI-GEMO (IA et BD) « Gestion de données et.
Les Moteurs de recherche:
Similarité Belkhir Abdelkader Laboratoire LSI USTHB
Apprentissage (III) Mirta B. Gordon Laboratoire Leibniz-IMAG Grenoble Dynamique des systèmes complexes et applications aux SHS : modèles, concepts méthodes.
Un projet, des projets….. Vers plus d’autonomie.
Classification : objectifs
Fouille de données issues de capteurs : problématique et méthodes Journée “Les Capteurs en Agriculture” Paris 18 avril 2014 Pascal Poncelet
Crawlers Parallèles Présentation faite par: Mélanie AMPRIMO
Modèles Mathématiques et représentation discrètes pour la description des images couleur Luc Brun.
Institut de sciences et technologies Département d’informatique
3e séance : 16 novembre 2006 L ’opérationnalisation.
Apprentissage « machine »
Arbres de décision flous
Problème de double digestion
Apparence globale 1 image = 1 vecteur Base apprentissage Rotation –capture les variabilités Troncature –Quelques coefficients Représentation linéaire Espace.
INF3500 : Conception et implémentation de systèmes numériques Pierre Langlois Performance de circuits.
Présentation AICHA REVEL INGENIEUR D’ÉTUDE STERIA DEPARTEMENT TRD
Olivier Leclair, Université Laval Un algorithme de fouille dans une représentation des données par objets: une application médicale SIMON, Arnaud.
Classification de données par l’algorithme FPSO-GA
Sujets spéciaux en informatique I
Les réseaux de neurones à réservoir en traitement d’images
1/17FDC janvier 2006 Alice MARASCU Florent MASSEGLIA Projet AxIS INRIA Sophia Antipolis Classification de flots de séquences basée sur une approche.
SVM machine à vecteurs de support ou séparateur à vaste marge
Copyright, 1996 © Dale Carnegie & Associates, Inc. Com7114 Technologies de la communication Objectifs de ce cours ? Sa place dans le programme ? La communication.
Extreemly Random Trees + SubWindows HOURRI Soufiane NAIT ABDELLAH OUALI Ismail OUFQIR Anouar OUSSAFI Mohammed.
Apprentissage semi-supervisé avec des modèles discriminants : application au résumé automatique de texte Massih-Réza Amini LIP6, Université de Paris VI.
Exemple et critique d’un système de vision simple Patrick Hébert (dernière révision septembre 2008) Référence complémentaire: Shapiro et Stockman: chap.
Reconnaissance d’objets 3D –point de vue complètement différent –pas d’invariant 3D Difficultés :
IFT 501 Recherche d'information et forage de données Chaptitre 8 : Classification automatique concepts de base et algorithmes André Mayers Automne 2014.
BIO-INFORMATIQUE Analyse de séquences nucléotidiques - séance n°1 Illustration:
Transcription de la présentation:

Apprentissage semi-supervisé Extrait de : http://www.public.asu.edu/~jye02

Position du Problème Données avec labels Labels des données (0 ou 1) But : prédire les labels des données sans labels X y Données sans labels

Apprentissage semi-supervisé Apprentissage semi-supervisé pour améliorer les performances en combinant les données avec labels (peu) et sans labels (beaucoup) Classification semi-supervisée : entraîner sur des données avec labels et exploiter les données (beaucoup) sans labels Clustering semi-supervisé : clustering des données sans labels en s'aidant des données avec labels Clustering Apprentissage Semi-supervisé Classification

Hypothèse de classe Hypothèse de base pour la plupart des algorithmes d'apprentissage semi-supervisés Points proches ont probablement le même label de classe Deux points qui sont connectés par un chemin traversant des régions de forte densités doivent avoir le même label

Classification Semi-Supervisée

Exemple de Classification Semi-Supervisée . . . .

Exemple de Classification Semi-Supervisée . . . . . . . . . . . . . . . . . . . .

Exemple de Classification Semi-Supervisée . . . . . . . . . . . . . . . . . . . .

Classification Semi-Supervisée Algorithmes: EM Semi-supervisé [Ghahramani:NIPS94,Nigam:ML00]. Co-training [Blum:COLT98]. Transductive SVM’s [Vapnik:98,Joachims:ICML99]. Algorithmes à base de Graphes [Blum:ICML01, Joachims:ICML03,Zhu:ICML03,ZHOU:NIPS03] hypothèses: Connu : un ensemble de catégories de données avec labels But : améliorer la classification des exemples dans ces catégories connues

Clustering Semi-Supervisé

Clustering Semi-Supervisé : Exemple 1 . . . . . . . . . . . . . . . . . . . .

Clustering Semi-Supervisé : Exemple 1 . . . . . . . . . . . . . . . . . . . .

Clustering Semi-Supervisé : Exemple 2 . . . . . . . . . . . . . . . . . . . .

Clustering Semi-Supervisé : Exemple 2 . . . . . . . . . . . . . . . . . . . .

Clustering semi-supervisé : Entrée : Un ensemble d'objets sans labels, chacun est décrit par un ensemble d'attributs (numériques ou catégoriels) Une faible connaissance du domaine Sortie : Partitionnement des objets en k classes Objectif : Similarité intra-cluster maximum Similarité inter-cluster minimum Une grande consistance entre partition et connaissances du domaine

Pourquoi clustering semi-supervisé ? Why not clustering? Les classes obtenues peuvent ne pas être ceux demandés Parfois, il y a plusieurs choix de groupements Why not classification? Parfois on n'a pas assez de données avec labels Applications potentielles Bioinformatique (gene et protein clustering) Construction de hiérarchies de documents Categorisation de News/email categorisation d'Images

Clustering Semi-Supervisé Deux type de connaissances Informations partielles sur les labels Appliquer certaines contraintes (must-links et cannot-links) Approches Search-based Semi-Supervised Clustering Alter the clustering algorithm using the constraints Similarity-based Semi-Supervised Clustering Alter the similarity measure based on the constraints Combination of both

Classification semi-supervisée c'est quoi ? Utilise un faible nombre de données avec labels pour labelliser un grand nombre de données sans labels Labelliser est coûteux Idée de base Données similaires doivent avoir le même label de classe Exemples Classification pages Web Classification de documents Classification de protéines