Managing Domain Knowledge and Multiple Models with Boosting Peng Zang – Charles Isbell.

Slides:



Advertisements
Présentations similaires
E-learning Evolutif Albarelli Corinne Behem Patrice Guillot Jérôme
Advertisements

Soutenance du stage de DEA.
Programme Solidarité-Eau Formation à destination des porteurs de projets souhaitant déposer une demande de financement auprès de la Facilité Européenne.
Thomas G. Dietterich Approximate Statistical Tests for Comparing
Combiner des apprenants: le boosting
A. Cornuéjols IAA (basé sur Rob Schapires IJCAI99 talk) Combiner des apprenants: le boosting.
Vers un renouveau des pratiques enseignantes…..
1 Séminaire de travail « Indicateur de croissance en France et/ou en zone euro : méthodologie et évaluation » 14 juin 2006 Indicator Models of Real GDP.
Nombre de sujets nécessaires en recherche clinique
27 mars 2013Jacques PERRIN BTS CONCEPTION ET REALISATION DE CARROSSERIES Méthodes dévaluation et de certification Paris FFC.
La stratégie pédagogique
Yann Chevaleyre et Jean-Daniel Zucker
Xialong Dai, Siamak Khorram
ACS et Séquences Comportementales en environnements non-markoviens
R. Saint-Paul, G. Raschia and N. Mouaddib IRIN, Nantes (France)
Reconnaissance de la parole
Améliorer les performances du chiffrage à flot SYND
DEA instrumentation et commande
Mirta B. Gordon Laboratoire Leibniz-IMAG Grenoble
Mirta B. Gordon Laboratoire Leibniz-IMAG Grenoble
La présentation d’un roman
Apprentissage et Fouilles de données Salma Najar 20 Mars 2008 FilterBoost: Regression et Classification On Large Datasets FilterBoost: Regression et Classification.
1. La formation des compétences
Annotations sémantiques pour le domaine des biopuces
DEA Perception et Traitement de l’Information
Objectifs du chapitre 12: Interprétation des résultats
Séance 12 Partenaire stratégique (modèle de Dave Ulrich, 1997)
La pensée du jour « Il faut rendre mesurable ce qui est réellement important plutôt que de rendre important ce qui est facilement mesurable. » Source inconnue.
Amaury Daele FUNDP – Namur - Journée "NetMeeting"
Notion de défaut Événement qui modifie fonctionnement procédé de sorte que performances dégradées ou objectif pas atteint Exemples Dérive de capteur Fuite.
UBLO Comparaison de génomes bactériens : questions méthodologiques autour de la définition du squelette et des boucles
Journées de Rencontre Jeune Chercheurs
Lévaluation des apprentissages FPE 7550 Andrée Cantin Leçon 2 15 septembre 2004.
Modélisation de la topologie avec le Graphe Génératif Gaussien
L’évaluation des apprentissages
1 Séminaire LOVe du 29/03/07 Combinaison d'objets (fusion centralisée) T3.2 Combinaison de pistages (fusion décentralisée) T3.3.
Mise en oeuvre des MMCs L'utilisation des MMCs en reconnaissance des formes s'effectue en trois étapes : définition de la topologie de la chaîne de Markov,
Objectifs du chap. 5: Plans de recherche classiques
Objectifs Chapitre 7: variables indépendantes et dépendantes
La pratique des problèmes ouverts
Exposé d’article IFT – Ingénierie des connaissances Présenté par
Compétences des enseignants
Evaluation de l’apprentissage
Reconnaissance des personnes par le visage dans des séquences vidéo
7 mai André Revuz 1 Situations fondamentales et curriculums Guy Brousseau.
AGREGATION DE CLASSIFIEURS
Les Techniques d’enquête quantitative
Présentation Commission de qualification et rôle du pré-noteur
Bienvenue au module 4 Planification de l’enseignement des mathématiques et approches pédagogiques.
1 JEUX DE TESTS la méthode générale modèle de données critères fonctionnels d’extractions jeux de données jeux de données avant tests sélection exécution.
Vibert Dimitri CSII3 Tuteur : Volker Bäcker.  Présentation de Montpellier RIO Imaging  La mission  Les langages et outils utilisés  Le planning 
Travaux Pratiques Optimisation Combinatoire
Reconnaissance de chiffres manuscrits
PROBLEME POSE Profession Evlolution constante des métiers Evolution rapide des techniques Formation S’insérer rapidement S’adapter - évoluer Contraintes.
Trajectory Tree [1] Patrick Cinq-Mars. © Name – Month YEAR2 / TOTAL PAGES TTree: Tree-Based State Generalization with Temporally Abstract Actions William.
Suivi rapide d’objet en mouvement
4SI / Exposé de MCSI / K.O.D 2003/2004
ELE6306 : Test de systèmes électroniques Test intégré et Modèle de faute de délai Etudiante : S. BENCHIKH Professeur : A. Khouas Département de génie électrique.
I-expo 9 juin 2004 Les référentiels métier à l’heure de la mobilité professionnelle et géographique Table Ronde.
Extreemly Random Trees + SubWindows HOURRI Soufiane NAIT ABDELLAH OUALI Ismail OUFQIR Anouar OUSSAFI Mohammed.
Présentation du système
System de recommandations
Validation d’une méthode d’analyse
Rappel de la problématique Diminuer le temps d’ouverture actuel de son nouveau portail de manière significative (30%)
Exemple d’application pour ACCLIMAT
1 Analyse des tâches en ergonomie Chapitre 3 – Évaluation des performances 1 – La notion de performance 2 – Les mesures de la performance.
1 Reconstruction des événements Top enregistrés avec le détecteur ATLAS Apport des techniques multi-variables Diane CINCA Stage de Master 2 ème année.
Lecture critique des essais cliniques. But Juger de : - La validité scientifique - L’intérêt clinique Modifier ou ne pas modifier la pratique.
A & M – GP Qualité Services – 13 juin LE MODELE EFQM, levier pour l'excellence durable Suzanne ROSEMBERG Secrétaire Générale de l’IQM.
Élaboration d’un référentiel de compétences
Transcription de la présentation:

Managing Domain Knowledge and Multiple Models with Boosting Peng Zang – Charles Isbell

Quelques rappels Boosting : –Combinaison de « weak learners » –+ Performance agrégation de classifieurs AdaBoost (Adaptative Boosting - Freund et Schapire (96)): –Entraînement des classifieurs dun modèle en séquence –Accent sur les points mal classés –Agrégation pondérée des prédictions : Y M (x) = sign ( m α m y m (x) )

Objectif et caractéristiques de MBoost Objectif : Améliorer la capacité de généralisation Trois extensions à la technique du boosting : –Intégration explicite de plusieurs modèles –Utilisation dun ensemble de validation interne –Mise en place dune condition darrêt systématique

Intégration explicite de plusieurs modèles Chaque classifieur propose une hypothèse Sélection de la meilleure hypothèse (~ fonction de perte) Mboost joue le rôle darbitre (ø biais supplémentaire)

Utilisation dun ensemble de validation interne Risque de sur-apprentissage du classifieur final (~ méthode dévaluation des hypothèses) Découpage des données : Apprentissage & Validation Génération des hypothèses : données dapprentissage Évaluation des hypothèses : données de test Repondération des données de test uniquement

Mise en place dune condition darrêt systématique Limite de lensemble de validation interne –Sur-apprentissage lié bruit –Performance hypothèses Hasard MBoost sarrête après un roulement suffisant des données dapprentissage et de validation

Conclusions et Preuves (1/3) MBoost dirige et utilise efficacement plusieurs modèles et leurs connaissances du domaine Cf. première expérience : –Performance MBoost Performance AdaBoost –MBoost est cinq fois plus rapide

Conclusions et Preuves (2/3) Performance MBoost Performance AdaBoost Cf. deuxième expérience : –5 ensembles de données et 25 classifieurs –Mboost > BestAda (5 ens.) et C Mboost = C AdaBoost –Mboost > BestCV-Ada (3 ens.) et –Mboost = BestCV-Ada (2 ens.) et –10*C Mboost = C AdaBoost

Conclusions et Preuves (3/3) Critère darrêt de MBoost : robuste au sur-apprentissage Cf. quatrième expérience : –Mboost = MboostAuto MBoost : une alternative à la sélection de modèle par cross-validation Cf. quatrième expérience : –Mboost > BestCV-Ind (1 ens.) et C Mboost = C BestCV-Ind

Questionnement Efficacité de lutilisation dune variété de modèles par MBoost ? –Hypothèse : performances observées dans la 2 ième et 4 ième expériences peuvent être dues à lensemble de validation interne Choisir la meilleure hypothèse VS Agréger les meilleures hypothèses