Habiboulaye AMADOU BOUBACAR

Slides:



Advertisements
Présentations similaires
LES NOMBRES PREMIERS ET COMPOSÉS
Advertisements

Qualité du Premier Billot. 2 3 Défauts reliés à labattage.
1. Résumé 2 Présentation du créateur 3 Présentation du projet 4.
Soutenance du stage de DEA.
Fabrice Lauri, François Charpillet, Daniel Szer
Distance inter-locuteur
1 Infrastructures logicielles pour Interfaces Homme- Machine plastiques Anne Roudaut Sous la responsabilité de Joëlle Coutaz et Lionel Balme CLIPS, IIHM.
RECONNAISSANCE DE FORMES
Capteurs et Actionneurs
LES RESEAUX DE NEURONES
Approche par composant : Un cadre pour l’ingénierie de la commande
1 Vers la découverte de nouvelles modalités sensori-motrices. Encadrants : Pierre Bessière Anne Spalanzani Pierre Dangauthier DEA I.V.R. 24 Juin 2003 Sélection.
Génération interactive dimages projectives : Application à la Radiothérapie Pierre BLUNIER Du 01/12/2002 au 28/03/2003 Centre Léon Bérard.
Modélisation et commande hybrides d’un onduleur multiniveaux monophasé
ESIEE Paris © Denis BUREAU I N Initiation à la programmation avec le langage Java.
Plus rapide chemin bicritère : un problème d’aménagement du territoire
Safae LAQRICHI, Didier Gourc, François Marmier {safae
Etudiants: Philippe BERNARD Sylvain DEVASSINE Encadrant:
Identification des personnes par l’iris
Sélection automatique d’index et de vues matérialisées
Mr: Lamloum Med LES NOMBRES PREMIERS ET COMPOSÉS Mr: Lamloum Med.
Etienne Bertaud du Chazaud
Mirta B. Gordon Laboratoire Leibniz-IMAG Grenoble
Monique THONNAT et Nathanaël ROTA Projet ORION
Guy Gauthier, ing., Ph.D. Session été 2013.
Interagir avec un objet mixte Propriétés physiques et numériques Céline Coutrix, Laurence Nigay Équipe Ingénierie de lInteraction Homme-Machine (IIHM)
Des RRA à la diagnosticabilité
Approche critique des produits IdL Master 1 IdL Année
Application des algorithmes génétiques
Classification Multi Source En Intégrant La Texture
Pourquoi les réseaux de neurones de type « perceptron multicouche » conviennent-ils à l’apprentissage Stéphane Canu, INSA de Rouen , PSI André Elisseeff,
Applications du perceptron multicouche
Approche statistique semi-paramétrique du recalage iconique d’images
1 Guide de lenseignant-concepteur Vincent Riff 27 mai 2003.
Thèse de Doctorat Troisième cycle de Physique présentée par Mr NZONZOLO Maître es Science Étude en simulation des effets des paramètres macroscopiques.
Détection de co-évolution de gènes Master 2 : Informatique à Finalité Professionnelle et Recherche Unifiée (IFPRU) Parcours Ingénierie de lIntelligence.
Méthode des k plus proches voisins
Titre : Implémentation des éléments finis sous Matlab
Champs de Markov cachés pour la classification de gènes..
1 Conduite du changement LA CONDUITE DU CHANGEMENT.
Construction de modèles visuels
Diagnostic des Systèmes à Evénements Discrets
Académie de Créteil - B.C Quest-ce quune Inscription 1)1 action + 1 stagiaire + 1 client 2)Parcours individuel (avec son Prix de Vente) 3)Un financement.
Projet poker 1/56. Introduction Présentation de léquipe Cadre du projet Enjeux Choix du sujet 2.
LES NOMBRES PREMIERS ET COMPOSÉS
VOC 1 CE2 Je sais utiliser des mots de la vie quotidienne.
Maîtrise des risques et sûreté de fonctionnement – Avignon – 6-10 Octobre 2008 Modélisation des dysfonctionnements dun système dans le cadre dactivités.
SCIENCES DE L ’INGENIEUR
Réseaux de neurones.
Interprétation de séquences dimages pour des applications MédiaSpace Alberto AVANZI François BREMOND Monique THONNAT Projet ORION INRIA de Sophia Antipolis.
1 Du pixel à lobjet : méthodes stochastiques X. Descombes Projet Ariana Orféo, 14 juin 2005.
1 Enseigner les mathématiques grâce à lenvironnement Cabri UREM UNIVERSITE LIBRE DE BRUXELLES 18 Avril 2007 Enseigner les mathématiques grâce à lenvironnement.
Synthèse Applications des réseaux de neurones en reconnaissance de formes et en vision par ordinateur.
Représentation des systèmes dynamiques dans l’espace d’état
Représentation des systèmes dynamiques dans l’espace d’état
Modélisation de la topologie avec le Graphe Génératif Gaussien
Tournoi de Flyball Bouin-Plumoison 2008 Tournoi de Flyball
ASI 3 Méthodes numériques pour l’ingénieur
ECOLE DES HAUTES ETUDES COMMERCIALES MARKETING FONDAMENTAL
Traitement de différentes préoccupations Le 28 octobre et 4 novembre 2010.
ECOLE DES HAUTES ETUDES COMMERCIALES MARKETING FONDAMENTAL
1. Présentation générale du système
Projet de stage d’année IIR4 sous le thème:
10 février 2006GDR ISIS Journée Localisation et Navigation Projet EGNOS-BUS (Eurêka) André Monin, Wael Suleiman LAAS-CNRS.
Les Chiffres Prêts?
Supports de formation au SQ Unifié
Les réseaux de neurones à réservoir en traitement d’images
Présentation RFIA janvier 2002
Les réseaux de neurones à réservoir en traitement d’images
Apprentissage semi-supervisé avec des modèles discriminants : application au résumé automatique de texte Massih-Réza Amini LIP6, Université de Paris VI.
Transcription de la présentation:

Habiboulaye AMADOU BOUBACAR Soutenance de Thèse Classification Dynamique de données non-stationnaires Apprentissage et Suivi de classes évolutives présentée par Habiboulaye AMADOU BOUBACAR Directeur de thèse : Salah MAOUCHE Co-directeur : Stéphane LECŒUCHE 1

Thèse Financement de la Thèse: MENRT Laboratoires de recherche LAGIS-UMR-CNRS 8146, Université Lille 1 Equipe « Ingénierie de la Décision » (ID) Thème « Apprentissage Dynamique et Décision » Ecole des Mines de Douai Dépt «Génie Informatique et Productique » (GIP) Equipe «Systèmes et Processus Industriels » SPI 2

Plan Introduction Classification dynamique : Problématique Description générique de classifieurs dynamiques Algorithmes de classification dynamique AUDyC (AUto-Adaptive & Dynamical Clustering) SAKM (Self-Adaptive Kernel Machine) Expérimentation Conclusion et Perspectives 3

Contexte général Apprentissage automatique (Machine Learning) Conférer des facultés d’apprentissage à un système La plupart de systèmes d’apprentissage Capacités de Mémorisation : Mémoire (Exemple : Apprendre Alphabet : « A, B, C, … ») Capacités de Généralisation : Règles (Exemple : Lecture : « KA TCHARRA ») Et, si les connaissances évoluent dans le temps ? Limitations des systèmes classiques Capacités d’adaptation nécessaires 4

Quelques exemples Reconnaissance de visages Diagnostic médical Vieillissement des individus Évolutions : caractéristiques physiques Diagnostic médical Expansion de cancers Supervision des processus industriels Commutations de modes de fonctionnement Évolutions de modes de fonctionnement Capacités d’adaptation et suivi d’évolutions Mise à jour (continue) des connaissances 5

Plan Introduction Classification dynamique : Problématique Description générique de classifieurs dynamiques Algorithmes de classification dynamique AUDyC (AUto-Adaptive & Dynamical Clustering) SAKM (Self-Adaptive Kernel Machine) Expérimentation Conclusion et Perspectives 6

Classification dynamique Données non-stationnaires Données issues de processus à comportement évolutif Les paramètres des modèles de classes évoluent Evolutions Modifications locales Evolutions (avec glissement) rapide, lente, … Approche : Reconnaissance de Formes Modélisation de l’état du processus Extraction des informations pertinentes Vecteur forme = Données Modélisation des connaissances utiles Classification des données Apprentissage de classes (statiques) Extraction Filtrage Processus Interactions avec l’environnement Entrées Sorties 7

Problématique Classification non-supervisée Apprentissage en ligne Classes d’appartenance des données: non connues Apprentissage en ligne Incorporation récursive des nouvelles informations Mise à jour du modèle de connaissances Modélisation adaptative et suivi de classes Environnement non-stationnaire Apparition de nouvelles classes Fusion de classes Scission de classes Elimination de classes parasites ou obsolètes 8

Travaux antérieurs ISODATA (Hall et Ball, 1965; Hall et Khanna, 1977) Algorithme de "Centres-mobiles" doté des procédures de Fusion, Scission et Elimination Algorithmes à architectures neuronales LAMBDA (Piela et al. 1989) FMMC (Simpson, 1993) CDL (Eltoft, 1998) ESOM (Deng et Kasabov, 2003) Limitations majeures Modèle de classification Processus d’apprentissage 9

Plan Introduction Classification dynamique : Problématique Description générique de classifieurs dynamiques Algorithmes de classification dynamique AUDyC (AUto-Adaptive & Dynamical Clustering) SAKM (Self-Adaptive Kernel Machine) Expérimentation Conclusion et Perspectives 10

Formalisation (1/2) Partition dynamique et Modèle de classification Architecture neuronale Couche d’entrée : données Couche cachée : paramètres Couche de sortie : classes Connexions entre les neurones Faire évoluer l’architecture C1 C2 Cm CM x1 xd xD 11

Formalisation (2/2) Modèle de classification S’adapter correctement à la distribution de données Mise à jour récursive en environnement non-stationnaire Processus de classification dynamique Classification en ligne Affectation de données Mise à jour récursive du modèle de classification 12

Critère de similarité Classification en ligne : Critère de similarité Mesure de similarité : proximité géométrique Critère : Ensemble de classes gagnantes 13

Processus d’apprentissage Processus de classification dynamique Critère de similarité : Règles de décision Procédures de mise à jour du modèle de classification 14

Processus d’apprentissage Règles de décision et Procédures de mise à jour Cas 1 card(win) = 0  Procédure de Création Cas 2 card(win) = 1  Procédure d’Adaptation Cas 3 card(win) ≥ 2  Procédure de Fusion Cas 4 T données  Procédure d’Évaluation Cas 1: Création Cas 3: Fusion Cas 2: Adaptation Cas 4: Elimination 15

Classifieurs dynamiques AUDyC : Modèles de Mélange SAKM : SVM & Méthodes à noyau 16

Plan Introduction Classification dynamique : Problématique Description générique de classifieurs dynamiques Algorithmes de classification dynamique AUDyC (AUto-Adaptive & Dynamical Clustering) SAKM (Self-Adaptive Kernel Machine) Expérimentation Conclusion et Perspectives 17

Modèles de mélange Modèles de mélange [Govaert, 2003] Outils statistiques performants en classification Décomposition de la loi de densité parente Formalisation générale: diverses lois de densité Mélange gaussien : le plus utilisé Approximation justifiée dans la plupart de problèmes Outils mathématiques relativement bien maîtrisés Maximisation de la loi de vraisemblance EM [Dempster et al., 1977]; CEM [Celeux et al., 1995] Compétitive EM [Zhang et al., 2003] : Fusion & Scission Peu d’algorithmes en ligne [Same et al., 2004] 18

AUDyC : Modèle de classification Mélange gaussien: approche multimodale Classe = un ou plusieurs prototypes gaussiens Fonction Objectif : Maximisation de vraisemblance 19

AUDyC : Critère de similarité Fonction d’appartenance Mesure de similarité Classes et prototypes gagnants 20

AUDyC : Procédure de Création Création de classes Initialisation de prototypes Comment déterminer Σini ? Extraire préalablement un Échantillon Hypothèse simplificatrice : 21

AUDyC : Procédure d’Adaptation Adaptation récursive de Prototypes/Classes De la règle de décision : Ajout et retrait d’information sur une fenêtre 22

AUDyC : Procédure de Fusion Problématique d’ambiguïté Si fusion Si Adaptation (a) Erreurs de modélisation Erreurs de modélisation (b) (c) Données ambiguës 23

AUDyC : Procédure de scission Défaut de modélisation Défaut 24

Simulation de l’AUDyC Simulation 1 : 2 classes évolutives générées (1000 données/classe) Simulation 2 : 1 classe statique (1000 données), 2 classes évolutives qui fusionnent (2000 données/classe) Limitations de l’AUDyC Modèle paramétrique : données générées suivant la loi gaussienne Complexité algorithmique : grande dimension Capacités d’adaptation en Environnement non-stationnaire : Création de classes, Adaptation et Suivi de classes évolutives, Fusion de classes 25

Plan Introduction Classification dynamique : Problématique Description générique de classifieurs dynamiques Algorithmes de classification dynamique AUDyC (AUto-Adaptive & Dynamical Clustering) SAKM (Self-Adaptive Kernel Machine) Expérimentation Conclusion et Perspectives 26

SVM et Méthodes à noyau SVM et Méthodes à noyau [Schölkopf et al., 2003] Outils récents, Résultats attractifs en classification Apprentissage statistique [Vapnik, 1995] Minimisation de risque et Régularisation Espace de Hilbert à noyau reproduisant (RKHS) Estimateur de densité : méthodes à noyau Bonnes capacités de généralisation Modèle non paramétrique (Noyau RBF: universalité) SVM mono-classe en ligne: [Gretton & al., 2003; Desobry et al., 2005] et [Kivinen et al., 2004] 27

SAKM : Modèle de classification Espace RKHS Modèle de classe Fonction objectif Outlier MSV 28

SAKM : Critère de similarité Mesure de similarité à noyau Critère : classes gagnantes 29

SAKM : Création et Mise à jour Création de classes Adaptation de classe Gradient stochastique 30

SAKM : Procédure de Fusion Fusion de classes Critère d’ambiguïté Opération de fusion Calculer 31

Simulation du SAKM Simulation 1 : 2 classes évolutives générées (1000 données/classe) Simulation 2 : 1 classe statique (1000 données), 2 classes évolutives qui fusionnent (2000 données/classe) Capacités d’adaptation en Environnement non-stationnaire : Création de classes, Adaptation et Suivi de classes évolutives, Fusion de classes 32

Paramètres des algorithmes AUDyC : Paramètres de modèle SAKM : Paramètres de modèle Paramètres de robustesse (commun) Initialisation des paramètres 33

Comparaison : AUDyC vs SAKM Mélange gaussien multimodal - Approximation, Loi gaussienne Processus d’apprentissage - Modèles successifs exacts - Scission de classes Complexité algorithmique - Polynomial : O(D3xJ2xL) - Ordre 3 avec la dimension Robustesse au bruit - Moins sensible au bruit SAKM Fonctions d’apprentissage à noyau - Distribution inconnue Processus d’apprentissage - Modèles successifs approximatifs - Pas de scission de classes Complexité algorithmique - Polynomial : O(Dxד2xMxL) - Linéaire avec la dimension Robustesse au bruit - Plus sensible au bruit Données de distribution gaussienne et de dimension faible : AUDyC Distribution de données inconnue ou de plus grande dimension : SAKM 34

Plan Introduction Classification dynamique : Problématique Description générique de classifieurs dynamiques Algorithmes de classification dynamique AUDyC (AUto-Adaptive & Dynamical Clustering) SAKM (Self-Adaptive Kernel Machine) Expérimentation Conclusion et Perspectives 35

Surveillance de Processus Projet ADEME (n° 0274032) Surveillance en ligne d’un processus thermique Objectif : Détecter l’encrassement des composants Intérêt des techniques de classification dynamique Filtre Réchauffeur Echangeur Système client Pompe Débit chaud froid Pressure Vase 36

Surveillance de Processus Mise au point du système de surveillance Modélisation de l’état du processus : vecteur forme Rapport de pressions : ΔPcomp. / ΔPpompe Sensibilité aux pertes de pression au sein du composant Modélisation en ligne du mode de fonctionnement Algorithmes de classification dynamique Apprentissage continu des modes et suivi d’évolutions Suivre le mode courant du processus Labelliser les nouveaux modes détectés - Modes de défaut - Encrassement simulé par des vannes Détection de l’encrassement Mode courant similaire au mode normal : Pas d’alerte Mode courant évolue vers un mode de défaut : Alerte 37

Résultats AUDyC SAKM Apprentissage des modes Apprentissage des modes Suivi d’évolution et détection SAKM Apprentissage des modes Suivi d’évolution et détection EENC MFN FENC RENC EENC MFN FENC RENC 38

Surveillance de Processus Mise au point d’un prototype opérationnel Interface Utilisateur : Logiciel réalisé avec Python 39

Conclusion Apprentissage Automatique : Classification dynamique Difficultés : apprendre les connaissances de façon continue Nécessité : modélisation adaptative et du suivi d’évolutions Algorithmes originaux de classification dynamique Techniques avancées de traitement de signal et de RdF Capacités d’adaptation en environnement non-stationnaire Mise au point de SAD opérationnels Couplage avec des outils supplémentaires (outils détection) Utilisables dans divers domaines (Diagnostic médical, Maintenance industrielle, Alerte sismique, …) 40

Perspectives Amélioration des algorithmes proposés SAKM : Règle de scission, Règle de mise à jour exacte AUDyC : Mise à jour de la famille exponentielle Approfondir l’étude théorique pour les deux algorithmes Aide au réglage des paramètres Compléter l’étude de convergence Validation sur d’autres applications Supervision des processus industriels Suivi de Processus hybrides Détection de rupture (exemple: dans les signaux audio) 41

What else ? 42

http://babarazi.free.fr Merci pour votre attention Je suis à votre disposition habiboulaye@gmail.com 43