Application de réseaux bayésiens à la détection de fumées polluantes David Gacquer LAMIH, Université de Valenciennes et du Hainaut-Cambrésis Equipe Raisonnement Automatique et Interfaces Homme Machine
Illustration du problème :
Sommaire Présentation du système DETECT Comparaison entre le réseau naïf et l’algorithme des K plus proches voisins Analyse des résultats Amélioration du réseau par apprentissage de la structure Conclusion et perspectives de recherches
Problème et solution actuelle Enregistrement des émissions de fumées par caméra Calcul de signaux par traitement d’image (densité, surface …) Attribution d’un niveau de pollution [0..3] à l’aide d’un système de règles
L’objectif Affecter automatiquement une classe à un panache de fumée. Approche supervisée : les classes et leur nombre sont déjà connus, l’objectif est d’affecter une classe à tout panache non encore classé, à partir d’une base d’apprentissage. Modélisation : chaque nœud correspond à un des signaux mesurés, un nœud supplémentaire est utilisé pour représenter la variable de classe.
Première approche : le réseau naïf Nœuds périphériques = signaux Nœud central (variable de classe) = niveau de pollution Apprentissage = estimation des tables de probabilité
Comparaison avec les k plus proches voisins Principe de l’algorithme : Exemple simple où trois variables sont utilisées. Deux nuages de points sont considérés, ceux de niveau 1 et 3. Le panache N non encore classé, plus proche des points de niveau 3, se verra attribuer le même niveau de gravité que ses plus proches voisins.
Implémentations, tests et analyses Modélisation des prédictions : Matrice de confusion Niveau attribué par l’algorithme utilisé Fausses alarmes Niveau attribué par l’expert Non détections Critères d’évaluation : Taux d’erreur global. Taux de satisfaction client (non détections et fausses alarmes).
Résultats obtenus Réseau bayésien naïf Erreur globale : 12,97% Satisfaction client : 86,1% K plus proches voisins Erreur globale : 9,45% Satisfaction client : 95,08%
Analyse des résultats Réseau bayésien moins efficace que les K plus proches voisins. Améliorer le réseau bayésien naïf par apprentissage de la structure. Utiliser la BNT Matlab de Murphy et le Structure Learning Package de P. Leray et son équipe.
Apprentissage de la structure Réseau naïf = variables supposées indépendantes entre elles lorsque la variable de classe est connue. Autoriser les arcs entre les nœuds pour lever cette restriction. Difficulté : espace des graphes candidats trop complexe pour être entièrement parcouru méthodes heuristiques.
Apprentissage de la structure Tree Augmented Naive (TAN) : - le nœud classe est toujours la racine du réseau - liens entre les nœuds périphériques respectant une structure d’arbre Greedy Search (recherche gloutonne) - recherche d’une structure par ajouts/retraits successifs d’arcs.
Apprentissage de la structure Algorithme Greedy Search Erreur globale : 15,56% Satisfaction client : 91,79% Tree Augmented Naive (TAN) Erreur globale : 16,46% Satisfaction client : 89%
Récapitulatif des résultats Erreur globale Satisfaction client Réseau bayésien naïf 12,97% 86,1% Tree Augmented Naive (TAN) 16,46% 89% Algorithme Greedy Search 15,56% 91,79% K plus proches voisins 9,45% 95,08%
Conclusions Réseau naïf satisfaisant mais trop restrictif par rapport à d’autres méthodes. Apprentissage de structure complexe : - méthodes basées sur des scores ne donnent pas toujours les résultats attendus en classification - méthodes heuristiques peuvent s’arrêter sur des optimum locaux
Perspectives de recherche Autres algorithmes : - arbre de poids maximal - algorithme K2 … Approche Multi Net et Similarity Networks : - un réseau par valeur de la variable de classe - dépendances entre variables différentes selon la classe
Merci