Karima Tabari1, Mounir Boukadoum1, Sylvain Chartier2,3, Hakim Lounis1

Slides:



Advertisements
Présentations similaires
Un réseau de neurones artificiels montrant la persévérance et la distractibilité dans le wisconsin card sorting test.
Advertisements

Plan Les réseaux de neurones Le réseau RBF RBF et Mushroom Historique
Travail de Fin d’Etudes – été 2009
Analyse en composante indépendante
Affichage interactif, bidimensionnel et incrémental de formules mathématiques Hanane Naciri et Laurence Rideau INRIA Sophia Antipolis CARI'2000.
RECONNAISSANCE DE FORMES
LES RESEAUX DE NEURONES
3. Analyse et estimation du mouvement dans la vidéo
A Pyramid Approach to Subpixel Registration Based on Intensity
Modélisation et commande hybrides d’un onduleur multiniveaux monophasé
Laboratoire dInformatique et dImagerie Industrielle Traitement des Images Couleur Partie 3 : un exemple de traitement dimages couleur : Correction chromatique.
Identification des personnes par l’iris
Vers une approche de construction de composants ontologiques pour le web sémantique – synthèse et discussion. Nesrine Ben Mustapha (RIADI, ENSI Tunis)
Améliorer les performances du chiffrage à flot SYND
Mirta B. Gordon Laboratoire Leibniz-IMAG Grenoble
Mirta B. Gordon Laboratoire Leibniz-IMAG Grenoble
Une théorie générale des réseaux connexionnistes
Prétraitement de l’image
Applications du perceptron multicouche
Réalisateur : PHAM TRONG TÔN Tuteur : Dr. NGUYEN DINH THUC
Reconnaissance de visages
FRE 2645 CIDED04 : 22 Juin 2004 Système de reconnaissance structurelle de symboles, basé sur une multi représentation en graphes de régions, et exploitant.
Méthode des k plus proches voisins
DEA Perception et Traitement de l’Information
RECONNAISSANCE DE FORMES
Construction de modèles visuels
Réseaux de neurones.
Transformation linéaires
Les réseaux de neurones
Mémoires associatives
Modélisation de la topologie avec le Graphe Génératif Gaussien
PIF-6003 Sujets spéciaux en informatique I
SUJETS SPÉCIAUX EN INFORMATIQUE I
SUJETS SPÉCIAUX EN INFORMATIQUE I
Chapitre 4 : Morphologie Mathématique
Mise en oeuvre des MMCs L'utilisation des MMCs en reconnaissance des formes s'effectue en trois étapes : définition de la topologie de la chaîne de Markov,
Appariement de deux images
Recherche dun même objet / scène Approches basées sur des descripteurs locaux Approches basées sur des descripteurs globaux.
Extraction Automatique de formes complexes : Application à la création de modèle anatomique de la tête J. Piovano, T. Papadopoulo Séminaire Odyssee 9,
Université d’Avignon et du pays du Vaucluse
La régression multiple
Typologie des outils L ’exerciseur Le tutoriel :
Recherche d’ensembles chromatiques
Les réseaux de neurones
Introduction à la reconnaissance:
* * *** * ** *** ** * * * * P < 0.05 ** P < 0.01 *** P < GENRE Aucune différence entre les groupes Reconnaissance du genre et des expressions faciales.
Reconnaissance des personnes par le visage dans des séquences vidéo
Identification basée sur l’iris (Iris recognition)
Christelle Scharff IFI 2004
Extraction de segments pour la reconnaissance de symboles : Une approche robuste par Transformée de Hough Présenté par : Simon BERNARD Encadré par : Jean-Marc.
Modèles Mathématiques et représentation discrètes pour la description des images couleur Luc Brun.
Les réseaux de neurones à réservoir en traitement d’images
Institut de sciences et technologies Département d’informatique
Programmation Création d’une mire 1 afficher une image
2008/ Plan du cours 1.Introduction –Contenu du cours 2.Logique mathématique –Calcul propositionnel –Calcul des prédicats –Logique floue et aide à.
Réseaux de neurones à base radiale
Apparence globale 1 image = 1 vecteur Base apprentissage Rotation –capture les variabilités Troncature –Quelques coefficients Représentation linéaire Espace.
Reconnaissance de chiffres manuscrits
Les réseaux de neurones à réservoir en traitement d’images
Dorina Surcel et René Laprise
Mémoires associatives Le modèle BSB/Eidos Mounir Boukadoum.
Le chaos pourquoi ? Permet de modéliser un type de mouvement récent qui n’est ni uniforme, ni accéléré. Des dynamiques chaotiques ont été mises en évidence.
GPA-779 Application des systèmes experts et des réseaux de neurones.
Suivi d’Horizons Sismiques
Extreemly Random Trees + SubWindows HOURRI Soufiane NAIT ABDELLAH OUALI Ismail OUFQIR Anouar OUSSAFI Mohammed.
Traitement d’images 420-D78-SW A15 Semaine 02.
Filtrage des images.
1 Comparaison des différentes méthodes de recherche de dose en oncologie, avec prise en compte de toxicités modérées et gradées Monia Ezzalfani 2 éme année.
Nadine Postiaux Bureau d’Appui pédagogique en Polytech L’Apprentissage par Problème et par projet à l’Université.
Transcription de la présentation:

Karima Tabari1, Mounir Boukadoum1, Sylvain Chartier2,3, Hakim Lounis1 Application d’une mémoire associative bidirectionnelle à fonction de sortie chaotique à la reconnaissance d’expressions faciales Karima Tabari1, Mounir Boukadoum1, Sylvain Chartier2,3, Hakim Lounis1 1Université du Québec à Montréal, 2Université du Québec en Outaouais, 3Institut Philippe-Pinel de Montréal  

Motivation Les émotions de l’apprenant sont un facteur important pour un système tutoriel intelligent Les émotions sont souvents exprimées à l’aide d’expressions faciales La reconnaissance des expressions faciales demande habituellement des algorithmes complexes, dont les résultats ne sont pas parfaits

Quelques approches Transformée en ondelettes de Gabor sur 34 points Analyse de corrélation en phase de rappel 75-85% de réussite Vecteurs propres de regions choisies Prétraitement par ACP MLP avec 1 couche cachée 86% de réussite

Les mémoire associatives D’un grand intérêt théorique pour expliquer les capacités d’association du cerveau humain Un nouveau modèle corrige plusieurs limitations des mémoires associatives classiques (e.g. apprentissage binaire). Architecture récurrente à fonction de sortie chaotique

Topologie du modèle Les dimensions des couches X et Y n’ont pas à être égales V n’est pas la transposée de W

Règle d’apprentissage La règle d’apprentissage est interactive

Règle d’apprentissage Les matrices synaptiques convergent lorsque entrées = sorties

Fonction de sortie Carte cubique dans [-1,1] : autrement

Algorithme d’apprentissage 1- Sélection aléatoire d’une paire (x[0], y[0]) 2- Calcul de x[t] et y[t] selon la nouvelle règle de sortie. 3- Mise à jours des poids selon la règle d’apprentissage. 4- Répétition des étapes 1 to 3 jusqu’à la convergence de la matrice des poids.

Ensemble d’apprentissage Base de données CAFE (California Facial Expressions) Images photographiques des visages de 50 sujets 7 images par sujet reflétant les émotions (en colère, dégoûté, heureux, triste, craintif, neutre, surpris). 380x240 pixels par image, 8 bit de profondeur

Exemple de 5 sujets, 4 émotions

Méthodologie Taille des images réduite à 95x60 pixels Tons de gris normalisés entre [-1, 1] Paramètre d’apprentissage =0.1 et =0.00115 (région non chaotique) Étude de performance pour des prototypes, face au bruit gaussien, à inversion de pixels, à la rotation et aux patrons partiellement masqués

Bruit gaussien (30dbW)

Inversion de pixels (20%)

Rotation (20o)

Résultats Convergence après 15-17 époques d’apprentissage (300-340 présentations) pour des vecteurs d’entrée de de 5700 éléments (95x60 pixels)

Résultats Bruit Rappel correct (%) Nil 100 Gaussien (30 dBW) Inversion de pixels (20%) Inversion de pixels (40%) Inversion de pixels (50%) 60 Inversion de pixels (60%) 15 Inversion de pixels (>60%) Masque 1 Masque 2 Rotation (10o) 30 Rotation (20o) 35

Généralisation pour CAFE

Généralisation pour CAFE

Généralisation pour CAFE

Discussion et conclusion Pour le bruit gaussien, et le bruit par inversion de pixels d’intensité faible à modérée (<40%), le taux de reconnaissance est 100 %. Le réseau a pu identifier la bonne lettre à associer malgré la suppression de la région oculaire, une région importante pour l'identification des émotions. Les résultats pour l’ensemble complet des émotions et un nombre plus élevé de sujets révèlent une excellente capacité de mémoire. La propriété précédente peut être mise à profit pour pallier à la faible performance du réseau pour des images tournées, qui peuvent être apprises comme des patrons distincts. Les résultats obtenus sont surprenants en égard à la simplicité relative de notre architecture.

Peut-on faire mieux ?