Reconnaissance de chiffres manuscrits

Slides:



Advertisements
Présentations similaires
Petit guide explicatif…
Advertisements

Apprentissage spectral
Managing Domain Knowledge and Multiple Models with Boosting Peng Zang – Charles Isbell.
1 Off road obstacle avoidance through end to end learning Yann LeCun, Urs Muller, Jan Ben, Eric Cosatto, Beat Flepp.
Regroupement (clustering)
RECONNAISSANCE DE FORMES
Conscientisation et Formation Plaidoyer au sein du Mouvement
Application de réseaux bayésiens à la détection de fumées polluantes
A Pyramid Approach to Subpixel Registration Based on Intensity
Xialong Dai, Siamak Khorram
Enjeux de l’expérimentation
Eco-conception OLIVAR LOZINGUEZ.
LI.A ça ressemble à ça… des fois…. Ou pas… Rappels et définition de lIA – Lidée quon sen fait – Jusquoù on va aujourdhui / dans le futur? – Petit Etat.
Pédagogie religieuse Dr. Nicole Awais
Mirta B. Gordon Laboratoire Leibniz-IMAG Grenoble
Mirta B. Gordon Laboratoire Leibniz-IMAG Grenoble
Mesure et suivi de la sténose carotidienne
Support Vector Machine
Algorithmique et Programmation
RECONNAISSANCE DE FORMES
Modélisation d'environnements forestiers
Classification Multi Source En Intégrant La Texture
Applications du perceptron multicouche
Une approche radicalement nouvelle « Le programme de la classe de 5ème est consacré à la poursuite de létude du développement durable. » HUMANITÉ ET DEVELOPPEMENT.
Gestion de projet TC 1 Séance 4 Mme Molard
Méthode des k plus proches voisins
Chapitre 3 : Détection des contours
DEA Perception et Traitement de l’Information
Transformation linéaires
Reconnaissance d’empreintes digitales
Apprentissage par arbre de décision
Livret Scolaire Numérique.
Soutenance de stage 16 Mai au 5 Août 2011
Soutenance de stage 16 Mai au 5 Août 2011
Introduction à la reconnaissance:
Overview of Performances Course Oct 4th, 2006 Frédéric NICAISE.
Synthèse de textures par rééchantillonnage de patchs Vincent MICHEL Aurélien BOFFY Janvier 2007.
Reconnaissance des personnes par le visage dans des séquences vidéo
Méthodes de tri.
Classification : objectifs
Fast and Furious Decision Tree Induction
Extraction de segments pour la reconnaissance de symboles : Une approche robuste par Transformée de Hough Présenté par : Simon BERNARD Encadré par : Jean-Marc.
Introduction au Génie Logiciel
Sujets spéciaux en informatique I PIF Approches non-paramétriques u Technique de classification NN u Technique de classification k-NN u Erreurs.
S. Canu, laboratoire PSI, INSA de Rouen
Système Minidosa.
Les réseaux de neurones à réservoir en traitement d’images
Institut de sciences et technologies Département d’informatique
Élaborer un scénario Groupe de formateurs inter langues Midi-Pyrénées 2013 DAFPEN Académie de Toulouse Formation inter degrés 2013.
Vérification du locuteur avec des méthodes segmentales en collaboration avec : Jean HENNEBERT Jan CERNOCKY Gérard CHOLLET.
Réseaux de neurones à base radiale
Karima Tabari1, Mounir Boukadoum1, Sylvain Chartier2,3, Hakim Lounis1
Simulation du rôle de la communication dans l’établissement d’un réseau de liens sociaux Projet GPL :
2ème Partie : Le MANAGER de l ’UC Chapitre 5 - Les Outils du Manager -
Les réseaux de neurones à réservoir en traitement d’images
Supervision à distance d’une ligne de conditionnement temps réel 16/12/20101INSA de LYON - H4201.
3°A & Que peut-on faire après la troisième ? TONDELIER Clémence ZIAK
Sabrina Tollari, Hervé Glotin, Jacques Le Maitre
Club L.A.S. Photo Vieux-Charmont
Concepts avancés en mathématiques et informatique appliquées MAP-6014.
Suivi d’Horizons Sismiques
I Présentation II Gestion de projet 1 - Planning 2 - Risques
Master Sciences - Mention informatique Ingénierie du Logiciel et des Connaissances Ingénierie du Logiciel et des ConnaissancesQualité 4 janvier 2010 Jean.
31/05/2007Projet Master 11 Présentation ludique de la recherche opérationnelle à la fête de la science Année universitaire 2006/2007 Sylvain FIX Julien.
Google Keep. Pourquoi Google Keep ?  Google Keep est une application de téléphone intelligent et une extension de Google Chrome, qui permet de prendre.
Tests relatifs aux variables qualitatives: Tests du Chi-deux.
la reconnaissance de visages
1 Reconstruction des événements Top enregistrés avec le détecteur ATLAS Apport des techniques multi-variables Diane CINCA Stage de Master 2 ème année.
SOCLE COMMUN Enseigner par compétences Cathia BATIOT.
الهيئة العامة لحماية المستهلك أساليب الترويج وتأثيراتها على المستهلك خليفة التونكتي - مستشار المنافسة - 1.
Transcription de la présentation:

Reconnaissance supervisee de chiffres manuscrits Projet de Master SIS M1 Option Imagerie Numérique Reconnaissance supervisee de chiffres manuscrits Benjamin Duplex – Dimitri Kudelski – Guillaume Martinez Encadrants : Jean-Marc Boï et Bernard Fertil

Reconnaissance de chiffres manuscrits sommaire Explication du problème Définition Résultat manuel Solution mise en place Mise en pratique Problèmes engendrés Influence des paramètres Analyse des résultats Performances du programme Gestion des erreurs Bilan Notre programme Pistes à explorer Reconnaissance de chiffres manuscrits

I. Explication du problème 1. Définition Pouvoir identifier correctement un chiffre manuscrit Typiquement un problème de classement Grâce à un apprentissage supervisé, être capable de prendre une décision Application directe aux systèmes de tris postaux ou bancaires Reconnaissance de chiffres manuscrits

I. Explication du problème 2. Résultat manuel : super expert Résultat du super expert : moyenne de trois résultats Réussite = nombre de bonnes réponses (en vert) / nombre total d’images Ici, réussite de presque 98 % (42 mauvaises réponses sur 2007 images) Répartition des réponses : 1 2 3 4 5 6 7 8 9 354 262 196 159 154 165 142 164 172 Classe de l’image Classe dans laquelle le super expert a placé l’image Reconnaissance de chiffres manuscrits 3 3

I. Explication du problème 3. Solution mise en place Algorithme des "k plus proches voisins" 3 phases différentes de l'algorithme Apprentissage Comparaison Décision Problème Comment faire lorsque l’effectif des classes n’est pas le même pour toutes les classes ? k = 5 Reconnaissance de chiffres manuscrits

Reconnaissance de chiffres manuscrits II. MISE EN PRATIQUE 1. Problèmes engendrés L’effectif des différentes classes de la base d’apprentissage doit-il être le même ? La métrique est-elle importante ? Comment choisir k ? Quel est son rôle ? Quelle est l'importance de la taille de la base d'apprentissage ?  Quel critère est le plus discriminant ? Reconnaissance de chiffres manuscrits

Reconnaissance de chiffres manuscrits II. MISE EN PRATIQUE 2. Influence des paramètres Effectif des différentes classes dans la base d'apprentissage : Solution retenue : utilisation d’une pondération pour chaque classe Reconnaissance de chiffres manuscrits

Reconnaissance de chiffres manuscrits II. MISE EN PRATIQUE 2. Influence des paramètres Evolution du classifieur en fonction de la métrique (ex. Minkowski) : Solution retenue : utilisation de la distance euclidienne (distance de Minkowski de degré 2) p : degré de la fonction distance n : taille des images (largeur * hauteur) Reconnaissance de chiffres manuscrits

Reconnaissance de chiffres manuscrits II. MISE EN PRATIQUE 2. Influence des paramètres Importance du nombre de voisins k k grand : classifieur peu sensible au bruit k petit : meilleur affinage lorsqu'il y a peu de différences entre les images Solution retenue : utilisation de k proche de 10 Reconnaissance de chiffres manuscrits

Reconnaissance de chiffres manuscrits II. MISE EN PRATIQUE 2. Influence des paramètres Taille de la base d'apprentissage : Solution retenue : utilisation de l’intégralité de notre base d’apprentissage Reconnaissance de chiffres manuscrits

Reconnaissance de chiffres manuscrits II. MISE EN PRATIQUE 2. Influence des paramètres Etude de tous les paramètres et de leur influence Combinaison des paramètres pour en extraire le résultat le plus correct Classifieur non parfait, apparition d'erreurs Reconnaissance de chiffres manuscrits

III. Analyse des résultats 1. Performances du programme Comparaison par rapport aux références : Utilisation de la base MNIST (Modified National Institute of Standards and Technology) : Base d'apprentissage de 60 000 images Base de test de 10 000 images D’après la littérature, les différents algorithmes de référence donnent des résultats entre 88% et 99% de réussite Notre programme atteint presque 97% de bonnes réponses Bilan très encourageant Possibilité d’améliorer l’efficacité sans toutefois arriver à la perfection Reconnaissance de chiffres manuscrits

III. Analyse des résultats 2. Gestion des erreurs 2 types d'erreurs : ambiguïté et erreur de saisie Hésitation entre un 4 et un 6 : ambiguïté  mise en place d’un seuil entre les classes majoritaires Image qui ne représente rien : erreur de saisie  mise en place d’un second seuil à partir duquel on peut dire que les images voisins sont trop éloignées. Ajout d'une classe supplémentaire au classifieur, la classe « inconnu » Reconnaissance de chiffres manuscrits

IV. BILan 1. Notre programme Résultat du classifieur : ~ 94 % de réussite (127 erreurs ou classées comme « inconnu ») Nombre d’image rangées dans la classe « inconnu » : 38 (qui font toutes partie des 42 du super expert) 1 2 3 4 5 6 7 8 9 I 353 257 178 150 175 10 141 11 164 138 152 172 Classe de l’image Classe dans laquelle le classifieur a placé l’image Reconnaissance de chiffres manuscrits 13 13

Reconnaissance de chiffres manuscrits IV. BILan 1. Notre programme Ecrit en C et interfacé avec Glut, portable (fonctionne sous Linux et Windows) Reconnaissance de chiffres manuscrits

Reconnaissance de chiffres manuscrits IV. BILan 1. Notre programme Reconnaissance de chiffres manuscrits 15 15

Reconnaissance de chiffres manuscrits IV. BILan 1. Notre programme Utilisation du classifieur déclinée en plusieurs applications : programme du super expert Reconnaissance de chiffres manuscrits

Reconnaissance de chiffres manuscrits IV. BILan 1. Notre programme Utilisation du classifieur déclinée en plusieurs applications : programme de dessin Reconnaissance de chiffres manuscrits 17 17

Reconnaissance de chiffres manuscrits IV. BILan 2. Pistes à explorer Pré-traitement des images (rotation, translation, réduction de bruit, etc…) Réduction de dimension grâce à l'ACP Construction d'un classifieur en fonction des situations Affinage de l'analyse lorsqu'il y a ambiguïté grâce à un sous-classifieur Reconnaissance de chiffres manuscrits