Ce document et les informations qu’il contient sont la propriété de Sagem. Ils ne doivent pas être copiés ni communiqués à un tiers sans l’autorisation.

Slides:



Advertisements
Présentations similaires
Classification Multi Source En Intégrant La Texture
Advertisements

PRESENTE PAR: KASHAMA LUBEMBE Dieudonné.
Ghost (Création d'image Système)‏ C.R.I.P.T Informatique (BOYER Jérôme)‏
L'image: Le codage des images BacPro SEN Lycée Condorcet.
AUTO - EVALUATION DE L'ELEVE GENERALITES POURQUOI ? - Permettre à l'élève de mesurer ses réussites, ses difficultés et d'identifier ses besoins. - L 'élève.
Modélisation Géométrique Cours 4 : Acquisition de la géométrie.
Atelier 1 Le problème du surpoids sur géogébra. Etude de la prévalence du surpoids: (document Ressources pour la classe de terminale) Situation: On souhaite.
CINI – Li115 1 Semaine 9 Algorithmes de tri ● Introduction ● Tri à bulle ● - principe ● - algorithme ● - efficacité ● Tri par sélection ● - principe, algorithme,
Gestion des données issues des réseaux de mesures de la qualité : densification et besoin de flexibilité SIG, Géo-traitements.
Hypergraph Lossless Compression, Quadtrees et notion de complexité sur les images G graphes et sécurité Sujet de stage de Master en cours: Sujet de thèse.
Le système Raid 5 Table des matières Qu'est ce que le RAID ? Les objectifs Le raid 5 Les avantages et les inconvénients Les composants d’un Raid.
Comparing color edge detection and segmentation methods Projet TIM.
Active Learning for Natural Language Parsing and Information Extraction, de Cynthia A. Thompson, Mary Elaine Califf et Raymond J. Mooney Philippe Gambette.
Présentation  Objectif : Une initiation au « Machine learning ».  Comprendre et assimiler les différentes techniques permettant d’indexer ou de classifier.
Chapitre 1 : Cinématique Objectif cinématique : étudier le mouvement des solides sans s’occuper des causes du mouvement  parle de position, trajectoire,
La résolution de problèmes ouverts au cycle 2 et cycle 3 « Mettre les élèves en situation d’essayer, conjecturer, tester, prouver. » (IREM de Lyon)
Les rprésentation des signaux dans le cadre décisionnel de Bayes Jorge F. Silva Shrikanth S. Narayanan.
Système d’annotation et de détection de modèle de véhicule Université de Sfax *** Institut Supérieur d’Informatique et de Multimédia de Sfax Réalisé par.
Traitement d'images en Java avec JAI
Analyse, Classification,Indexation des Données ACID
EPREUVES HISTOIRE ET GEOGRAPHIE
DOC MYCK : Programmation
Représentation des nombres réels
J’ai un bug, qu’est-ce que je peux faire ? Samuel Thibault 7 Mars 2017
Les bandes de Bollinger
Algorithmique Avancée et Complexité Chap2:Complexité et Optimalité
NEUROSCIENCES NEUROEDUCATION.
Précision d'une mesure et chiffres significatifs
Centralisation de logs
Technologies de l’intelligence d’affaires Séance 13
Plans d’experiences : plans de melanges
Routage S 3 - Questionnaire N°1
Technologies de l’intelligence d’affaires Séance 11
Technologies de l’intelligence d’affaires Séance 12
Apprentissage profond Q
Deep Learning. 2 Plan réseaux de neurones artificiels Définition Fonction d’activation Fonction de cout Propagation et rétropropagation Algorithme d’optimisation.
Réseaux de neurones appliqués à la reconnaissance de caractères
L’ATTERISSAGE EN CAMPAGNE.  SOMMAIRE:  1/ Introduction  2/ Pourquoi atterrir en campagne  3/ L’intérêt  4/ La méthode.
Des mathématiques derrière l’intelligence artificielle
DÉTECTION DE DÉFAUTS DANS DES HOLOGRAMMES DE PHASE
OPTIMISATION 1ère année ingénieurs
Gestion des photos Organisation du disque dur, Navigation
Algorithmique Avancée et Complexité
Les méthodes non paramétriques
CHAPTER 2: Apprentissage supervisé
Arbres de décision.
CHAPTER 10: Discrimination Linéaire
VI. Introduction à l ’indexation
Se déplacer précocement
Présentation 8 : Redressement des estimateurs
Les différentes Situations d’apprentissages :.  Rougier (2009) explique que les situations d'apprentissage, choisies après avoir déterminé les objectifs,
Sujets Spéciaux en informatique II
Extraction de caractéristiques pour la classification d’images
Moteurs de recherches Data mining Nizar Jegham.
Sommaire : Les capteurs de force. Les capteurs à jauges de contraintes
Programme d’appui à la gestion publique et aux statistiques
IV- CORRECTION A AVANCE DE PHASE
IV- CORRECTION A AVANCE DE PHASE
INTELLIGENCE ARTIFICIELLE
Tableau de bord d’un système de recommandation
Test de performances. Test de performances:  Un test de performance est un test dont l'objectif est de déterminer la performance d'un système informatique.
Encadrée par: - Mr. Abdallah ALAOUI AMINI Réalisée par : -ERAOUI Oumaima -DEKKAR Amal - ES-SAHLY Samira -Houari Mohammed PROGRAMMATION MULTIOBJECTIFS.
INTELLIGENCE ARTIFICIELLE
IFT 615 – Intelligence artificielle Consignes pour l’examen final
Global Positioning System
C. Coggiola, D. Blumstein, F. Niño, S. Calmant,
STATISTIQUE INFERENTIELLE LES TESTS STATISTIQUES.
Chapitre P4 : Mouvement d’un solide indéformable I) Quelques rappels de seconde : 1)Nécessité d’un référentielNécessité d’un référentiel 2)TrajectoireTrajectoire.
Transcription de la présentation:

Ce document et les informations qu’il contient sont la propriété de Sagem. Ils ne doivent pas être copiés ni communiqués à un tiers sans l’autorisation préalable et écrite de Sagem. DEEP LEARNING EN RECONNAISSANCE D’IMAGES : DETECTION DE CIBLES FAIBLEMENT RESOLUES Jean. OGIER DU TERRAIL – Sagem F. JURIE – Université de Caen/CNRS

Ce document et les informations qu’il contient sont la propriété de Sagem. Ils ne doivent pas être copiés ni communiqués à un tiers sans l’autorisation préalable et écrite de Sagem. Le problème de Sagem: allier précision et rapidité Sagem cherche à améliorer les performances des têtes chercheuses de missile AIR- SOL. L’objectif: seul le véhicule objectif ou cible doit être touché frappe chirurgicale. Problèmes: le missile est très rapide (300m/s) et n’a le temps de corriger sa trajectoire que pendant quelques instants il ne voit qu’une image L’image dont le missile dispose est mal résolue

Ce document et les informations qu’il contient sont la propriété de Sagem. Ils ne doivent pas être copiés ni communiqués à un tiers sans l’autorisation préalable et écrite de Sagem. Une base de données Open-Source: VeDAI Pour tester ce détecteur il nous faut un environnement de test comprenant des images prises dans des conditions proches de notre problème. Sébastien Razakarivony docteur a construit une nouvelle base de données d’imagerie aérienne: VeDAI ( [1] S. Razakarivony and F. Jurie, Technical Report GREYC , GREYC CNRS UMR 6072, Universite de Caen Sebastien Razakarivony. Apprentissage de variétés pour la Détection et Reconnaissance de véhicules faiblement résolus en imagerie aérienne. Vision par ordinateur et reconnaissance de formes [cs.CV]. Université de Caen Basse-Normandie, Français

Ce document et les informations qu’il contient sont la propriété de Sagem. Ils ne doivent pas être copiés ni communiqués à un tiers sans l’autorisation préalable et écrite de Sagem. La détection: métriques Cette image est issue de la base VeDAI et montre toute la difficulté du problème. Par exemple ce détecteur fictif aurait les caractéristiques: R=2/2=1 et P=2/7=0.29

Ce document et les informations qu’il contient sont la propriété de Sagem. Ils ne doivent pas être copiés ni communiqués à un tiers sans l’autorisation préalable et écrite de Sagem. Quelques unes des approches de Sébastien Pouquoi se donner le mal d’extraire des caractéristiques ? Posez vous la question: Qu’est ce qui distingue une imagette de char de celle d’un arbre en terme de pixels ? (La réponse est: c’est difficile à dire) Extraction de descripteurs ayant plus de sens que les pixels bruts (et de dimension réduite !) HOG (contours) LBP (texture) Puis classification avec un SVM linéaire: Dans ce nouvel espace des descripteurs la classification est facile après un apprentissage. Ce qui est difficile c’est de créer les bons descripteurs ! En réalité Sébastien utilise des descripteurs bien plus compliqués (autoencodeurs discriminants sur HOG) et utilise une cascade de classifieurs (pour plus de détails voir sa thèse)

Ce document et les informations qu’il contient sont la propriété de Sagem. Ils ne doivent pas être copiés ni communiqués à un tiers sans l’autorisation préalable et écrite de Sagem. Résoudre le problème des descripteurs Les résultats de Sébastien sont très bons: (80% de rappel pour la classe voiture pour 1 FPPI mais à 0.01 FPPI le rappel chute à 21%) Nécessité de changer d’approche pour plus de précision L’idée principale, est d’apprendre les descripteurs en même temps que la frontière de décision: Descripteur final Convolutional Neural Network Score (distance à la marge pour le SVM par exemple) FPPI=taux de faux positifs par images (à relier à la Précision)

Ce document et les informations qu’il contient sont la propriété de Sagem. Ils ne doivent pas être copiés ni communiqués à un tiers sans l’autorisation préalable et écrite de Sagem. Que fait un réseau de neurones convolutif. Chaque couche calcule la moyenne pondérée de ses entrées et la fait passer par une activation non linéaire … (xn_couches) Pooling, BN, ou autres

Ce document et les informations qu’il contient sont la propriété de Sagem. Ils ne doivent pas être copiés ni communiqués à un tiers sans l’autorisation préalable et écrite de Sagem. Les convolutions en détails: Détail convolution 2D masque 3x3 padding 1 Il y a donc

Ce document et les informations qu’il contient sont la propriété de Sagem. Ils ne doivent pas être copiés ni communiqués à un tiers sans l’autorisation préalable et écrite de Sagem. Le pooling : diminuer la taille 1) On effectue des statistiques (moyenne, max, min,etc.) sur des voisinages de pixels disjoints (en général) sur toute la profondeur Il y a donc Max-pooling 2x2 On peut aussi le voir comme une convolution avec un opérateur (non linéaire dans le cas du max-pooling)

Ce document et les informations qu’il contient sont la propriété de Sagem. Ils ne doivent pas être copiés ni communiqués à un tiers sans l’autorisation préalable et écrite de Sagem. Les couches complétement connectées: 1)Après l’application de plusieurs convolutions/pooling on obtient une tenseur 3D que l’on va complétement connecter à un vecteur de sorties=> nécessité d’avoir une entrée de taille fixée à l’avance. 2)On seuille les sorties avec une activation non linéaire Il y a donc 3 cartes 2x2 sont complétement connectées à un vecteur de taille 4 (seules les connexions auxdeux extrêmes du vecteur sont représentées)  Le réseau redevient classique

Ce document et les informations qu’il contient sont la propriété de Sagem. Ils ne doivent pas être copiés ni communiqués à un tiers sans l’autorisation préalable et écrite de Sagem. Apprentissage supervisé [0,0,…,1,…,0][0.1,0.0,…,0.8,…,0.1] En réalité L est non convexe et l’optimisation est extrêmement difficile. On cherche donc un « bon » minimum local. Pour maximiser ses chances de réussir l’apprentissage il existe des algos plus performants (le gradient avec moment, AdaGrad, Adam,…) et des techniques d’initialisation des poids (RBM, Initialisation de Glorot,weight normalization,etc.) ainsi que des astuces (dropout,batch-norm,…) Visualisation créée en matplotlib par Alec Radford (OIpenAI)

Ce document et les informations qu’il contient sont la propriété de Sagem. Ils ne doivent pas être copiés ni communiqués à un tiers sans l’autorisation préalable et écrite de Sagem. Le réseau finalement utilisé Les entrées sont des patchs de taille 48x48 L’architecture en détails: 5x5x32 5x5x64 Fc1 (local1)->120 Fc2 (local2)->84 Fc3 (local3)->2 Softmax La classification est binaire véhicule cible ou fond Local 5 Le réseau est une version modifiée de LeNet5 utilisée pour reconnaitre des chiffres softmax MNIST

Ce document et les informations qu’il contient sont la propriété de Sagem. Ils ne doivent pas être copiés ni communiqués à un tiers sans l’autorisation préalable et écrite de Sagem. La pipeline On commence par donner le schéma d’une pipeline assez classique : extraction d’exemples d’apprentissage+ entrainement+ parcours par fenêtres glissantes sur l’ensemble d’apprentissage + hard-mining + parcours par fenêtres glissantes sur le test On corrige le déséquilibre des classes en calibrant l’importance du coût de mauvaise classification On agrandit la base d’apprentissage Data Augmentation pour apprendre l’invariance en rotations

Ce document et les informations qu’il contient sont la propriété de Sagem. Ils ne doivent pas être copiés ni communiqués à un tiers sans l’autorisation préalable et écrite de Sagem. FCN : Réseaux de neurones complétement convolutionnel Johnathan Klong and Evan Shelhamer and Trevor Darrell, Fully Convolutional Neural Networks for Semantic Segmentation CoRR Voir les couches complétement connectées comme des convolutions 2D dégénérées, qui ne bougent pas. 4 convolutions 3D d’un masque 2x2x3

Ce document et les informations qu’il contient sont la propriété de Sagem. Ils ne doivent pas être copiés ni communiqués à un tiers sans l’autorisation préalable et écrite de Sagem. FCN : Réseaux de neurones complétement convolutionnel Tout se passe comme si on passait le réseau sur un ensemble de fenêtres avec un pas proportionnel au nombre de couches de pooling et que l’on en classifiait le pixel central. On obtient une carte sous-échantillonnée de profondeur le nombre de classes. Ci-dessus la carte de la classe véhicule sur-échantillonnée et étirée. FC-CONV2 FC-CONV1 Local 5 FC-CONV3 softmax A partir des cartes il est facile de revenir à la position des véhicules sur la carte vraie en réalisant une étape de NMS:

Ce document et les informations qu’il contient sont la propriété de Sagem. Ils ne doivent pas être copiés ni communiqués à un tiers sans l’autorisation préalable et écrite de Sagem. Conclusions: Points positifs: Plus performant Plus d’étapes de parcours de fenêtres Inférence beaucoup plus rapide Points négatifs: Perte de résolution spatiale à cause du pooling L’entrainement est toujours long, Il y a très peu d’images de cibles à disposition. Toujours trop de fausses alarmes

Ce document et les informations qu’il contient sont la propriété de Sagem. Ils ne doivent pas être copiés ni communiqués à un tiers sans l’autorisation préalable et écrite de Sagem. Merci de votre attention ! Vous avez des questions ?