SYS-844 Vision par ordinateur Professeur: Richard Lepage Livia Vision par ordinateur Professeur: Richard Lepage Département de génie de la production automatisée
Collaborateurs Pierre Gravel Normand Grégoire LIO (CHUM-ETS) Hiver 2005 Collaborateurs Pierre Gravel LIO (CHUM-ETS) Ajout de plusieurs acétates Approche MatLab Normand Grégoire Étudiant Ph.D. Forensight Matériel de laboratoire
Cours #1: Plan Syllabus du cours Plan détaillé Formation des équipes (durant la pause) Introduction à la vision informatique
Syllabus
Plan détaillé
Introduction à la vision informatique
Vision artificielle Un système de vision artificielle capte une scène tridimensionnelle et la traduit en une ou plusieurs images Objectifs Reconnaître et localiser les objets présents dans la scène
Quelques applications Robot dans un milieu hostile Inspection industrielle Télédétection Imagerie médicale Reconnaissance de forme Aérospatiale
Neurologie Psychologie Biologie Traitement de signal Réalité virtuelle Archéologie Géologie Géophysique Hydrologie
Imagerie médicale et sécurité L’image de la rétine humaine est traitée afin d’en rehausser le contraste. L’image résultante peut ensuite être utilisée en ophtalmologie ou en reconnaissance de la personne.
Imagerie médicale Rehaussement du contraste d’une radiographie de la cage thoracique
Imagerie médicale Détection des tumeurs cancéreuses à partir d’une mammographie (Rayons X)
Recherche de lésions ou d’anomalies dans le cerveau (images en RMN) Imagerie médicale Recherche de lésions ou d’anomalies dans le cerveau (images en RMN)
Reconstruction 3D du cerveau à partir d’images en RMN Imagerie médicale Reconstruction 3D du cerveau à partir d’images en RMN
Amélioration d’images (dégradation inconnue) Traitement de signal Amélioration d’images (dégradation inconnue)
Restauration d’images Traitement de signal Restauration d’images (dégradation connue)
Interprétation des images Quelle information est utilisée? Comment place-t-on des étiquettes? Peut-on déduire la forme 3D? Comment? Importance du contexte Le but de l’observation influence-t-il l’interprétation? Rôle des connaissances a priori
maison
corvette
Ville de San Francisco
mandrill (singe)
Ava Gardner
Résonnance magnétique
Information utilisée: contraste ? Arêtes? Nébuleuse du cheval
Reconnaissance des visages Mandrill (singe) Penelope Cruz
Photo aérienne
Approches en vision Approche computationnelle Image structure Le processus de vision est divisé en plusieurs niveaux de représentation. Des algorithmes permettent de passer d’un niveau au suivant
Approche basée sur les connaissances Image structure
Vision appliquée (ou industrielle) Image fonction
Difficultées Variations naturelles dans une même catégorie d’objet Ex.: maison chaise Grande quantité de données à traiter Image faible résolution N/B 128x128 16Ko Image haute résolution couleur 512x512x3 750Ko Image caméra numérique 2592x1944 pix 15,1Mo Mouvement (30 im./s) 560Ko 22.5 Mo
Variations dans le processus de formation de l’image Éclairage Distorsion de perspective Occlusion Point d’observation Qualité du capteur Qualité du système optique
Capteurs Appareil photo Caméra Stéréo Caméra 3D Capteurs dans des bandes non-visibles Radarsat
Perspective Occlusion
Contexte La vision comme un problème d’IA
Contexte Influence
Contexte Influence (bis)
Système de vision à base de connaissance
Type de connaissances requises Connaissances déclaratives attributs des objets: couleur, texture, forme, etc. relations fonctionnelles et spatiales entre les composantes des objets structure Connaissances procédurales mécanismes de contrôle comment reconnaître un objet comment utiliser le contexte comment contourner l’effet des occlusions comment relier l’échelle sur l’image à l’échelle physique de l’objet
Mesures sur l’image caractéristiques spectrales contour 2D brillance contraste couleur contour 2D segments de ligne ou de courbe effets de perspective ombrage, spot lumineux flux optique (mouvement) stéréoscopie
Inférences de haut niveau continuité de surface et connexité volume 3D côtés et surfaces cachées identification (étiquette, nom) dimensions absolues propriétés fonctionnelles utilisation
Niveaux d’abstraction en vision Niveau bas: image Algos: extraction d’arêtes régions Niveau intermédiaire: éléments symboliques représentation symbolique génération de carac. + abstraites Haut niveau: interprétation représenter objets, partie d’objet mécanismes d’inférence interprétation partielle
IMAGE descrip. Interm. connaissance
Niveaux d’abstraction