2 MOUVEMENT Estimation PLAN DU CHAPITRE Champ de vitesse apparent et applications Techniques par appariement Techniques différentielles 1 : Lucas et Kanade Techniques différentielles 2 : Horn et Schunck
Calcul du mouvement apparent (1) Le calcul d’un mouvement apparent global (mise en correspondance) entre deux images correspond à l’estimation des paramètres d’une transformation affectant tous les points de l’image : translation, rotation, homothétie, affinité,... (2) Le calcul du mouvement apparent local consiste à associer à chaque pixel (x,y,t) de I un vecteur (vxt,vyt) représentant la vitesse apparente du pixel (x,y) à l’instant t. Calcul du flot optique (= Champ de mouvement apparent) Idéalement : le vecteur (vxt,vyt) représente la projection sur le plan image du vecteur vitesse (Vxt,Vyt,Vzt) des objets de la scène par rapport au repère image (O,x,y,z) (grandeur objective). On le calcule à partir des variations temporelles de la fonction I(x,y,t).
Exemples de flot optique Source : Pierre Kornprobst - INRIA
Quelles informations peut fournir le flot optique ? contours foyer d’expansion (FOE) niveau conceptuel mouvement dominant « discontinuités », singularités * temps avant collision * profondeur * orientation de surface * ego-mouvement
Distortion perspective On note (X,Y,Z) les coordonnées d’un point de la scène. (x,y) les coordonnées du même point projeté dans l’image f la distance focale de la caméra Distortion perspective (modèle sténopé) : X x f Z
Mouvement projectif Soit : Supposons que la caméra se déplace à la vitesse (-X’,-Y’,-Z’) par rapport à une scène statique (scène non déformable, pas d’objets mobiles), alors tous les points de la scène sont à la même vitesse (X’,Y’,Z’) par rapport à la caméra (avec X’ = dX/dt ; Y’ = dY/dt ; Z’ = dZ/dt). En dérivant par rapport au temps des équations de distorsion perspective : Soit :
Un modèle plus réaliste… En réalité, le centre optique (projection du diaphragme sur le plan image) n’est jamais au centre de l’image mais en un point (xc,yc). De plus, la distortion perspective n’est jamais la même dans les deux directions, et la distance focale est remplacée par le couple (fx,fy) : Les paramètres { xc , yc , fx , fy }dépendent du capteur et des paramètres de l’optique. Ils sont estimés dans une phase de calibration de la caméra. D’autre part, si on prend en compte la composante de rotation W = (Wx,Wy,Wz) de la caméra par rapport à la scène : facteurs de perspective coordonnées du centre optique composante de translation composante de rotation
Translation pure et profondeur Translation pure de la caméra selon l’axe de x, soit T = (-X’,0,0) et W = (0,0,0) soit Vitesses apparentes horizontales, de modules inversement proportionnels à la profondeur. Translation pure de la caméra selon l’axe de z, soit T = (0,0,-Z’) et W = (0,0,0) soit Zoom sur l’image avec un foyer d’expansion au niveau du centre optique.
Le foyer d’expansion (FOE) Lors d’une translation de la caméra dans une scène statique, les directions de vitesse des points projetés sur le plan image converge vers un point du plan projectif appelé FOE. Dans la suite, on suppose que la caméra se déplace selon la translation T = (-X’,-Y’,-Z’). Pour simplifier les notations, on suppose de plus que fx = fy = f et (xc,yc) = (0,0). Soit (X0,Y0,Z0) un point de la scène. Après un temps t, il est projeté sur l’image au point (xt,yt), avec : (x0,y0) (xFOE,yFOE)
Temps avant collision dl l foe et donc P(t2) P(t1) L f Z mouvement dans une scène statique : P(t1) l L f Z foe et donc temps avant collision
Calcul du flot optique : limites et contraintes ! (1) On suppose : MOUVEMENT VARIATION D’INTENSITE () On suppose que l’observation d’une variation d’intensité dans l’image traduit nécessairement l’existence d’un mouvement dans la scène. Cela correspond à une hypothèse d’éclairement constant sur la scène. () C’est la variation de l’intensité dans l’image qui doit permettre de retrouver le mouvement apparent de l’objet dans la scène. On suppose donc que la lumière réfléchie par un point de la scène reste constante indépendamment du mouvement relatif scène / caméra. L’hypothèse sous-jacente est que les objets sont à surface lambertienne : lumière incidente lumière réfléchie L’intensité de la lumière réfléchie est la même dans toutes les directions.
Calcul du flot optique : limites et contraintes ! (2) PROBLEME DE L’OUVERTURE On n’ « accède » au mouvement apparent d’un point que grâce à un calcul effectué dans un voisinage borné de ce point. On ne peut calculer que la composante du mouvement dans la direction du gradient (i.e. perpendiculaire au contour). Source : PROJET TELESUN http://telesun.insa-lyon.fr
Technique par appariement On considère B Z2 voisinage de l’origine : Mesure d’appariement : x x + x C’est la somme des différences au carrée (SSD) de 2 blocs : typiquement : B de taille 9×9, 15×15... y y + y It It+1 Solution du flot optique : I K(x,y) B(x+x,y+y) K I pour limiter le temps de calcul + stratégies d’optimisation…
Appariement : stratégies d’optimisation Le principe des stratégies d’optimisation est de parcourir « intelligemment » l’espace de recherche K pour minimiser la complexité de calcul de l’optimum d’appariement : K y x K y x K y x K y x K y x K y x EXHAUSTIF SEPARE HIERARCHIQUE K y x K y x K y x K y x y K x Ces différentes techniques ne sont pas exclusives, et peuvent être combinées. En l’absence d’hypothèse sur la fonction d’appariement (séparabilité, convexité...) dans le domaine K, seul le parcours exhaustif garantit le calcul d’un optimum global sur K. Pour chaque point de K, on ne calcule la somme des différences que tant qu’on demeure inférieur à un seuil T. Le meilleur déplacement correspond à celui pour lequel le plus de points ont été examinés. DESCENTE DE GRADIENT SEQUENTIEL
Exemple : normes mpeg de codage video Découpage en blocs 16×16 ou 32×32. Hypothèse de même déplacement pour tous les pixels du blocs. Codage : déplacements + erreurs comprimées. Compression statique JPEG : Transformée en cosinus discrète Quantification Codage entropique Flot optique sous-résolu Référence : VcDemo TU Delft Trame prédite Erreurs de prédiction
Techniques différentielles (1) LUCAS & KANADE 1981 Le principe de la méthode de Lucas et Kanade est de calculer le minimum de la fonction d’appariement quadratique (SSD), en supposant que le déplacement recherché est petit, comme le point où les dérivées de la fonction d’appariement s’annulent, par rapport à dx et à dy. Sous l’hypothèse que I est régulière et que le déplacement (dx ,dy) est petit, on écrit le développement de Taylor à l’ordre 1 de I : La fonction d’appariement A devient :
Techniques différentielles (1) LUCAS & KANADE 1981 Equations d’Euler-Lagrange de minimisation de A : Annulation des dérivées premières par rapport à dx et à dy : Ce qui revient à la résolution du système linéaire : avec et et v = (vx,vy) le déplacement recherché. La résolution du système (S) est finalement réalisée par une méthode itérative, type Gauss-Seidel : Initialisation : Pour k > 0 :
Techniques différentielles (1) LUCAS & KANADE 1981 L’existence et la stabilité d’une solution au système (S) dépend de la matrice H : NB : On retrouvera cette matrice au chapitre 3 pour le calcul des points d’intérêt… La matrice H doit être de rang 2 « au sens fort », c’est-à-dire posséder 2 valeurs propres (l1,l2) grandes. Les auteurs proposent d’utiliser l = min(l1,l2) comme indicateur de confiance du déplacement calculé. Cette propriété correspond à une interprétation algébrique du problème de l’ouverture…
Rang 0 : zone homogène Zone faiblement texturée : 2 valeurs propres faibles Sources : Steven Seitz UW-Seattle Fonction d’appariement A
Rang 1 : contour simple Contour rectiligne : 1 seule grande valeur propre Sources : Steven Seitz UW-Seattle Fonction d’appariement A
Rang 2 : point anguleux Point anguleux : 2 valeurs propres importantes Sources : Steven Seitz UW-Seattle Fonction d’appariement A
Techniques différentielles (2) HORN & SCHUNCK 1981 Exploitation directe de la contrainte (1) : Formule de Taylor Termes d’ordres supérieures négligés SOIT : Equation de contrainte du mouvement apparent (ECMA) ou : équation du flot optique avec gradient spatial inconnues gradient temporel
Interprétation de l’ECMA (1) En faisant l’hypothèse d’une certaine régularité du champ et de petits déplacements, les changements temporels dans l’image sont équivalents (au premier ordre) au produit scalaire des changements spatiaux et de la vitesse apparente. (2) Droite de contrainte : v pb d’ouverture sous-contrainte (1 eq°, 2 inc.) vitesse vraie vitesse calculée
Résolution de l’ECMA Minimisation d’une fonction de coût : HORN & SCHUNCK 1981 Résolution de l’ECMA par ajout d’une contrainte de régularité. Régularisation du pb mal posé par hypothèse de champ lisse de déplacement. Minimisation d’une fonction de coût : facteur de pondération ECMA REGULARISATION
Résolution de l’ECMA Minimisation d’une fonctionnelle quadratique : HORN & SCHUNCK 1981 Minimisation d’une fonctionnelle quadratique : (u,v) composantes du champ (inconnues) à calculer {Ix, Iy, It} dérivées partielles de l’image {ux, uy,vx, vy} dérivées partielles des composantes du champ avec : Annulation des dérivées premières /u(…) = 0 ; /v(…) = 0 Equations d’Euler-Lagrange de minimisation de C : soit : avec : laplaciens de u et v
ALGORITHME DE HORN & SCHUNCK Résolution de l’ECMA 2. Approximation du Laplacien : = moyenne de f dans un certain voisinage soit : 3. Schéma itératif de résolution : Méthode de Gauss-Seidel : ALGORITHME DE HORN & SCHUNCK Initialisation : Répéter jusqu’à convergence : avec : Soit, en reprenant les notations originales :
Estimation multi-échelles Niveau 2 (1) initialisation (2) raffinement 1 Avantages : Calcul de grands déplacements Adaptation du niveau de régularisation.
Principe du calcul multi-échelles ALGORITHME PAR CORRELATION I B(x+x,y+y) avec : ALGORITHME DIFFERENTIEL Initialisation : Répéter jusqu’à convergence : Init. : …/…
Conclusion Chapitre 2 EXPLOITATION DU FLOT OPTIQUE Mouvement dominant Profondeur Temps avant collision METHODES PAR APPARIEMENT METHODES DIFFERENTIELLES Lucas et Kanade Horn et Schunck METHODES MULTI-ECHELLES
Bibliographie Chapitre 2 B.D. Lucas & T. Kanade 1981 « An iterative image registration technique with an application to stereo vision » International Journal of Computer Vision and Artificial Intelligence 674-679 B.K.P Horn & B. Schunck 1981 « Determining Optical Flow » Artificial Intelligence 23 185-203 D.H. Ballard & C.M Brown 1982 « Computer Vision » Prentice Hall (Ch. 3, Ch. 7) J.M. Jolion & A. Rosenfeld 1994 « A pyramid framework for early vision » Kluwer Academic Publishers Dordrecht, NL R. Jain, R. Kasturi & B. Schunck 1995 « Machine Vision » McGraw-Hill Inc. (Ch.14)