12 décembre 2005Soutenance de thèse de Michel Narozny 1 Soutenance de thèse Michel Narozny Équipe Systèmes de Traitement des Signaux, Supélec, campus de.

Slides:



Advertisements
Présentations similaires
Mais vous comprenez qu’il s’agit d’une « tromperie ».
Advertisements

Le Nom L’adjectif Le verbe Objectif: Orthogram
ORTHOGRAM PM 3 ou 4 Ecrire: « a » ou « à » Référentiel page 6
LES NOMBRES PREMIERS ET COMPOSÉS
Ma surprise du Zoo.
Fabrice Lauri, François Charpillet, Daniel Szer
Licence pro MPCQ : Cours
Distance inter-locuteur
Analyse temps-fréquence
LIRMM 1 Journée Deuxièmes années Département Microélectronique LIRMM.
RECONNAISSANCE DE FORMES
Test statistique : principe
Les numéros
Les identités remarquables
1 Introduction 1 - Equations de Maxwell dans le vide 2 - Equations de propagation du champ électromagnétique dans le vide 2 - Equations de propagation.
Codage par transformées(1)
6. Quantification des signaux visuels. Codage prédictif (MICD)
Dpt. Télécommunications, Services & Usages Théorie de l information H. Benoit-Cattin Introduction 2. Vue densemble 3. Sources discrètes & Entropie.
1 Intégration numérique garantie de systèmes décrits par des équations différentielles non-linéaires Application à l'estimation garantie d'état et de paramètres.
LES TRIANGLES 1. Définitions 2. Constructions 3. Propriétés.
1 7 Langues niveaux débutant à avancé. 2 Allemand.
Améliorer les performances du chiffrage à flot SYND
Mr: Lamloum Med LES NOMBRES PREMIERS ET COMPOSÉS Mr: Lamloum Med.
Application des algorithmes génétiques
Le soccer & les turbans Sondage mené par lAssociation détudes canadiennes 14 juin 2013.
Classification Multi Source En Intégrant La Texture
1 Choisir une catégorie. Vous recevrez la réponse, vous devez donner la question. Cliquez pour commencer.
Cours de physique générale I Ph 11
1 Guide de lenseignant-concepteur Vincent Riff 27 mai 2003.
GRAM 1 CE2 Je sais transformer une phrase affirmative en phrase négative.
1.2 COMPOSANTES DES VECTEURS
Le Concours de Conaissance Francais I novembre 2012.
Détection de co-évolution de gènes Master 2 : Informatique à Finalité Professionnelle et Recherche Unifiée (IFPRU) Parcours Ingénierie de lIntelligence.
Titre : Implémentation des éléments finis sous Matlab
Projet poker 1/56. Introduction Présentation de léquipe Cadre du projet Enjeux Choix du sujet 2.
LES NOMBRES PREMIERS ET COMPOSÉS
Partie 1: Ondes et Particules.
1.Un rang de données multicolores 2. Deux permutations des n premiers entiers 3. b permutations des k premiers entiers 4. Choix de n points dans [0,1]
RACINES CARREES Définition Développer avec la distributivité Produit 1
Représentation des systèmes dynamiques dans l’espace d’état
Systèmes mécaniques et électriques
Représentation des systèmes dynamiques dans l’espace d’état
Représentation des systèmes dynamiques dans l’espace d’état
DUMP GAUCHE INTERFERENCES AVEC BOITIERS IFS D.G. – Le – 1/56.
Les modèles linéaires (Generalized Linear Models, GLM)
1.1 LES VECTEURS GÉOMÉTRIQUES
1 Licence dinformatique Algorithmique des graphes Problèmes dordonnancement. Utilisation de ce document strictement réservée aux étudiants de l IFSIC dans.
Année universitaire Réalisé par: Dr. Aymen Ayari Cours Réseaux étendus LATRI 3 1.
Titre : Implémentation des éléments finis en Matlab
3ème partie: les filtres
MAGIE Réalisé par Mons. RITTER J-P Le 24 octobre 2004.
1 INETOP
Aire d’une figure par encadrement
P.A. MARQUES S.A.S Z.I. de la Moussière F DROUE Tél.: + 33 (0) Fax + 33 (0)
ASI 3 Méthodes numériques pour l’ingénieur
MAGIE Réalisé par Mons. RITTER J-P Le 24 octobre 2004.
Elaboré par M. NUTH Sothan 1. 2 Soit x, y et z des coordonnées cartésiennes à 3 dimension. G un ensemble de points dans le plan (u, v). Déf. : On appelle.
Traitement de différentes préoccupations Le 28 octobre et 4 novembre 2010.
ECOLE DES HAUTES ETUDES COMMERCIALES MARKETING FONDAMENTAL
1/65 微距摄影 美丽的微距摄影 Encore une belle leçon de Macrophotographies venant du Soleil Levant Louis.
La décomposition en valeurs singulières: un outil fort utile
Equation différentielle de 2ème ordre
Nom:____________ Prénom: ___________
Suites numériques Définitions.
Les Chiffres Prêts?
La formation des maîtres et la manifestation de la compétence professionnelle à intégrer les technologies de l'information et des communications (TIC)
Etude et test des algorithmes d'estimation de mouvement en MPEG
Régulation de débit pour MPEG-4 SVC
Méthode des moindres carrés (1)
Transcription de la présentation:

12 décembre 2005Soutenance de thèse de Michel Narozny 1 Soutenance de thèse Michel Narozny Équipe Systèmes de Traitement des Signaux, Supélec, campus de Metz ANALYSE EN COMPOSANTES INDÉPENDANTES (ACI) ET COMPRESSION DE DONNÉES

12 décembre 2005Soutenance de thèse de Michel Narozny 2 Deux domaines de recherche…  Un sujet de thèse à la charnière entre deux domaines de recherche: Analyse en composantes indépendantes  Séparation aveugle de sources,  Analyse de données (images, bourses),  Modélisation du cortex visuel,  Astronomie,… Compression de données  Photos numériques,  Vidéos,  Images médicales,  Musique,… Mon sujet de thèse

12 décembre 2005Soutenance de thèse de Michel Narozny 3 Pourquoi associer ACI et compression? Réduction de redondance dans les données Compression de données: on cherche à réduire/éliminer la redondance dans les données BUT: réduire la complexité des codeurs ACI: outil pour réduire la redondance dans les données

12 décembre 2005Soutenance de thèse de Michel Narozny 4 Redondance résiduelle exploitée par les codeurs SPIHT Exploite la redondance entre des coefficients d’ondelettes situés au même endroit dans des sous-bandes différentes ● ● ● ● ● EBCOT (JPEG2000) Exploite la redondance entre des coefficients d’ondelettes situés dans une même sous-bande

12 décembre 2005Soutenance de thèse de Michel Narozny 5  Images de la galaxie 3C120 prises avec 4 filtres différents L’ACI diminue la redondance  Images obtenues après ACI (algorithme FastICA) Référence: D. Nuzillard and A. Bijaoui. Blind source separation and analysis of multispectral astronomical images. Astron. Astrophys. Suppl. Ser. 147,

12 décembre 2005Soutenance de thèse de Michel Narozny 6 Travaux précédents (1/2)  Principe de réduction de redondance pour expliquer la stratégie de codage de l’information visuelle dans le cortex visuel primaire (V1)  L’ACI modélise bien les champs récepteurs des cellules simples de V1 Localisation dans l’espace et en fréquence + orientation Olshausen BA. Principles of Image Representation in Visual Cortex. In: The Visual Neurosciences, L.M. Chalupa, J.S. Werner, Eds. MIT Press, pp , 2003

12 décembre 2005Soutenance de thèse de Michel Narozny 7 Travaux précédents (2/2)  Codage par transformée classique 1 (Puga et Alves, 98)  l’ACI est moins performante que la transformée de Karhunen-Loève en codage à bas débit d’images en niveaux de gris  Codage prédictif 2 (Marusic et Deng, 99)  Les performances de l’ACI varient selon la méthode de quantification utilisée  Matching pursuit 3 (Ferreira et Figueiredo, 03)  Publié au milieu de ma thèse  Gain de la méthode par rapport à JPEG de 2,3 dB à 0.62 bpp 1) A. T. Puga and A. P. Alves. An experiment on comparing PCA and ICA in classical transform image coding. ICA’98 2) S. Marusic and G. Deng. ICA-FIR based image redundancy reduction. ICA’99 3) A. J. Ferreira and M. A. T. Figueiredo. Class-adapted image compression using independent component analysis. ICIP’03

12 décembre 2005Soutenance de thèse de Michel Narozny 8 Objectif et contributions  Objectif:  Comprendre le lien qui existe entre les performances en compression et la réduction de redondance dans les données  Contributions  Évaluation des performances de l’ACI “standard” en codage par transformée (codage par blocs)  Nouveau point de vue en codage par transformée: le problème de la recherche de la transformation linéaire optimale peut se ramener à un problème d’ACI modifié  Proposition de deux nouveaux algorithmes d’ACI modifiés:  GCGsup: calcul de la transformation linéaire optimale  ICAorth: calcul de la transformation orthogonale optimale

12 décembre 2005Soutenance de thèse de Michel Narozny 9  Introduction  Présentation du schéma de codage étudié  Évaluation des performances de l’ACI en compression  Proposition de transformations optimales obtenues à partir d’algorithmes d’ACI modifiés  Conclusion et perspectives Plan de la présentation

12 décembre 2005Soutenance de thèse de Michel Narozny 10  Choix du type de transformation  Choix des quantificateurs  Choix du codeur entropique  Choix des mesures de distorsion et de débit  Choix de la méthode d’allocation de débit Présentation du schéma de codage étudié Plan  Introduction  Présentation du schéma de codage étudié  Performances de l’ACI en compression  Transformations optimales obtenues à partir d’ algorithmes d’ACI modifiés  Conclusion et perspectives

12 décembre 2005Soutenance de thèse de Michel Narozny 11 Structure d’un codeur par transformée

12 décembre 2005Soutenance de thèse de Michel Narozny 12 Structure d’un décodeur Inverse mathématique

12 décembre 2005Soutenance de thèse de Michel Narozny 13 Choix du type de transformation Découpage de l’image en blocs de 8×8 pixels Balayage de chaque bloc de haut en bas et de gauche à droite Vecteur de 64 composantes Transformation linéaire (matrice de dimension 64×64) Q1Q1 Q2Q2 Q 64 Quantification

12 décembre 2005Soutenance de thèse de Michel Narozny 14 Choix des quantificateurs  Différents types de quantificateurs: scalaires, vectoriels  Notre choix: quantificateur scalaire uniforme infini  simplicité, souvent utilisé,  caractérisé seulement par son pas de quantification: q  optimal pour une source sans mémoire, sous l’hypothèse haute résolution et à condition d’être suivi par un codeur entropique  Rappel: hypothèse haute résolution  Le nombre de niveaux de quantification est élevé  La ddp des données à quantifier est constante dans chaque intervalle de quantification  Les représentants sont pris au milieu des intervalles

12 décembre 2005Soutenance de thèse de Michel Narozny 15 Choix du codeur entropique  Dernière étape de la chaîne de codage (sans perte)  But: exploiter la redondance résiduelle présente dans les coefficients après quantification  Idée: représenter un coefficient quantifié (ou un ensemble de coefficients quantifiés) à l’aide d’un mot de code dont la longueur dépend de sa probabilité d’occurrence  Exemples: codeurs de huffman, arithmétique, mais aussi… EBCOT  Notre choix: ne pas utiliser de codeur entropique

12 décembre 2005Soutenance de thèse de Michel Narozny 16  Mesure de distorsion  Erreur quadratique moyenne (EQM) entre le signal d’entrée et le signal reconstruit  Pic du rapport signal sur bruit en compression d’images (PRSB)  Mesure de débit  Débit de compression (bpp)  R i = débit de la i ème composante  Compression à haut et moyen débits: entropie d’ordre 1 des coefficients quantifiés lorsque l’hypothèse haute résolution est vérifiée  Compression à bas débit: entropies d’ordres 2, 4 et 9 Choix des mesures de distorsion et de débit dyn = 8 pour une image codée sur 8 bits

12 décembre 2005Soutenance de thèse de Michel Narozny 17  Présentation du problème  Trouver les pas de quantification des N quantificateurs qui minimisent la distorsion D sous la contrainte d’un débit cible R cible  ou, d’une manière équivalente, qui minimisent le débit R sous la contrainte d’une distorsion cible D cible  Approximation de la distorsion  Validité de l’approximation (1)  lorsque l’hypothèse haute résolution est bien vérifiée  ou, lorsque les vecteurs colonnes de la transformation inverse sont orthogonaux ou quasi-orthogonaux  ou, lorsque les composantes transformées sont deux à deux indépendantes L’allocation de débit (1/2) w i : carré de la norme de la i ème colonne de la transformation inverse

12 décembre 2005Soutenance de thèse de Michel Narozny 18  Méthode analytique  optimale lorsque l’hypothèse haute résolution est bien vérifiée (compression à haut et moyen débits)  Formule d’allocation de débit:  Algorithme de Shoham et Gersho  Méthode d’optimisation numérique utilisant des couples débits-distorsions obtenus expérimentalement (voir rapport de thèse)  optimal quelque soit le débit, utilisé à bas débit dans nos tests L’allocation de débit (2/2) où et (1)

12 décembre 2005Soutenance de thèse de Michel Narozny 19 Conclusion de la première partie  Proposition d’un dispositif expérimental simple pour évaluer les performances d’une transformation linéaire à haut, moyen et bas débits  Partie suivante: évaluation des performances de l’ACI

12 décembre 2005Soutenance de thèse de Michel Narozny 20  Algorithmes d’ACI testés  Signaux testés  Réduction de redondance obtenue avec l’ACI  Performances à haut, moyen et bas débits Performances de l’ACI en compression Plan  Introduction  Présentation du schéma de codage étudié  Performances de l’ACI en compression  Transformations optimales obtenues à partir d’ algorithmes d’ACI modifiés  Conclusion et perspectives

12 décembre 2005Soutenance de thèse de Michel Narozny 21 Définition du modèle d’ACI Sources indépendantes (au plus une source gaussienne) Observations Mélange linéaire instantané: X = AS Séparation Y=BS, B=DPA -1 Sources estimées S 1 S 2 S 3 S 4 X 1 X 2 X 3 X 4 Y 1 Y 2 Y 3 Y 4

12 décembre 2005Soutenance de thèse de Michel Narozny 22 Trois approches théoriques célèbres  Approche du maximum de vraisemblance  Les ddp des sources sont supposées a priori connues  On peut relâcher cette hypothèse en choisissant des ddp a priori quelconques (on ne recouvre pas toujours les sources d’origine)  Minimisation de l’information mutuelle  Connaissance a priori des ddp des sources n’est pas nécessaire  Les algorithmes sont plus lourds à mettre en œuvre  Infomax (approche de type réseaux de neurones)  Équivalent au maximum de vraisemblance

12 décembre 2005Soutenance de thèse de Michel Narozny 23  Minimisation d’une approximation de l’information mutuelle  ACI, FastICA, jadeR, SANG  Minimisation directe de l’information mutuelle  ICAinf  Exploitation des statistiques d’ordres 2 et 4 des données  EVD24  Algorithmes de séparation aveugle de sources qui exploitent les statistiques d’ordre 2 des données  SOBI, AMUSE, EVD2 Algorithmes d’ACI testés

12 décembre 2005Soutenance de thèse de Michel Narozny 24  Image Lena (composante rouge), image médicale, signal musical  Résolution et taille des signaux testés Signaux testés

12 décembre 2005Soutenance de thèse de Michel Narozny 25 Réduction de redondance obtenue avec l’ACI Coefficient de corrélation Information mutuelle

12 décembre 2005Soutenance de thèse de Michel Narozny 26  Les valeurs des coefficients de corrélation sont élevées avant transformation (ex: Identité, image médicale, N = 64) Coefficients de corrélation avant transformation

12 décembre 2005Soutenance de thèse de Michel Narozny 27  Hormis ICAinf, tous les autres algorithmes d’ACI testés décorrèlent les composantes (exemple: jadeR, image médicale, N = 64) Coefficients de corrélation après transformation Coefficient de corrélation

12 décembre 2005Soutenance de thèse de Michel Narozny 28  ICAinf, image médicale, N = 64 Coefficients de corrélation après transformation

12 décembre 2005Soutenance de thèse de Michel Narozny 29  Définition de la réduction d’information mutuelle  Exemple: image médicale, N = 64 Réduction d’information mutuelle Précision: ±0,01 bpp  I (bpp) (bpp)

12 décembre 2005Soutenance de thèse de Michel Narozny 30 Performances à haut, moyen et bas débits

12 décembre 2005Soutenance de thèse de Michel Narozny 31  Pour l’image médicale et N=64, les performances de la TKL sont meilleures d’environ 1,5 dB par rapport à celles de la meilleure transformation d’ACI (sur cet exemple, ICAinf) Performances à haut et moyen débits TKL ICAinf

12 décembre 2005Soutenance de thèse de Michel Narozny 32 Performances à bas débit  Image médicale, N=64, débit = entropie d’ordre 4

12 décembre 2005Soutenance de thèse de Michel Narozny 33  Signaux synthétiques Performances à haut et moyen débits (signaux synthétiques) Gain(ICAinf/TKL)  2,72 dB

12 décembre 2005Soutenance de thèse de Michel Narozny 34  Les performances de la TKL sont meilleures que celles de l’ACI sur des signaux réels  Cependant il existe des signaux synthétiques (non gaussiens) pour lesquels les performances de l’ACI sont meilleures que celles de la TKL  Par conséquent, ni l’ACI ni la TKL ne sont optimales pour compresser des signaux non gaussiens  Les critères d’optimalité de l’ACI et de la TKL ne sont pas adaptés au problème de la compression  il faut reformuler le problème Conclusion de la deuxième partie

12 décembre 2005Soutenance de thèse de Michel Narozny 35  Présentation du problème d’optimisation  Lien avec l’ACI  Algorithmes GCGsup et ICAorth  Résultats expérimentaux Transformations optimales obtenues à partir d’algorithmes d’ACI modifiés Plan  Introduction  Présentation du schéma de codage étudié  Performances de l’ACI en compression  Transformations optimales obtenues à partir d’ algorithmes d’ACI modifiés  Conclusion et perspectives

12 décembre 2005Soutenance de thèse de Michel Narozny 36  Cadre de l’étude  Aucune hypothèse sur le caractère gaussien ou non des signaux  L’hypothèse haute résolution est vérifiée  Allocation de débit optimale entre les composantes  Distorsion asymptotique en fonction du débit cible:  Débit asymptotique en fonction de la distorsion cible: Hypothèses (1) (2)

12 décembre 2005Soutenance de thèse de Michel Narozny 37  Gain de codage généralisé  Réduction de débit généralisée Gain de codage généralisé (1) (2) (3)

12 décembre 2005Soutenance de thèse de Michel Narozny 38  Critère d’optimisation proposé Nouveau point de vue: Le problème de la recherche de la transformation linéaire optimale en codage par transformée peut se ramener à un problème d’ACI modifié Transformation optimale Critère utilisé en ACI Mesure de distance à l’orthogonalité de A

12 décembre 2005Soutenance de thèse de Michel Narozny 39 Algorithme GCGsup  Version modifiée de l’algorithme ICAinf de D.-T. Pham pour calculer la transformation linéaire A qui minimise C(A)  L’algorithme (de type quasi-Newton) consiste à calculer à chaque itération une matrice ε par la résolution de (M = A -t A -1 ): (i,j=1,…,N), puis à déplacer le point courant en A+ ε A.  Hypothèses simplificatrices:  Les composantes transformées sont proches de l’indépendance  La solution du problème est une matrice proche d’une matrice dont les colonnes sont deux à deux orthogonales

12 décembre 2005Soutenance de thèse de Michel Narozny 40 Algorithme ICAorth  Autre version modifiée de l’algorithme ICAinf de D.-T. Pham pour calculer la transformation orthogonale A qui minimise C(A)  L’algorithme (de type quasi-Newton) consiste à calculer les éléments de la matrice ε de la manière suivante: (i,j=1,…,N), puis à déplacer le point courant en A+ε A.  lorsque ε est antisymmétrique A+ε A coïncide au second ordre avec la matrice e ε A qui est orthogonale.

12 décembre 2005Soutenance de thèse de Michel Narozny 41 Réduction de redondance obtenue avec GCGsup et ICAorth Coefficient de corrélation Réduction d’information mutuelle

12 décembre 2005Soutenance de thèse de Michel Narozny 42 Coefficients de corrélation après transformation  Les nouvelles transformations décorrèlent moins bien que la TKL (ex: GCGsup, image médicale, N=64) Corrélations résiduelles

12 décembre 2005Soutenance de thèse de Michel Narozny 43 Réduction d’information mutuelle  GCGsup et ICAorth permettent d’obtenir des composantes transformées plus indépendantes que celles obtenues avec la TKL Lena Image médicale Résultats proches de ceux obtenus avec ICAinf

12 décembre 2005Soutenance de thèse de Michel Narozny 44 Performances à haut, moyen et bas débits

12 décembre 2005Soutenance de thèse de Michel Narozny 45 Performances à haut et moyen débits LenaImage médicale Gain (GCGsup/TKL)  0,43 dB Gain (ICAorth/TKL)  0,37 dB Gain (GCGsup/TKL)  0,8 dB Gain (ICAorth/TKL)  0,9 dB

12 décembre 2005Soutenance de thèse de Michel Narozny 46 Performances à bas débit Lena Image médicale  PRSB = PRSB(GCGsup/ICAorth) – PRSB TKL

12 décembre 2005Soutenance de thèse de Michel Narozny 47 Lien entre indépendance, orthogonalité et performances en compression

12 décembre 2005Soutenance de thèse de Michel Narozny 48 Rappel: réduction de débit généralisée Réduction de débit généralisée Réduction d’information mutuelle Distance à l’orthogonalité

12 décembre 2005Soutenance de thèse de Michel Narozny 49 Indépendance et orthogonalité TKL

12 décembre 2005Soutenance de thèse de Michel Narozny 50 Vecteurs de base (Lena, N=64) TKL GCGsup

12 décembre 2005Soutenance de thèse de Michel Narozny 51 Conclusion  Étude située à la charnière entre deux domaines de recherche: l’ACI et la compression de données  La TKL offre de meilleures performances que l’ACI standard en compression à haut, moyen et bas débits  Nouveau point de vue en codage par transformée: le problème de la recherche de la transformation linéaire optimale peut se ramener à un problème d’ACI modifié  Deux nouveaux algorithmes: GCGsup et ICAorth  Gain de codage des nouvelles transformations par rapport à la TKL

12 décembre 2005Soutenance de thèse de Michel Narozny 52 Perspectives  Étude comparative des performances de la TKL et des nouvelles transformations sur un échantillon statistiquement représentatif d’images  Utilisation d’un vrai codeur entropique  Codage d’images multicomposantes  Schéma de codage associant des transformées en ondelettes et les transformations retournées par GCGsup et ICAorth  Critère multicomposante = somme pondérée des critères monocomposantes

12 décembre 2005Soutenance de thèse de Michel Narozny 53 Merci de votre attention!