1 Fouille visuelle de dissimilarités à l’aide de matrices de scatterplots pseudo-euclidiennes Sébastien AUPETIT, Nicolas MONMARCHE, Mohamed SLIMANE

Slides:



Advertisements
Présentations similaires
Apprentissage et Fouille de Données
Advertisements

VII) Formalisme Quantique
Soizic Geslin Samy Fouilleux Minh Le Hoai Maxime Chambreuil
Application de réseaux bayésiens à la détection de fumées polluantes
Analyse en Composantes Principales
Examen partiel #2 Mercredi le 15 novembre de 13h30 à 15h20
Densité des N-uplets pythagoriciens
Rappel... Solution itérative de systèmes linéaires (suite et fin).
Vers la dimension 3. La géométrie dans l'espace ne fait qu'étendre les concepts qui vous sont familiers en dimension 2 à la dimension 3. Le plus difficile.
Cours du 25 octobre Mardi le 24 octobre
Simulation d’un processus de Poisson
La décomposition en valeurs singulières: un outil fort utile
6° Conférence Francophone de Modélisation et de simulation 3 / 5 Avril Rabat Outil d’aide à l’analyse des interactions de contraintes pour l’ordonnancement.
Analyse de données Cours 3 Analyse en composantes principales (ACP)
2 Cadre du TER Projet Algol But du TER Conception et étude d’algorithmes de traitement de données dans un satellite d’observation de la voûte spatiale.
LES FRANÇAIS ET L’ONU. © Harris Interactive 2 SOMMAIRE > Méthodologie d’enquêteP.3 > Regard général sur l’ONUP.4 > Perception de l’action de l’ONU et.
ACP visualisation Représentation graphique: projection dans un plan de n individus à p caractères Un individu est un point d’un espace à p dimensions.
Apprentissage automatique L’apprentissage automatique.
ABF Améliorer nos formations pour une microfinance plus sociale.
III) GEOMETRIE DU PLAN Objectifs : - savoir orienter un plan dans l’espace. - représenter des structures géologiques (en 3D) sur une carte (en 2D).
Les Sciences Industrielles en CPGE Daniel FORT Origine de la réflexion Aspect scientifique du problème Interdisciplinarité et enseignement scientifique.
TP2: Statistique & Probabilité Intervalle de confiance et test d’hypothèses.
1 TECHNOLOGIE EN SEGPA Objets techniques instrumentés, didactisés et maquettisés que préconisent les nouveaux programmes Stage 10SEGDES2 du 14 et 15 décembre.
Thème A3 Les transformations chimiques Reconnaître, Classer et Équilibrer les réactions chimiques.
Vaissie p. – MONGE A. - HUSSON F.
1 Initiation aux bases de données et à la programmation événementielle VBA sous ACCESS Cours N° 5 Support de cours rédigé par Bernard COFFIN Université.
La Nouvelle Économie Quantique de l’Être
Freeplane Free mind mapping and knowledge ree mind mapping and knowledge Freeplane Free mind mapping and knowledge ree mind mapping and knowledge.
Génie Electrique 3 ème année 2007/ Soutenance de projet Convoi de robots mobiles par vision, localisation de robots mobiles Clients :M Lounis ADOUANE.
Géomatique Systèmes de projection Types de données Applications Qu’est-ce qu’un SIG ? Présentation de la géomatique La géomatique regroupe l'ensemble des.
1 Initiation aux bases de données et à la programmation événementielle VBA sous ACCESS Cours N° 6 Support de cours rédigé par Bernard COFFIN Université.
Initiation aux bases de données et à la programmation événementielle Outil de création des tables Support de TD rédigé par Bernard COFFIN Université Paris.
Inéquation Partie 2. x est plus grand que 12. Rappel : Les symboles utilisés x est plus grand ou égal à 12. x est plus petit que 12. x est plus petit.
TP CARTOGRAPHIE TP 3 DE LA CARTE TOPOGRAPHIQUE A LA CARTE GEOLOGIQUE
Master 2 Entrepreneuriat International Option Gestion des Risques L’APPRECIATION DES PLUS OU MOINS VALUES LATTENTES, LES ECARTS DE CONSOLIDATION ET D’ACQUISITIONS.
Quelle(s) méthodologie(s) pour le suivi des collectifs d’enseignants ? Hussein Sabra et Isabelle Quentin Séminaire avec les collectifs d'enseignants concepteurs.
Enabling innovation in construction 1 Topic Training Fondations Irca Schepers Customer Service Engineer.
L’accueil du nouveau-né en salle de naissance: implications de l’instauration de la méthode du peau à peau. Anne-Sophie Van Acker Anne-Sophie Van Acker.
Etude comparative de méthodes de résolution pour l ’équation de DARCY E. DUBACH R. LUCE Laboratoire de Mathématiques Appliquées Université de PAU, GDR.
Spin ½ et matrices de Pauli Aperçus sur les Symétries et la Théorie des groupes Notion de symétrie 1 jusqu’au XIX° : notion descriptive ex: cristallograhie.
DROIT. Grille d’Examen Objectifs, contenu, critères et modalités d’évaluation Sujet zéro Conclusion.
6.2. Le modèle de Bohr.
Faculté Polytechnique Cours 5: introduction à la géométrie analytique spatiale Géométrie et communication graphique Edouard.
Chapitre 5 Interprétation des données d’enquête 1.
Chapitre 2 Résolution de Programmes Linéaires. La méthode graphique Cette méthode est simple et s’applique à des problèmes de programmation linéaire à.
1 A. Cornuéjols Introduction à l’intelligence artificielle Introduction à l’Intelligence Artificielle (Cours n°2) Recherche non informée dans les graphes.
Le parent correspondant de classe. Parents correspondants de classe Rôle du parent correspondant Dans l’Enseignement catholique, tous les membres de la.
On the analysis of CMMN expressiveness: revisiting workflow patterns Renata Carvalho Hafedh Mili.
Les limites de l’UML Présenté par : Samah Dekhil 1.
« crédits bancaires octroyés aux PME Gabonaises en 2012 et 2013 Difficultés rencontrées solutions préconisées » 1.
Informatique 2A Langage C 3 ème séance.
Caractérisation dimensionnelle de défauts par thermographie infrarouge stimulée. Contrôles et Mesures Optiques pour l’Industrie novembre
Compétences: Capacité d’analyse et de recherche Présentation/Discussion Adjoints des commissions des finances - WAAPAC.
CND Œuvres d’art Thermographie infrarouge stimulée
Présenté par  Samira BELHORMA  Imane ZEHHAF. Introduction I. Définitions II. Quand et comment évaluer une compétence? III. Le contexte d’évaluation.
 a été réalisé et optimisé pour Microsoft Office PowerPoint L’utilisation d’une version inférieure supprime les effets visuels.  correspond aux.
Étude des émissions diffuses avec l’expérience H.E.S.S. Tania Garrigoux.
Créer un SmartArt Les graphiques SmartArt permettent de communiquer visuellement de l'information. Il peut s'agir de listes ou de diagrammes simples, mais.
Paramètres S Rappels de théorie des circuits
Médias éducatifs : modèles théoriques des médias et représentations d’étudiants et d’enseignants Un levier pour comprendre et faire évoluer les pratiques.
Régression linéaire (STT-2400) Section 3 Préliminaires, Partie II, La loi multinormale Version: 8 février 2007.
Activité 2 Évaluer des compétences : pas si simple, mais très courant! OBJECTIF :  Sensibilisation aux différents modes de recueil de données et de production.
M. BOUHELAL (1,2), F. HAAS (1), E. CAURIER (1), F. NOWACKI (1), A BOULDJEDRI (2) (1) IPHC (IN2P3-Université Louis Pasteur), F Strasbourg Cedex 2,
Eléments de correction. Exercice 1. Méthodes d’interpolation et cartes de températures (7 points) Présentation de la carte et des enjeux de la représentation.
REPUBLIQUE ALGERIENNE DEMOCRATIQUE ET POPULAIRE MINISTRE DE L’ENSEIGNEMENT SUPERIEUR ET DE LA RECHERCHE SCIENTIFIQUE UNIVERSITE LARBI BEN M’HIDI OUM EL.
PARTIE 2 : LE PROJET.
BACCALAUREAT PROFESSIONNEL 3 ANS REPARATION DES CARROSSERIES Quelques points clés.
Section 4 : Analyse descriptive. En 1901, Karl Pearson publie son papier sur l’Analyse en Composante Principale dans : “On lines and planes of closest.
Chapitre 4: Variation dans le temps  Les données : audience totale en milliers (tableau 4.1, p. 47, extrait) o Origine : enquête sur les habitudes d’écoute.
Transcription de la présentation:

1 Fouille visuelle de dissimilarités à l’aide de matrices de scatterplots pseudo-euclidiennes Sébastien AUPETIT, Nicolas MONMARCHE, Mohamed SLIMANE

2 Contexte Comprendre l’organisation d’un ensemble d’objets induite par une dissimilarité –Aide au choix d’une dissimilarité  Application à la comparaison de dissimilarités sur des modèles de Markov cachés Méthodes numériques complexes et peu explicites  Visualisation du nuage formé par la dissimilarité

3 Objectifs Les coordonnées des points ne sont pas connues Pas de contraintes fortes sur la dissimilarité : –Positivité : d(x,y) >= 0 –Symétrie : d(x,y)=d(y,x) –Auto-similarité : d(x,x)=0 Visualiser le nuage avec autant de précision que désirée

4 Visualiser un « nuage de dissimilarités » : Principales techniques Shaded Similarity Matrix –Utile pour la construction d’arbres de décision –Représentation exacte –Difficile d’appréhender les « proximités » induites Algorithme de spring et le multidimensional scaling (MDS) –Flexible mais nécessite de définir un critère à optimiser ! Peu représentatif : meilleur compromis du critère, optima locaux Résultats dépendent du critère Représentation exacte impossible (en général) S’appuit sur un espace euclidien pour la représentation

5 L’idée MDS = projeter les points dans un espace euclidien de faible dimension On cherche : –Les coordonnées des points dans un espace pseudo- euclidien de grande dimension respectant exactement la dissimilarité d –On représente ces points dans cet espace

6 Comment trouver les coordonnées des points dans un grand espace Si d est une norme euclidienne : –Alors il existe un produit scalaire euclidien associé avec M définie positive  Analyse en Composante Principale à Noyau (ACPN) (Schölkopf, et al. 1999) Si d n’est pas une norme euclidienne : –soit on approxime => pas satisfaisant !!!! –soit on généralise l’ACPN pour traiter des noyaux indéfinis

7 ACP à noyau indéfini (ACPNI) (1/2) Généralisation du produit scalaire euclidien =x’My –M est indéfini (valeurs propres 0) –Un espace R N muni de forme un espace pseudo-euclidien (Pekalska et al. 2001) peut être négatifs d(x,y) 2 = =0 =\=> x=y Soit G la matrice des pseudo produits scalaires entre tous les couples de points du nuage centré

8 ACP à noyau indéfini (2/2) V i les vecteurs propres de G tels que V i ’.V i =1 λ i les valeurs propres non nulles associées La projection du point x (centrée) sur l’axe principal U i du nuage correspondant à λ i est : avec G x la ligne de G correspondant au point x Ces projections nous donnent alors les coordonnées des points du nuage dans l’espace pseudo-euclidien

9 Représentation : matrice de Scatterplot Représentation classique 2D Chaque graphe = le nuage suivant 2 dimensions du système de coordonnées (espaces de dimensions 2) Si affiche toutes les combinaisons de coordonnées  représentation exacte Ex: 3 dimensions : x=(x1,x2,x3)

10 Propriétés des espaces pseudo-euclidiens Dépend du nombre de valeurs propres positives (p) et négatives (n) de M (G) dans =x’.M.y  signature(p,n) Cas à deux dimensions : –(p,n)=(2,0) : espace euclidien ordinaire –(p,n)=(0,2) : -d définie un espace euclidien ordinaire  dans les deux cas, les proximités des coordonnées reflètent les dissimilarités

11 (p,n)=(1,1) Espace hyperbolique On peu avoir d(x,y)=0 mais x <> y ! Donc si on représente directement les coordonnées  interprétation difficile

12 ACPNI : pour N points, on peut avoir jusqu’à N-1 axes principaux !!!  on ne peut pas tous les représenter Mais les axes principaux du nuage n’ont pas tous la même importance. Il suffit de représenter ceux pour lesquels |λ i | est grand

13 Notre solution : MSPE Matrice de Scatterplot pseudo euclidienne (MSPE) –Matrice de Scatterplot –Affiche que les dimensions les plus significatives –Dimensionne chaque graphe de manière a refléter la contribution réelle des coordonnées (i.e. pas de normalisation) –Affiche de manière interactive les isolignes

14 Application à la visualisation de modèles de Markov cachés MMC = modèles stochastiques pouvant être utilisés pour apprendre et reconnaître des images, sons, … λ=(A,B,Π) Apprend 10 photos de visages de 5 personnes  50 MMC On souhaite savoir comment s’organise ces MMC On a définit 4 dissimilarités basées sur les coefficients des modèles

15 signes (+,-,+,-) a=b, t a < t b c=d, t c < t d 3eme et 4eme avec des signes opposées et amplitude similaire  s’annule globalement (sauf blanc) coude = foncé/clair  1er axe = luminosité a, c : préserve groupe c : point hors norme  choix a

16 Conclusion (1/2) Matrice de Scatterplot pseudo-euclidienne (MSPE) : –Technique générale suffisamment précise pour la représentation de dissimilarités quelconques –Grâce à l’ajout d’outils, l’ACPNI permet l’interprétation –Dans la pratique, les liens entre les points sont suffisamment forts pour que des points très proches soient regroupés dans l’espace Mais : –Comme pour l’ACP, la décomposition de la matrice G est coûteuse en temps –L’interprétation de la MSPE nécessite de la pratique

17 Conclusion (2/2) Espaces pseudo-euclidiens sont utiles : –pour l’apprentissage et la classification (Pekalska et al. 2001), (Ong et al. 2004) –pour l’interprétation et l’analyse visuelle de données (Aupetit et al. 2005) La MSPE est notre première utilisation de ces espaces pour la représentation de données mais d’autres travaux les utilisant sont actuellement en cours.

18 Merci de votre attention