Modélisation de la topologie avec le Graphe Génératif Gaussien Pierre Gaillard Sous la direction de : Michaël Aupetit (CEA) Gérard Govaert (UTC) Commissariat à l’Énergie Atomique Gaillard Pierre & Aupetit Michaël RIAS 2006
Quelle est la « forme » de ce nuage de points ? Introduction Quelle est la « forme » de ce nuage de points ? Quelle est la topologie des variétés génératrices de ce nuage de point? 1 point et 1 courbe Gaillard Pierre & Aupetit Michaël RIAS 2006
Pourquoi modéliser la topologie? Reconnaissance de formes Ajout de caractéristiques topologiques au caractéristiques statistiques et géométriques Détection de classes distinctes via composantes connexes Analyse exploratoire Mesure de caractéristiques topologiques Plus court chemin le long des variétés Robotique, commande de processus Trajectoire optimale Cinématique inverse Gaillard Pierre & Aupetit Michaël RIAS 2006
Hypothèse Des variétés génératrices inconnues… …corrompues par un bruit de nature inconnue …desquelles sont issues les observations avec une ddp inconnue… Gaillard Pierre & Aupetit Michaël RIAS 2006
Modèle proposé …à chaque composant Supposons une de laquelle est …desquelles sont issues les observations avec une ddp inconnue… Des variétés génératrices inconnues… …corrompues par un bruit de nature inconnue …convoluée à un bruit gaussien isovarié. …à chaque composant de laquelle est associé une ddp… Supposons une variété composite… Gaillard Pierre & Aupetit Michaël RIAS 2006
Quelle variété composite? Simplexes 0-simplexe 1-simplexe 2-simplexe 3-simplexe... Réalisation géométrique d’un k-simplexe = enveloppe convexe de k+1 points dans avec Complexes de simplexes Complexe de simplexes Le graphe de Delaunay en est un Gaillard Pierre & Aupetit Michaël RIAS 2006
Approche proposée Initialisation Positionnement de prototypes (QV) Construction graphe de Delaunay (variété composite) Modèle statistique de densité généré par la variété composite (équiprobabilité des composants) Gaillard Pierre & Aupetit Michaël RIAS 2006
Approche proposée Apprentissage Réglage de la variance et des probabilités des variétés composantes pour maximiser la vraisemblance du modèle / données Utilisation de l’algorithme EM Gaillard Pierre & Aupetit Michaël RIAS 2006
Approche proposée Après apprentissage Certaines composantes ont une probabilité associée nulle: Elle ne servent pas à expliquer les données On peut les supprimer : élagage du graphe Graphe représentant la topologie Gaillard Pierre & Aupetit Michaël RIAS 2006
Expérience Modélisation correcte de la topologie des variétés génératrices du nuage de point malgré le bruit Gaillard Pierre & Aupetit Michaël RIAS 2006
Points clefs On suppose que la topologie de la variété composite estime celle de la variété génératrice d’autant mieux que le modèle est vraisemblable La topologie de la variété composite est Extractible (pour extraire l’information topologique du modèle) Flexible (pour permettre une approximation universelle) Critère statistique de vraisemblance valable en dimension quelconque Gaillard Pierre & Aupetit Michaël RIAS 2006
Conclusion Méthode pour extraire l’information topologique avec une approche statistique Perspectives Extension du modèle aux complexes de simplexes Extension du modèle dans un cadre supervisé QUESTION ? Gaillard Pierre & Aupetit Michaël RIAS 2006
Annexes Difficultés techniques Établir le modèle générateur gaussien sur un complexe de simplexe et en déduire les équations d’apprentissage et d’exploitation (intégration numérique) Gaillard Pierre & Aupetit Michaël RIAS 2006
Une base de simplexes générateurs Intégration d’une gaussienne sur un domaine simpliciel : Aucune w wa wb vp v Fonctions « erf » … Schéma numérique Algorithmes de cubature et quasi-Monte Carlo wa wb wc Gaillard Pierre & Aupetit Michaël RIAS 2006