ACP Analyse en Composantes Principales 19/09/2018 Groupe TT6 - KikiTeam
Description multidimensionnelle de données numériques Dans la plupart des applications, on travaille non pas avec une seule variable, mais avec un nombre de variable souvent élevé. L’étude séparée de chacune de ces variables n’est pas suffisante. ->Il faut donc analyser les données en tenant compte de leur caractère multidimensionnel 19/09/2018 Groupe TT6 - KikiTeam
Les méthodes multifactorielles d'Analyse des Données ACP : Analyse en Composantes Principales, pour les tableaux de variables quantitatives. AFTD : Analyse Factorielle d'un Tableau de Distances, pour les tableaux de distances. AFC : Analyse Factorielle des Correspondances, pour les tableaux de contingence. ACM : Analyse des Correspondances Multiples, pour les tableaux de variables qualitatives. STATIS : Structuration des Tableaux A Trois Indices de la Statistique AFM : Analyse Factorielle Multiple DACP : Double Analyse en Composante Principale La liste n'est pas exhaustive. 19/09/2018 Groupe TT6 - KikiTeam
Présentation générale de l'ACP L'étude séparée de chacune de ces variables donne quelques informations mais est insuffisante car elle laisse de côté les liaisons entre elles, ce qui est pourtant souvent ce que l'on veut étudier. C'est le rôle de la statistique multifactorielle, que d'analyser les données dans leur ensemble, en prenant en compte toutes les variables. L'Analyse en Composantes Principales est alors une bonne méthode pour étudier les données multidimensionnelles, lorsque toutes les variables observées sont de type numérique, de préférence dans les mêmes unités, et que l'on veut voir s’il y a des liens entre ces variables. 19/09/2018 Groupe TT6 - KikiTeam
Le principe d’ACP La mise en oeuvre mathématique de l'ACP peut être divisée en 6 étapes principales : 1. Préparer les données pour le traitement 2. Calculer la matrice des coefficients de corrélations des variables 3. Extraire les valeurs et vecteurs propres de cette matrice 4. Classer les vecteurs propres dans l'ordre décroissant des valeurs propres associées 5. Calculer la matrice des composantes principales 19/09/2018 Groupe TT6 - KikiTeam
Le principe d’ACP - 1 - Préparer les données pour le traitement Les observations de p variables sur n individus sont rassemblées dans uns matrice X à n lignes et p colonnes. 19/09/2018 Groupe TT6 - KikiTeam
Le principe d’ACP Le problème est que si on analyse directement la matrice X, les résultats seraient faussés par les valeurs relatives des variables (Par exemple si les valeurs ont été mesurées dans des unités différentes). Préparer les données pour le traitement consiste donc à transformer le tableau de données pour réduire ces effets. On peut alors travailler sur une version centrée-réduite Xcr de la matrice X. Pour centrer la matrice X, on soustrait à chacune des valeurs la moyenne de sa variable. Pour réduire la matrice centrée, on divise chacune des valeurs par l'écart-type de sa variable. 19/09/2018 Groupe TT6 - KikiTeam
Le principe d’ACP 5. Matrice des composantes principales La matrice appelée matrice des composantes principales est celle qui contient les coordonnées des individus dans l'espace formé par les composantes principales. Soit CP la matrice des composantes principales. On a alors : CP = Xrc . u 19/09/2018 Groupe TT6 - KikiTeam
ACP - Avantages Simplicité mathématique : Sur le plan mathématique, l'ACP est donc une méthode simple à mettre en oeuvre. Les seuls véritables outils mathématiques utilisés dans l'ACP sont le calcul des valeurs/vecteurs propres d'une matrice, et les changements de base. Simplicité des résultats : Grâce aux graphiques qu'elle fournit, l‘ACP permet d'appréhender une grande partie de ses résultats d'un simple coup d'oeil. Puissance : L'ACP a beau être simple. Elle offre, en quelques opérations seulement, un résumé et une vue complète des relations existant entre les variables quantitatives d'une population d'étude. Flexibilité : L'ACP est une méthode très souple, puisqu'elle s'applique sur un ensemble de données de contenu et de taille quelconques. 19/09/2018 Groupe TT6 - KikiTeam
Projet Le but du projet - Compresser une image noire blanche Le programme prend en entrée une image et à la sortie on obtiendra un certain nombre des coefficients qui présentent les niveaux de gris les plus importants dans l'image. 19/09/2018 Groupe TT6 - KikiTeam
Projet - Réalisation 0 - Choix du format d'image : Pour la raison de la simplicité de lecture et écriture d'une image, on choisit le format pgm qui est représenté par un fichier texte. Exemple: une image Pgm de taille 4x4 : P2 4 4 255 125 156 100 80 16 150 255 20 154 123 120 20 125 123 255 80 19/09/2018 Groupe TT6 - KikiTeam
Projet - Réalisation 1 - Preparer les données pour algorithme ACP Comme on a vu dans la partie de principe d'ACP, ACP prend en entrée un tableau dont chaque ligne est un individu et chaque colonne est une variable. Dans notre cas, le tableau aura une seule ligne (cas on a une seule image en entrée) et les variables seront les niveau de gris, donc il y a 256 variables qui correspondent aux 256 niveaux de gris d'une image noire et blanche. La valeur de chaque variable est donc le nombre de fois que le niveau de gris apparaît dans l'image. 19/09/2018 Groupe TT6 - KikiTeam
Projet - Réalisation 2. Calculer la matrice des coefficients de corrélations des variables 3. Extraire les valeurs et vecteurs propres de cette matrice 4. Classer les vecteurs propres dans l'ordre décroissant des valeurs propres associées 5. Calculer la matrice des composantes principales 19/09/2018 Groupe TT6 - KikiTeam
Projet - Réalisation Exemple : on reprend l’image dans l'exemple ci-dessous 19/09/2018 Groupe TT6 - KikiTeam
Projet - Résultats L'image en entrée 19/09/2018 Groupe TT6 - KikiTeam
Projet - Résultats En fonction de nombre de coefficient, on obtient les résultats suivants: Pour 9 coefficients: 19/09/2018 Groupe TT6 - KikiTeam
Projet - Résultats Pour 20 coefficients: 19/09/2018 Groupe TT6 - KikiTeam
Projet - Résultats Pour 50 coefficients: 19/09/2018 Groupe TT6 - KikiTeam
Projet - Résultats Pour 100 coefficients: 19/09/2018 Groupe TT6 - KikiTeam