Télécharger la présentation
1
Analyse en Composantes Principales
ACP Analyse en Composantes Principales Méthode statistique descriptive permettant de résumer le maximum de l’information contenue dans un tableau de données constitué de n individus et p variables quantitatives.
2
ACP Tableau de données p variables métriques valeur de la variable j
prise par l’individu i n individus
3
Illustration graphique de l’ACP
4 8 12 16 20 C B A M1 4 8 12 16 20 C B A M1 M2 M3 4 8 12 16 20 M1 M2
4
Le centre de gravité du nuage est le point « moyen »
Il faut faire en sorte que la perte d’inertie soit la plus faible possible La dispersion du nuage se mesure en additionnant les carrés des distances entre les points du nuage et le centre de gravité Dispersion = Information = Inertie La projection fait baisser la dispersion
5
Comment choisir le bon espace de projection ?
ACP Le bon « plan de coupe » ?
6
ACP Le principe de l’A.C.P.
Les individus (ou les variables ) sont décrits dans un espace à « p (ou n) dimensions » (nombre de variables (ou d’individus)) 1 3 2 Trouver des espaces de dimensions « plus petites » afin d’y voir au mieux les individus
7
ACP Le principe de l’A.C.P. Comment définir les nouveaux axes ?
On substitue aux variables initiales des « indices synthétiques » qui sont des combinaisons linéaires de ces variables initiales. Le premier axe (ou première composante principale) sera tel que la variance des individus (sur cet axe) soit maximale. Ä cet axe explique donc une certaine proportion de la variance totale des individus.
8
ACP Le principe de l’A.C.P. Comment définir les nouveaux axes ?
Après la 1ère composante principale, on en recherche une 2ème qui doit avoir les propriétés suivantes : ? Avoir une corrélation nulle avec la première, ? Avoir, à son tour, la plus grande variance. Le processus se répète jusqu’à obtenir les p composantes (où p représente le nombre de variables initiales)
9
ACP L’A.C.P. permet de : Représenter les variables en
fonction de leurs corrélations Représenter les individus en fonction de leurs « proximités » Comment se structurent les variables : ü quelles sont celles qui sont associées ? ü quelles sont celles qui ne le sont pas ? ü quelles sont celles qui vont dans le même sens ? ü quelles sont celles qui s’opposent ? Comment se répartissent les individus : ü quels sont ceux qui se ressemblent ? ü quels sont ceux qui sont dissemblables ?
10
Quels types de tableaux peut-on traiter avec l’A.C.P. ?
Le principe de l’A.C.P. Quels types de tableaux peut-on traiter avec l’A.C.P. ? Tableau de mesures
11
Quels types de tableaux peut-on traiter avec l’A.C.P. ?
Le principe de l’A.C.P. Quels types de tableaux peut-on traiter avec l’A.C.P. ? Tableau de notes
12
Quels types de tableaux peut-on traiter avec l’A.C.P. ?
Le principe de l’A.C.P. Quels types de tableaux peut-on traiter avec l’A.C.P. ? Tableau de rangs
13
Exemple de tableau « hybride » ou « mixte »
ACP Le principe de l’A.C.P. Exemple de tableau « hybride » ou « mixte » Mesures Rangs Notes Centrer-réduire Problème : ce sont les variables les plus dispersées qui engendrent les premières composantes.
14
ACP Le principe de l’A.C.P. Objectif : Variables Composantes
Transformer p variables quantitatives initiales inter-corrélées en p nouvelles variables (composantes principales) non corrélées Variables Composantes
15
ACP Le principe de l’A.C.P.
Coefficients des combinaisons linéaires des p variables initiales Variances des individus sur les composantes principales correspondantes
16
ACP Le principe de l’A.C.P. Méthode : Diagonalisation Matrice des
corrélations (ou var/cov) æ è ç ö ø ÷ Matrice des vecteurs propres Matrice « diagonale » des valeurs propres Diagonalisation
17
Présentation de l’exemple
ACP Présentation de l’exemple /40
18
Présentation de l’exemple
ACP Présentation de l’exemple
20
Description des calculs et commentaires
ACP Description des calculs et commentaires Interprétation des valeurs propres Exemple : A.C.P. sur données centrées-réduites " variable Ø variance = 1 Part de l’information ini- tiale restituée par l’axe i S variance = nombre de variables
21
Description des calculs et commentaires
ACP Description des calculs et commentaires
22
Description des calculs et commentaires
ACP Description des calculs et commentaires
23
Description des calculs et commentaires
ACP Description des calculs et commentaires
24
Description des calculs et commentaires
ACP Description des calculs et commentaires Ind1 + Ind2 - Ind3 + Ind4 - Ind5 - Ind6 - Ind7 + Ind8 - Ind9 + Ind10 - -3.00 -2.50 -2.00 -1.50 -1.00 -0.50 0.00 0.50 1.00 1.50 2.00 2.50
25
Description des calculs et commentaires
ACP Description des calculs et commentaires
26
Description des calculs et commentaires
ACP Description des calculs et commentaires
27
Description des calculs et commentaires
ACP Description des calculs et commentaires f1 et f2 paraissent proches alors que e1 et e2 ne le sont pas
Présentations similaires
© 2024 SlidePlayer.fr Inc.
All rights reserved.