La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Analyse en Composantes Principales Méthode statistique descriptive permettant de résumer le maximum de linformation contenue dans un tableau de données.

Présentations similaires


Présentation au sujet: "Analyse en Composantes Principales Méthode statistique descriptive permettant de résumer le maximum de linformation contenue dans un tableau de données."— Transcription de la présentation:

1

2 Analyse en Composantes Principales Méthode statistique descriptive permettant de résumer le maximum de linformation contenue dans un tableau de données constitué de n individus et p variables quantitatives.

3 valeur de la variable j prise par lindividu i n individus p variables métriques Tableau de données

4 CBA M1M C B A M1M1 M2M2 M3M M1M1 M2M2 Illustration graphique de lACP

5 Le centre de gravité du nuage est le point « moyen » La dispersion du nuage se mesure en additionnant les carrés des distances entre les points du nuage et le centre de gravité Dispersion = Information = Inertie La projection fait baisser la dispersion Il faut faire en sorte que la perte dinertie soit la plus faible possible

6 Comment choisir le bon espace de projection ? Le bon « plan de coupe » ?

7 Le principe de lA.C.P. Les individus (ou les variables ) sont décrits dans un espace à « p (ou n) dimensions » (nombre de variables (ou dindividus)) Trouver des espaces de dimensions « plus petites » afin dy voir au mieux les individus

8 Le principe de lA.C.P. Comment définir les nouveaux axes ? On substitue aux variables initiales des « indices synthétiques » qui sont des combinaisons linéaires de ces variables initiales. Le premier axe (ou première composante principale) sera tel que la variance des individus (sur cet axe) soit maximale. cet axe explique donc une certaine proportion de la variance totale des individus.

9 Le principe de lA.C.P. Comment définir les nouveaux axes ? Après la 1 ère composante principale, on en recherche une 2 ème qui doit avoir les propriétés suivantes : Avoir une corrélation nulle avec la première, Avoir, à son tour, la plus grande variance. Le processus se répète jusquà obtenir les p composantes (où p représente le nombre de variables initiales)

10 LA.C.P. permet de : Comment se structurent les variables : quelles sont celles qui sont associées ? quelles sont celles qui ne le sont pas ? quelles sont celles qui vont dans le même sens ? quelles sont celles qui sopposent ? Comment se répartissent les individus : quels sont ceux qui se ressemblent ? quels sont ceux qui sont dissemblables ? Représenter les variables en fonction de leurs corrélations Représenter les individus en fonction de leurs « proximités »

11 Le principe de lA.C.P. Quels types de tableaux peut-on traiter avec lA.C.P. ? Tableau de mesures

12 Le principe de lA.C.P. Quels types de tableaux peut-on traiter avec lA.C.P. ? Tableau de notes

13 Le principe de lA.C.P. Quels types de tableaux peut-on traiter avec lA.C.P. ? Tableau de rangs

14 Le principe de lA.C.P. Exemple de tableau « hybride » ou « mixte »MesuresRangsNotes Problème : ce sont les variables les plus dispersées qui engendrent les premières composantes. Centrer-réduire

15 VariablesComposantes Objectif : Transformer p variables quantitatives initiales inter-corrélées en p nouvelles variables (composantes principales) non corrélées Le principe de lA.C.P.

16 Coefficients des combinaisons linéaires des p variables initiales Variances des individus sur les composantes principales correspondantes Le principe de lA.C.P.

17 Méthode : Matrice des vecteurs propres Matrice « diagonale » des valeurs propres 0 0 Matrice des corrélations (ou var/cov) Diagonalisation Le principe de lA.C.P.

18 Présentation de lexemple/40

19

20

21 Interprétation des valeurs propres A.C.P. sur données centrées-réduites variable variance = 1 variance = nombre de variables Part de linformation ini- tiale restituée par laxe i Exemple : Description des calculs et commentaires

22

23

24

25 Ind1 +Ind2 -Ind3 +Ind4 -Ind5 -Ind6 -Ind7 + Ind8 - Ind9 +Ind

26 Description des calculs et commentaires

27

28 f1 et f2 paraissent proches alors que e1 et e2 ne le sont pas


Télécharger ppt "Analyse en Composantes Principales Méthode statistique descriptive permettant de résumer le maximum de linformation contenue dans un tableau de données."

Présentations similaires


Annonces Google