La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

1 LAnalyse en Composantes Principales: A.C.P. ou carte perceptuelle ou mapping.

Présentations similaires


Présentation au sujet: "1 LAnalyse en Composantes Principales: A.C.P. ou carte perceptuelle ou mapping."— Transcription de la présentation:

1 1 LAnalyse en Composantes Principales: A.C.P. ou carte perceptuelle ou mapping.

2 2 Réaliser une analyse en composantes principales cest représenter dans un espace de dimension faible par exemple 2 une information dont on dispose dans un espace de dimension élevée n ou p avec lobjectif de restituer dans cette opération une quantité dinformation maximale par rapport à linformation disponible dans le fichier de base.

3 3 IndividusPoidsTailleAgeNote Individus Axe 1?Axe 2? 1-1,62-0,20 2-1,09-0,52 3-0,98-0,72 41,270,09 50,67-0,46 60,90-0,90 70,810,35 8-0,26-0,16 9-0,342,63 100,71-0,10 Par exemple, du fichier disponible ( tableau 1), on déduira les coordonnées des individus dans un espace de dimension deux (tableau 2) Tableau1Tableau2 Quantité dinformation?

4 4 Individus Axe 1Axe 2 1-1,62-0,20 2-1,09-0,52 3-0,98-0,72 41,270,09 50,67-0,46 60,90-0,90 70,810,35 8-0,26-0,16 9-0,342,63 100,71-0, Tableau2Graphe 1 Quantité dinformation restituée?

5 5 Individus Axe 1Axe 2Axe 3 1-1,62-0,20-0,17 2-1,09-0,520,30 3-0,98-0,720,86 41,270,091,48 50,67-0,460,37 60,90-0,900,07 70,810,35-1,81 8-0,26-0,16-1,51 9-0,342,630,46 100,71-0,10-0,06 Axe 2 Peut-on améliorer limage? Axe 1 Axe 3 Axe Axe 1 Axe 2 1

6 Axe 1 Axe 3 Axe Axe 1 Axe 2 Axe 3 6

7 Axe 1 Axe 3 Axe 2

8 8 11. Du tableau de base on déduit lun des deux nuages possibles, individus ou variables. 12. On détermine ensuite linertie I, cest-à-dire la dispersion du nuage par rapport à son centre de gravité. 1. Le schéma de travail:

9 9 Individus Axe 1 Axe 2 M1M1 … MiMi … MnMn Ceci constitue un nouveau nuage de points pour lequel on détermine linertie I. On compare I avec I. Si le ratio est bon, on peut conserver limage.. M 1. Mi. M n 13. Réaliser une A.C.P. cest déterminer un espace de dimension faible dans lequel le nuage choisi sera projeté orthogonalement.. M 1. Mi

10 10 Fichier de base: individus i de poids respectifs mi Espace de dimension élevée dans lequel les individus sont représentés par des points Mi. axe factoriel 1 Inertie I'Inertie I A.C.P réalisée de telle sorte que le ratio I'/I soit le plus élevé possible. Analyse et retour sur étude.

11 11 2. Linertie La forme mathématique de linertie est la suivante: Lorsque les variables sont centrées, cest-à-dire lorsquà chaque valeur on a enlevé la valeur moyenne, linertie est égale à la somme des variances des variables que lon soumet à lanalyse. A ce titre linertie est une généralisation de la notion de variance. Lorsque les points représentant les individus sont proches du centre de gravité, linertie est faible. Lorsque linertie est faible, les points sont proches du centre de gravité et il ny a pas lieu de stratifier.

12 12 Lorsque les variables sont centrées et réduites, cest-à-dire lorsque on a divisé chacune des valeurs centrées par lécart type, linertie est égale au nombre de variables que lon soumet à létude soit p.

13 13 3. Matrice dinertie La réalisation dune ACP est construite sur les qualités dune matrice qui porte le nom de matrice dinertie. Celle-ci est définie de la manière suivante: Chaque produit sexprime par la relation: et la matrice dinertie par la relation:

14 14

15 Nous constatons que la trace de cette matrice, cest-à-dire la somme de ses éléments diagonaux est égale à linertie de système. Ainsi, avons-nous la possibilité de caractériser la dispersion du nuage par les valeurs propres dune matrice. En effet la trace est un invariant égal à la somme des valeurs propres. Parce que linertie est identifiée aux valeurs propres dune matrice, il est normal de sélectionner les plus importantes pour conserver au mieux linformation. Rangeons celles-ci par ordre décroissant et sélectionnons les plus fortes. Le taux de restitution de linformation dans un plan est donné par:

16 Lorsque lanalyste juge que ce taux est correct, il peut représenter son nuage en dimension 2. Le plan de projection est engendré par deux vecteurs propres associés aux deux plus grandes valeurs propres. Soit à résoudre les équations: j variant de 1 à 2 On se posera la question du type de repère: orthonormé; orthogonal; normé; quelconque

17 Les diverses projections Lorsque le plan est défini, il reste à donner les divers coordonnées. Pour cela, on utilise les relations: abscisse ordonnée et chaque individu sera représenté dans le plan par le point de coordonnées:

18 18 Quelques éléments supplémentaires. 1.Que faire des valeurs manquantes ou des non réponses? Il est fréquent de constater que certains fichiers sont incomplets: information non disponibles, non réponses, fichier non actualisé…Pour compenser le manque dinformation, on peut choisir entre plusieurs options: insérer une valeur neutre, recomposer linformation, supprimer toute la ligne ou la colonne correspondante.

19 19 2. Donner un sens aux axes Il est possible détudier la corrélation entre les axes et les diverses variables qui participent à lanalyse. Une corrélation forte donne à la variable considérée un pouvoir explicatif fort. 3. Utilisation dun marqueur Il sagit dindividus qui ne participent pas à lanalyse; mais qui seront représentés. Ils sont connus pour leurs qualités.

20 20 4. Projections des variables Le nuage des individus et le nuage des variables sont deux représentations différentes dun même tableau. Ainsi, des relations très fortes lient ces deux nuages. Les relations de transition, cest-à-dire les relations de passage dun nuage projeté à lautre sont données ci-après:

21 21 4. Exemple On interroge des chefs de service sur les qualités: X 1 : technicité; X 2 : polyvalence; X 3 : créativité que possèdent ou non leurs collaborateurs. Les réponses sont données sur une échelle de valeurs comprises entre 0 et 4. Les résultats sont présentés dans le tableau suivant:

22 22 IndividusTechnicitéPolyvalenceCréativité Réaliser une A.C.P dordre 2 du nuage des individus.

23 23 Points représentant les individusVecteursTechnicitéPolyvalenceCréativité M1M1 GM M2M2 GM 2 -2 M3M3 GM M4M4 GM M5M5 GM M6M6 GM M7M7 GM M8M8 GM 8 02 M9M9 GM M 10 GM M 11 GM M 12 GM M 13 GM M 14 GM G000

24 24 Si à chaque individu on accorde le même poids égal à 1/14, linertie est égale à: Par exemple dans ce calcul, la variance de la première variable est égale à 8 / 14, alors que la variable numéro deux a une variance égale à 32 / 14 et que la variable numéro trois à une variance égale à 4. Cest ce nombre quil faut essayer de restituer.

25 25 Lorsque lon sélectionne ACP dans un logiciel, on demande de sélectionner le meilleur plan de projection. Celui-ci est dirigé par 2 vecteurs appelés vecteurs propres de la matrice dinertie associés aux deux plus grandes valeurs propres de la même matrice. ( Il faut noter que dans lopération, on a réussi à identifier la quantité dinformation aux valeurs propres dune matrice). La matrice dinertie est donc la matrice de référence de lAnalyse en Composantes Principales. Lorsque les valeurs sont centrées, la matrice dinertie est la matrice des variances/covariances; Lorsque les valeurs sont centrées et réduites, la matrice est la matrice des corrélations. La somme des éléments diagonaux de cette matrice est égale à linertie.

26 26 Dans notre exemple, cette matrice est égale à: Les valeurs propres sobtiennent par différentes méthodes. Ici, elles sont égales à: On note que

27 27 Le taux de restitution de linformation est égal à: Cela signifie que limage de dimension deux que lon va voir représente bien le nuage de points. Si le taux de restitution est insuffisant, on ajoute un axe ou on réduit le nombre de variables que lon soumet à l analyse. Nous comprenons mieux la nécessité détudier les diverses corrélations entre les variables.

28 28 Axe 1: 58,3 % Axe 2: 35,9 % Créativité Polyvalence et technicité Axe 1Axe 2 22, , ,92 20,19 2-1, , ,19 21,92 2-2, ,92 -22,11 -20,19

29 29 Axe 1 Axe Excellent collaborateur: référence

30 30 VecteursTechnicitéPolyvalenceCréativité Facteur 1Facteur 2 GM ,11 GM2-2 -2,11 GM ,92 GM ,19 GM ,92 GM ,19 GM GM ,19 GM ,92 GM ,11 GM GM ,92 GM ,11 GM ,19 Pour donner un sens aux deux axes, on peut utiliser la corrélation:

31 31 Corrélations TechnicitéPolyvalenceCréativité Variables / axe Variables / axe 20,57 0,996 0

32 32 E 1. On donne le tableau suivant représentant les notations réalisées ( sur des échelles de valeurs de 0 à 7) par des acheteurs de 15 voitures de toutes marques et de tous types à propos de 3 variables : confort, ligne, puissance. Sachant que chaque individu interrogé a un poids égal à 1/15 réaliser lanalyse en composantes principales dordre 2 du nuage des individus. Individus Confort Ligne Puissance

33 33 Code individus ConfortLignePuissanceAxe 1Axe ,07-2-2, ,07-2-3, ,07-2-3,660 40,9300, ,070-1, ,9301,651 72,9323,55 803,9324, ,07-2-3, ,070-0, ,9322, ,070-0, ,070-0, ,9323, ,070-0,062

34 34 1, ,2623, ,133 Corrélations variables / axe 100,990,96 Corrélations variables / axe La matrice des variances / covariances est données ci-après La matrice des corrélations des variables et des axes factoriels est donnée ci-après

35 35 E2. Étude de la comparaison de pays dun point de vue économique (statistiques anciennes; mais intéressantes). Les 18 variables prises en compte sont: X 1 : La population totale en milliers dhabitants; X 2 : La densité au km²; X 3 : Le taux daccroissement total de la population; X 4 : % dactifs dans lagriculture, la sylviculture et la pêche; X 5 : % dactifs dans lindustrie; X 6 : Produit National Brut en dollars par habitant; X 7 : % du P.I.B. en agriculture; X 8 : Formation brute du capital fixe en % du P.N.B.; X 9 : Recettes courantes en % du P.N.B.

36 36 X 10 : Réserves officielles (en millions de dollars); X 11 : Le taux descompte officiel; X 12 : Importations marchandises totales (en millions de dollars); X 13 : Exportations marchandises totales ( en millions de dollars); X 14 : Calories par habitant et par jour; X 15 : Nombre de logements achevés pour 1000 habitants; X 16 : consommation délectricité en kwh par habitant et par an; X 17 : Dépenses publiques déducation en % du P.N.B.; X 18 : Nombre de T.V. pour 1000 habitants.

37 37 paysX1X2X3*100X4*100X5*100X6X7*100X8*100X9*100 D A B CDN DK E USA SF F GR SE I JAP NL pays RUN S

38 38 X10X11*100X12X13X14X15*100X16X17*100X

39 39 Réaliser une ACP du nuage des individus en utilisant deux axes. Définir, à partir de lA.C.P., une typologie pour laquelle on étudiera lhomogénéité des groupes.

40 40 Paramétrage de lACP avec SPSS

41 41

42 42 Sélectionner les variables dans la fenêtre de gauche et valider votre choix par la flèche centrale Sélectionner maintenant chaque fonction pour définir les paramètres de lACP

43 43 Espérance et variance de chaque variable Matrice des corrélations Tests de validité de lACP

44 44 Méthode dextraction ACP normée ou non normée Graphique des valeurs propres Sélection des facteurs : valeur propre supérieure à 1 ou nombre de facteurs

45 45 Sélectionner

46 46 Enregistrement des coordonnées des individus sur les axes factoriels. On utilisera ces coordonnées pour représenter graphiquement les individus


Télécharger ppt "1 LAnalyse en Composantes Principales: A.C.P. ou carte perceptuelle ou mapping."

Présentations similaires


Annonces Google