La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

ACP visualisation Représentation graphique: projection dans un plan de n individus à p caractères Un individu est un point d’un espace à p dimensions.

Présentations similaires


Présentation au sujet: "ACP visualisation Représentation graphique: projection dans un plan de n individus à p caractères Un individu est un point d’un espace à p dimensions."— Transcription de la présentation:

1 ACP visualisation Représentation graphique: projection dans un plan de n individus à p caractères Un individu est un point d’un espace à p dimensions Un caractère est un point d’un espace à n dimensions calcul des distances: centrer et réduire synopmetho.sba ACPFR.XLS M1 Manangement UE4 LP

2 Visualiser M1 Manangement UE4 LP TAILLE PUIS REVENU QCSP QGEO QSEXE
1,75 7 100000 1 I002 1,74 6 90000 4 3 I003 1,7 5 80000 2 I004 1,59 9 200000 I005 1,72 11 400000 I006 I007 I008 I009 I010 1,5 I011 120000 I012 8 I013 1,9 I014 1,76 300000 I015 I016 I017 M1 Manangement UE4 LP

3 Tableaux Croisés Dynamiques
Somme de REVENU QCSP Total 1 2 3 4 5 M1 Manangement UE4 LP

4 Cadres moyens ouvriers employés professions lib. taille m 1.75 1.78
Agriculteurs Cadres moyens ouvriers employés professions lib. taille m 1.75 1.78 1.74 1.70 1.72 Puissance véhicule 7 9 6 5 11 revenu F 90 000 80 000 M1 Manangement UE4 LP

5 Matrice des observations
M1 Manangement UE4 LP

6 ACP normalisation exemple
Désirant visualiser les différences par CSP, il faut normaliser les données. -données lignes transformées en écart par rapport à la moyenne de la ligne: Visualisation des différences relatives écart/m Agric. Cadrm. Ouvr. Empl. Proflib. taille m Puiss cv revenu F M1 Manangement UE4 LP

7 ACP réduire Résultats réduits obtenus par
division des lignes par l’écart-type du caractère. L’écart-type de la ligne devient 1 0,37 1,11 0,00 -1,48 -0,74 -0,25 0,58 -0,66 -1,08 1,41 -0,55 0,19 -0,62 -0,70 1,67 M1 Manangement UE4 LP

8 M1 Manangement UE4 LP

9 ACP projection La matrice des
covariances (distance euclidienne réduite) ou corrélations (centrées-réduites) est utilisée Représentation par projection, déformation, perte d’information les distances entre les n points du plan de projection ne peuvent égaler les distances entre les n individus de l’espace à p dimensions M1 Manangement UE4 LP

10 ACP proximité =(1/n) [(xij-x.j)/j)- (xij’-x.j’)/j’]²
Distance entre deux individus Distance entre deux variables d²(j,j’) =  (xij-xij’)² =(1/n) [(xij-x.j)/j)- (xij’-x.j’)/j’]² M1 Management UE LP

11 M1 Manangement UE4 LP

12 M1 Manangement UE4 LP

13 CORRELATION Si x et y sont centrées réduites, alors M1 Manangement UE4
LP

14 Points variables Si rjj’ coefficient corrélation d²(j,j’)= 2(1-rjj’)
Longueur d’un vecteur Variable Xj ||Xj||= ((1/n)∑ xj ²)1/2 Centrée -réduite moyenne nulle, ||Xj||= 1 Extrémités vecteurs Variables situés dans une sphère de rayon 1 M1 Manangement UE4 LP

15 ACP construction Corrélations: déterminent les axes factoriels et expriment la dispersion Réduction de caractères possible: seulement si des coefficients de corrélation non nuls existent sur les caractères initiaux Par construction, le coefficient de corrélation entre 2 variables (centrées) égale le cosinus de l’angle entre ces 2 variables M1 Manangement UE4 LP

16 ACP: individus - variables
OBSERVATIONS VARIANCES individus CORRELATIONS variables INTERPRETATIONS individus plan distances variables cercle angles M1 Manangement UE4 LP

17 ACP Plan factoriel plan de projection:
distances en moyenne les mieux conservées origine point moyen minimisation des écarts entre tout point initial et sa projection ou maximisation des distances entre les projections p1, p2,... pn un plan est engendré par deux vecteurs perpendiculaires, soient u1 u2, M1 Manangement UE4 LP

18 ACP: recherche des vecteurs engendrant le plan factoriel
Xi ||X i u|| est la longueur de la projection de Xi sur l’axe engendré par u Somme carrés des n projections est: ∑ (Xi u)² = u’X’Xu=(Xu)’Xu = ||Xu|| ∑ IXi² = ∑ IH² + ∑ HXi² Inertie nuage: V/u+distance nuage/u Conserver au mieux l’information initiale c’est Minimiser ∑ HXi² revient à Maximiser ∑ IH² Part de Variance Expliquée par u: ∑ IH² / ∑ IXi² I H u X i . u = ||Xi u||1/² IXi² = IH² +HXi² Cos² = IH²/IXi² I centre de gravité (nuage individus)

19 M1 Manangement UE4 LP

20 Si les individus sont projetés
M1 Manangement UE4 LP

21 ACP vecteur propre D’où le programme: Max u’X’Xu u’u =1
- lagrangien L(u,λ)= u’X’Xu+ λ(1-u’u) - dérivée (dL/du)= 2 X’Xu - 2 λu condition du 1er ordre: annulation de la dérivée au point candidat à l’optimum X’X u = λu u est vecteur propre associé à la valeur propre maximale λ M1 Manangement UE4 LP

22 ACP meilleur plan global
La distance entre les projections est maximale si le premier axe a pour vecteur directeur u, vecteur propre de la matrice des variances associé a la valeur propre maximale Le deuxième vecteur engendrant ce meilleur plan de représentation est orthogonal et unitaire M1 Manangement UE4 LP

23 ACP optimisation D’où le programme: Max v’X’Xv v’v =1
- lagrangien L(v,μ)= v’X’Xv+ μ(1-v’v) - dérivée (dL/dv)= 2 X’Xv - 2 μ v condition du 1er ordre: annulation de la dérivée au point candidat à l’optimum X’X v = μ v, μ est alors la deuxième plus grande valeur propre M1 Manangement UE4 LP

24 Relations entre les espaces
Dans IRp X’X u = λu, i.e. ║Xu║= λ=u X’X u XX’X u = λXu i.e. λ vp de XX’ associée à Xu Dans IRn La matrice est XX’ XX’ u’ = λ’ u’ λ’ = λ M1 Manangement UE4 LP

25 Coordonnées nouvelles
D’où u’= Xu/ √λ u= X’u’/ √λ PROPORTIONNALITE Nouvelles coordonnées: Les composantes Xu sont les coordonnées des individus φ =Xu et Ψ =X’u’pour les variables M1 Manangement UE4 LP

26 ACP plans factoriels La base globalement la meilleure est composée des vecteurs propres associés aux deux plus grandes valeurs propres D’autres bases, composées de vecteurs propres associées aux valeurs propres moins grandes peuvent aussi représenter le nuage en le déformant peu par rapport aux objectifs M1 Manangement UE4 LP

27 M1 Manangement UE4 LP

28 ACP plusieurs facteurs
La qualité de le représentation par les Q premiers axes factoriels est liée à la part de ∑ λi, i=1…q dans tr X’X=∑ λi i=1…n Si corrélation tr x’x=p Axes du plan de projection: u1, u2 … = Facteurs principaux Coordonnées des individus dans ce plan: Ci = Composantes principales Variances CP = VP M1 Manangement UE4 LP

29 ACP Les composantes principales sont les (c1, c2...cp ) sur l’axe Uk
liste des coordonnées des n individus sur l’axe Uk , ci1,ci2, ...cip combinaison linéaire des caractères initiaux pour tout i, xi Dont les coefficients sont les composantes du kième facteur principal, Contribution de i: c²ik /λk poids un individu =1/n, contribution>poids intéressante,problématique si >0,25 M1 Manangement UE4 LP

30 ACP résumé Visualisation dans un espace centre: point moyen
Réduction des caractères par combinaison coefficients corrélation des caractères initiaux non nuls Maximisation de l’écartement différenciation des catégories M1 Manangement UE4 LP

31 ACP résultats axes principaux
minimum de déformation du nuage de points, inertie des points maximale par rapport à ces axes meilleur plan de projection origine plan, point moyen des individus, confondue avec le centre du cercle des corrélations: variables M1 Manangement UE4 LP

32 ACP ex. synthèse par moyenne
Agric. Cadrmoy. Ouvr. Empl. proflib. taille m Puisscv revenu F Exercice: VIOAcp.xls M1 Manangement UE4 LP

33 acp.sba M1 Management UE LP

34 ACP Pertinence Interprétation
Qualité - fonction du taux d’inertie - fonction du carré du cosinus de chaque point avec le plan, ou fonction des corrélations composantes principales et caractères initiaux plus il est élevé meilleure est la représentation Cercle des corrélations - angle aigu: caractères proches, obtus: opposés - droit: différenciés Plan factoriel plus un individu est extrême, plus il s’écarte de la moyenne l’origine; plus il s’oppose à ceux se situant à l’autre extrémité, premier axe opposition gauche-droite pour le deuxième opposition bas-haut M1 Management UE LP


Télécharger ppt "ACP visualisation Représentation graphique: projection dans un plan de n individus à p caractères Un individu est un point d’un espace à p dimensions."

Présentations similaires


Annonces Google