La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Analyse Factorielle Exploratoire Michel Tenenhaus.

Présentations similaires


Présentation au sujet: "Analyse Factorielle Exploratoire Michel Tenenhaus."— Transcription de la présentation:

1 Analyse Factorielle Exploratoire Michel Tenenhaus

2 2 1.Les données de Kendall

3 3

4 4 Tableau des corrélations One of the questions of interest here is how the variables cluster, in the sense that some of the qualities may be correlated or confused in the judges mind. (There was no purpose in clustering the candidates - only one was to be chosen).

5 5 2. Classification Ascendante Hiérarchique des variables * * * H I E R A R C H I C A L C L U S T E R A N A L Y S I S * * * Dendrogram using Complete Linkage (Méthode des voisins les plus éloignés) Rescaled Distance Cluster Combine C A S E Label Num X6 6 òûòòòòòòòø X12 12 ò÷ ùòø X8 8 òûòø ó ó X11 11 ò÷ ùòòòòò÷ ùòòòòòòòòòòòòòòòòòòòø X5 5 òòò÷ ó ó X10 10 òòòòòûòòòòò÷ ùòòòòòø X13 13 òòòòò÷ ó ó X2 2 òòòòòòòòòòòòòòòòòòòòòòòòòòòòòòò÷ ùòòòòòòòòòòòø X4 4 òòòòòòòòòòòûòòòòòòòòòòòòòø ó ó X14 14 òòòòòòòòòòò÷ ùòòòòòòòòòòò÷ ó X7 7 òòòòòòòòòòòòòòòòòòòòòòòòò÷ ó X9 9 òòòòòòòòòòòûòòòòòòòø ó X15 15 òòòòòòòòòòò÷ ùòòòòòòòòòòòòòòòòòòòòòòòòòòòø ó X1 1 òòòòòòòòòòòòòòòòòòò÷ ùò÷ X3 3 òòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòò÷

6 6 Interprétation des blocs Bloc 1 : Qualités humaines favorables au poste (Appearance), Self-confidence, Lucidity, Salesmanship, Drive, Ambition, Grasp, Potential Bloc 2 : Qualités de franchise et de communication Likeability, Honesty, Keenness to join Bloc 3 : Expérience Form of letter of application, Experience, Suitability Bloc 4 : Diplôme Academic ability

7 7 3. Uni-dimensionabilité dun bloc de variables Question : Un bloc de variables X j est-il essentiellement unidimensionnel ? Réponse : 1) La première valeur propre 1 de lanalyse en composante principale du bloc est supérieure à 1, les autres sont inférieures à 1. 2)Chaque variable est plus corrélée à la première composante principale quaux autres composantes principales. 3)Chaque variable X j a une corrélation supérieure à 0.5, en valeur absolue, avec la première composante.

8 8 Application : ACP de chaque bloc Bloc 1 Bloc 1 unidimensionnel

9 9 Application Bloc 2Bloc 3

10 10 4.Fiabilité de linstrument de mesure Mesure globale de lhomogénéité dun bloc de variables positivement corrélées entre elles : LAlpha de Cronbach Question : Comment mesurer globalement la fiabilité de linstrument de mesure ? Cest à dire le niveau dhomogénéité dun bloc de variables x i positivement corrélées entre elles ? Réponse : Utilisation du Alpha de Cronbach

11 11 Le modèle où : avec les e i et indépendants.

12 12 Définition du de Cronbach Formule de calcul du de Cronbach 1, et = 1 lorsque toutes les corrélations entre les x i sont égales à 1 et toutes les variances des x i sont égales.

13 13 de Cronbach pour items centrés-réduits On a la décomposition suivante : Si les variables sont centrées-réduites on obtient : Un bloc de variables positivement corrélées entre elles est homogène si la corrélation moyenne est grande.

14 14 de Cronbach pour items centrées-réduites Le rapport Un bloc est considéré comme homogène si : pour des recherches exploratoires pour des recherches confirmatoires devient :

15 15 Application : de Cronbach de chaque bloc Bloc 1 Les corrélations sont toutes positives.

16 16 Bloc 1 R E L I A B I L I T Y A N A L Y S I S - S C A L E (A L P H A) Item-total Statistics Scale Scale Corrected Mean Variance Item- Squared Alpha if Item if Item Total Multiple if Item Deleted Deleted Correlation Correlation Deleted X X X X X X X X Reliability Coefficients 8 items Alpha =.9503 Standardized item alpha =.9489 Scale = Somme des variables

17 17 Bloc 2 Item-total Statistics Scale Scale Corrected Mean Variance Item- Squared Alpha if Item if Item Total Multiple if Item Deleted Deleted Correlation Correlation Deleted X X X Reliability Coefficients 3 items Alpha =.8153 Standardized item alpha =.8138

18 18 Bloc 3 Item-total Statistics Scale Scale Corrected Mean Variance Item- Squared Alpha if Item if Item Total Multiple if Item Deleted Deleted Correlation Correlation Deleted X X X Reliability Coefficients 3 items Alpha =.8223 Standardized item alpha =.8237

19 19 5. ACP des données de Kendall

20 20 ACP des données de Kendall Les corrélations inférieures à 0.5 en valeur absolue ne sont pas montrées.

21 21 ACP + « Rotation Varimax » Seules sont montrées les corrélations maximum en valeur absolue sur chaque ligne.

22 22 6.Analyse Factorielle orthogonale 6.1. Les données p variables aléatoires X 1,…, X p, en général centrées-réduites Le modèle X 1 = 11 Y 1 + … + 1m Y m + e 1. X i = i1 Y 1 + … + im Y m + e i. X p = p1 Y 1 + … + pm Y m + e p où :Y j = facteurs communs centrés-réduits e i = facteurs spécifiques centrés et de variance i Les facteurs Y 1,…, Y m, e 1,…, e m sont tous non corrélés entre eux.

23 Analyse Factorielle (Option analyse en composantes principales) p variables X 1,…, X p centrées-réduites. Estimation des facteurs Y 1, …, Y m Les données Les m premières composantes principales réduites. Choix de m Nombre de valeurs propres supérieures à 1.

24 24 Application Kendall

25 25 Les loadings ij sont les coefficients de régression des Y j dans la régression de X i sur les facteurs Y 1,…, Y m. Les facteurs étant orthogonaux (= non corrélés) on a : ij = Cor(X i, Y j ) Calcul des saturations (loadings) ij Calcul des communautés (communalities) h i 2

26 26 Application Kendall Matrice des corrélations entre les variables et les facteurs

27 27 Calcul des spécificités i Qualité de la décomposition h i 2 = communauté Var(e i ) = spécificité Variance expliquée par Y 1 ( = 1 ) Variance expliquée par Y m ( = m ) Variance résiduelle Variance totale

28 28 Application Kendall avec m = 4 Communauté Variance expliquée

29 Décomposition de R en AF orthogonale Modèle : X i = i1 Y 1 + … + im Y m + e i Formules de décomposition :

30 30 Formule générale R = +

31 Les objectifs de lAF orthogonale Lanalyse factorielle orthogonale consiste à rechercher une décomposition de la matrice des corrélations R de la forme : R = + Les ij sont les saturations et les i les spécificités. Méthodes usuelles dextraction des saturations : - Analyse en composantes principales - Méthodes des facteurs principaux - Méthodes des moindres carrés - Méthodes des moindres carrés pondérés - Maximum de vraisemblance

32 32 Application Kendall R =

33 33 m = 4

34 34

35 Les méthodes de rotation Formule de décomposition (p = 3, m = 2) :

36 36 Les méthodes de rotation Matrice de rotation dun angle : X Y Y´ X´ A * x y x´ y´ T Matrice de rotation T : T´T = T T´= I * cos sin x´ = Proj(A) sur laxe X´ y´ = Proj(A) sur laxe Y´ * -sin cos

37 37 Indétermination de la décomposition I Nouvelle matrice des saturations après rotation :

38 38 Les méthodes de rotation VARIMAX et QUARTIMAX Objectifs : (1)Pour chaque colonne de les | ij | sont proches de 0 ou 1 : ==> Facteurs bien typés. Cest lobjectif de VARIMAX. (2)Sur chaque ligne de il y a un | ij | proche 1 et tous les autres proches de 0 : ==> Typologie des variables. Cest lobjectif de QUARTIMAX.

39 39 Exemple avec les blocs 2 et 3 = R 2 (X j ;Y 1,Y 2 ) Seulement dans loption ACP

40 40 Exemple avec les blocs 2 et 3

41 41 Utilisation de la rotation Varimax ( TT = I ) T * =

42 42 Utilisation de la rotation varimax

43 43 Exemple Kendall complet Application (ACP + Varimax)

44 44 Application (ACP + Varimax) Présentation améliorée Corrélations inférieures à 0.4 en valeur absolue non montrées

45 Estimation des facteurs communs (AF orthogonale) On recherche une variable (ou score) aussi proche que possible de Y j. La régression de Y j sur X 1,…, X p donne :

46 46 Application (ACP + Varimax) Coefficients appliqués aux variables centrées-réduites

47 47 Estimation des facteurs

48 48 7. Test de sphéricité de Bartlett Test : H 0 : R = Identité (aucune corrélation entre les X) On rejette H 0 au risque de se tromper si

49 49 Application

50 50 8. Kaiser-Meyer-Olkin Measure of Sampling Adequacy La corrélation partielle X i = i0 + i1 Y 1 + … + im Y m + i X k = k0 + k1 Y 1 + … + km Y m + k ==> Cor(X i, X k / Y 1, …, Y m ) = Cor( i, k ) Pour un modèle factoriel : X i = i1 Y 1 + … + im Y m + e i ==> Cor(X i, X k / Y 1, …, Y m ) = Cor(e i, e k ) = 0 « Anti-image correlation » -a ik : Si le modèle factoriel est vrai les a ik = cor(X i, X k / Autres X) sont faibles en valeur absolue. Les facteurs spécifiques sont non corrélés entre eux.

51 51 Application Kendall

52 52 Kaiser-Meyer-Olkin Measure of Sampling Adequacy Comparaison entre les corrélations r ik et les corrélations partielles a ik :

53 53 9. CONCLUSION (!!!!) … we find ourselves in sympathy with the growing group of statisticians who doubt if FA is worth using except in a few particular types of application. For example Hills (1977) has said that FA is not « worth the time necessary to understand it and carry it out ». He goes on to say that he regards FA as an « elaborate way of doing something which can only be crude, namely picking out clusters of inter-related variables, and then finding some sort of average of the variables in a cluster in spite of the fact that the variables may be measured on different scales. » C. Chatfield & A.J. Collins, 1980

54 Autres méthodes dextraction des saturations - Méthodes des facteurs principaux - Méthodes des moindres carrés - Méthodes des moindres carrés pondérés - Maximum de vraisemblance

55 La matrice des saturations Modèle : X i = i1 Y 1 + … + im Y m + e i Les ij sont les saturations (ou loadings) Matrice des saturations dans SPSS - Y j = Composantes principales réduites : Component Matrix - Y j orthogonaux : Factor Matrix - Y j corrélés : Pattern Matrix Si les Y j sont orthogonaux : ij = Cor(X i, Y j ). Si les Y j sont corrélés, les Cor(X i, Y j ) sont données dans la « Structure Matrix ».

56 Communauté et spécificité en AF orthogonale Modèle : X i = i1 Y 1 + … + im Y m + e i Décomposition de la variance : h i 2 = communauté Var(e i ) = spécificité Communauté initiale et finale : (option autre que lACP)

57 Qualité de la décomposition en AF orthogonale Modèle : X i = i1 Y 1 + … + im Y m + e i Décomposition de la variance : De On déduit : Variance expliquée par Y 1 Variance expliquée par Y m Variance résiduelle Variance totale

58 Méthodes des facteurs principaux Modèle : X i = i1 Y 1 + … + im Y m + e i Utilisation des formules de décomposition :

59 59 Méthode des facteurs principaux Exemple p=3 et m=2 Algorithme itératif : on part des communautés initiales, on estime les saturations, puis on recalcule les communautés à laide des saturations. On itère jusquà convergence des communautés.

60 60 Application Kendall

61 61 Application Kendall ACP Facteurs principaux Facteur principaux + rotation varimax

62 62 Application Kendall

63 Méthode des moindres carrées où

64 64 Application Kendall

65 Méthodes des moindres carrés généralisée Modèle : X i = i1 Y 1 + … + im Y m + e i, Var(e i ) = i où et

66 Méthode du maximum de vraisemblance Modèle : X i = i1 Y 1 + … + im Y m + e i, Var(e i ) = i Hypothèse : Les variables X j suivent une loi multinormale de moyenne et de matrice de covariance. Notations : S = matrice de covariances observée sur un échantillon de taille n matrice de covariance reconstituée par le modèle Maximisation : On recherche les saturations et les spécificités estimées maximisant le logarithme de la vraisemblance des données :

67 Test de validité du modèle à m facteurs On rejette le modèle à m facteurs au risque de se tromper si : Remarque :

68 68 Application aux données de Kendall m = 4 m = 5 m = 6 Ce test est connu pour rejeter trop facilement le modèle.

69 69 11.Analyse Factorielle oblique Les données p variables aléatoires X 1,…, X p, en général centrées-réduites Le modèle X 1 = 11 Y 1 + … + 1m Y m + e 1. X i = i1 Y 1 + … + im Y m + e i. X p = p1 Y 1 + … + pm Y m + e p où : - Les facteurs communs Y j peuvent être corrélés entre eux. - Les facteurs spécifiques e i,…, e m sont tous non corrélés entre eux et avec les facteurs communs.

70 70 X 1 = 11 Y 1 + … + 1m Y m + e 1. X i = i1 Y 1 + … + im Y m + e i. X p = p1 Y 1 + … + pm Y m + e p Le modèle sécrit aussi

71 71 Le modèle de lanalyse factorielle oblique :

72 Les méthodes de rotation oblique Formule de décomposition (p = 3, m = 2) : où = (TT) -1 est une matrice de corrélation

73 73 Options SPSS Direct Oblimin Method A method for oblique (nonorthogonal) rotation. When delta equals 0 (the default), solutions are most oblique. As delta becomes more negative, the factors become less oblique. To override the default delta of 0, enter a number less than or equal to Promax Rotation An oblique rotation, which allows factors to be correlated. This rotation can be calculated more quickly than a direct oblimin rotation, so it is useful for large datasets.

74 74 Application aux données de Kendall Matrice des corrélations entre les facteurs

75 75 Matrice des saturations ih Difficile à interpréter car les facteurs sont corrélées entre eux.

76 76 Matrice des Cor(X i, Y j ) Cette matrice est plus naturelle à interpréter.

77 77 Matrice des Cor(X i, Y j ) améliorée Cette matrice est encore plus facile à interpréter.


Télécharger ppt "Analyse Factorielle Exploratoire Michel Tenenhaus."

Présentations similaires


Annonces Google