La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Analyse Factorielle des Correspondances Généralisation de l’A.C.P. adaptée au traitement de données qualitatives se présentant sous la forme d’un tableau.

Présentations similaires


Présentation au sujet: "Analyse Factorielle des Correspondances Généralisation de l’A.C.P. adaptée au traitement de données qualitatives se présentant sous la forme d’un tableau."— Transcription de la présentation:

1

2 Analyse Factorielle des Correspondances Généralisation de l’A.C.P. adaptée au traitement de données qualitatives se présentant sous la forme d’un tableau de contingence.

3 Le tableau de données initial nombre d’individus ayant choisi simultanément les modalités x i et y j Y possède m modalités X possède n modalités Soient X et Y deux variables qualitatives ayant respectivement x n et y m modalités. Le tableau de contingence K formé à partir de ces deux variables aura autant de lignes (colonnes) que la variable X a de modalités (n) et autant de colonnes (lignes) que la variable Y a de modalités (m).

4 ABCDEFGH Ile-de-France Champagne-Ardennes Picardie Haute-Normandie Centre Basse-Normandie Bourgogne Nord-Pas de Calais Lorraine Alsace Franche-Comté Pays de la Loire Bretagne Poitou-Charentes Aquitaine Midi-Pyrénées Limousin Rhône-Alpes Auvergne Languedoc-Roussillon Provence-Alpes-Côte d'Azur Corse 9 724 924 1 081 1 135 1 482 1 033 1 272 2 549 1 828 1 076 827 2 213 2 158 1 358 2 757 2 493 551 3 951 1 066 1 844 3 944 327 5 650 464 490 587 667 509 527 1 141 681 443 333 809 1 271 503 873 1 120 297 2 127 579 816 1 645 31 8 679 567 830 686 1 020 553 861 2 164 1 364 880 481 1 439 1 633 639 1 466 1 494 386 3 218 724 1 154 2 415 85 9 432 984 1 222 904 1 535 1 063 1 116 2 752 1 741 1 121 892 2 623 2 352 1 377 2 296 2 329 663 4 743 1 239 1 839 3 616 178 839 132 118 83 173 100 219 587 302 145 137 269 350 164 215 254 67 545 126 156 343 9 3 353 423 410 629 433 769 1 660 1 289 917 451 990 950 495 789 855 334 2 072 476 469 1 236 27 5 355 736 743 813 989 742 1 232 1 951 1 683 1 091 618 1 783 1 509 959 1 459 1 565 378 3 018 649 993 2 404 79 83 12 13 26 13 41 15 18 14 22 10 17 28 12 36 12 16 22 0 43 115 4 242 4 907 4 850 6 521 4 446 6 009 12 845 8 903 5 688 3 757 10 140 10 245 5 505 9 872 10 138 2 688 19 710 4 871 7 287 15 625 736 45 59321 56332 73846 017 5 333 19 65630 749451 Effectifs marginaux Effectifs marginaux 202 100 Le tableau de données initial Exemple : Résultats du Baccalauréat 76 Les individus n’apparaissent qu’au travers de leurs effectifs La Basse-Normandie représente 4 446/202 100=2.20 % Le bac E représente 5 333/202 100=2.64 %

5 Méthodologie de calcul Dans une AFC, les lignes et les colonnes jouent le même rôle L’AFC consiste à considérer successivement les lignes et les colonnes comme les individus d’une ACP (les colonnes et les lignes étant successivement les variables) AFC = double ACP (sur les profils lignes et les profils colonnes)

6 Méthodologie de calcul Le nombre de valeurs propres est égal au minimum entre le nombre de lignes moins 1 et le nombre de colonnes moins 1 Min(n-1,m-1) = Min(22-1,8-1) = 7 Toutes les valeurs propres sont comprises entre 0 et 1

7 Méthodologie de calcul Le nombre de valeurs propres est égal au minimum entre le nombre de lignes moins 1 et le nombre de colonnes moins 1 Min(n-1,m-1) = Min(22-1,8-1) = 7 La somme des valeurs propres multipliée par le nombre d’individus est égale au  ² calculé du test du même nom. ~>  ² à (22-1)*(8-1)=147 ddl Pour  =5 %,  ²(147)=176.3

8 Méthodologie de calcul Identificateur Poids relatif Distance à l'origine Axe 1Axe 2Axe 1Axe 2Axe 1Axe 2 Ile-de-France 21.330.02635-0.14-0.0736.0122.400.770.21 Champagne-Ardennes 2.100.009440.060.030.640.490.390.13 Picardie 2.430.00510-0.030.020.200.180.200.07 Haute-Normandie 2.400.028080.07-0.021.000.260.180.02 Centre 3.230.002040.010.020.010.210.020.16 Basse-Normandie 2.200.012290.030.070.121.980.050.38 Bourgogne 2.970.046050.19-0.019.220.050.810.00 Nord-Pas de Calais 6.360.032370.13-0.089.157.510.540.19 Lorraine 4.410.049840.21-0.0416.201.200.890.03 Alsace 2.810.070610.24-0.0713.122.750.800.07 Franche-Comté 1.860.023850.130.042.600.540.710.06 Pays de la Loire 5.020.017750.070.082.185.880.300.35 Bretagne 5.070.00654-0.01-0.030.071.070.030.17 Poitou-Charentes 2.720.023670.060.140.729.670.130.78 Aquitaine 4.880.02126-0.040.120.7314.490.080.73 Midi-Pyrénées 5.020.00524-0.030.060.333.170.150.63 Limousin 1.330.016370.06-0.030.360.180.200.04 Rhône-Alpes 9.750.004340.03-0.030.532.090.150.26 Auvergne 2.410.00820-0.030.000.150.010.090.00 Languedoc-Roussillon 3.610.02008-0.120.083.964.230.660.31 Provence-Alpes-Côte d'Azur 7.730.00807-0.050.071.567.240.300.61 Corse0.360.32607-0.190.451.1214.410.110.63 CoordonnéesContributions Cosinus carrés

9 ABCDEFGH Ile-de-France | Corse 9 724 | 327 5 650 | 31 8 679 | 85 9 432 | 178 839 | 9 3 353 | 27 5 355 | 79 83 | 0 43 115 | 736 Effectifs marginaux 45 59321 56332 73846 017 5 333 19 65630 749451 Effectifs marginaux202 100 ABCDEFGH Total 22.56%10.67%16.20%22.77%2.64%9.73%15.21%0.22% Corse 44.43%4.21%11.55%24.18%1.22%3.67%10.73%0.00% 0.04780.00420.00220.0002 0.00370.00200.0000 Total 0.21200.03910.01330.00090.00760.03770.01320.00220.32607 Centre 22.73%10.23%15.64%23.54%2.65%9.65%15.17%0.40% 0.0000 0.00010.0000 Total 0.00000.0002 0.00030.0000 0.00140.00204 100202 59345 736 327 2256.0  4443.02256.0 2  Méthodologie de calcul Poids relatif Distance à l’origine %33.21 100202 11543 

10 0% 5% 10% 15% 20% 25% 30% 35% 40% 45% 50% ABCDEFGH TotalCorseCentre Méthodologie de calcul

11 Représentation graphique

12 Méthodologie de calcul Identificateur Poids relatif Distance à l'origine Ile-de-France 21.330.02635 Champagne-Ardennes 2.100.00944 Picardie 2.430.00510 Haute-Normandie 2.400.02808 Centre 3.230.00204 Basse-Normandie 2.200.01229 Bourgogne 2.970.04605 Nord-Pas de Calais 6.360.03237 Lorraine 4.410.04984 Alsace 2.810.07061 Franche-Comté 1.860.02385 Pays de la Loire 5.020.01775 Bretagne 5.070.00654 Poitou-Charentes 2.720.02367 Aquitaine 4.880.02126 Midi-Pyrénées 5.020.00524 Limousin 1.330.01637 Rhône-Alpes 9.750.00434 Auvergne 2.410.00820 Languedoc-Roussillon 3.610.02008 Provence-Alpes-Côte d'Azur 7.730.00807 Corse0.360.32607 Axe 1Axe 2 -0.14-0.07 0.060.03 -0.030.02 0.07-0.02 0.010.02 0.030.07 0.19-0.01 0.13-0.08 0.21-0.04 0.24-0.07 0.130.04 0.070.08 -0.01-0.03 0.060.14 -0.040.12 -0.030.06 -0.03 0.03-0.03 0.00 -0.120.08 -0.050.07 -0.190.45Coordonnées Axe 1Axe 2 36.0122.40 0.640.49 0.200.18 1.000.26 0.010.21 0.121.98 9.220.05 9.157.51 16.201.20 13.122.75 2.600.54 2.185.88 0.071.07 0.729.67 0.7314.49 0.333.17 0.360.18 0.532.09 0.150.01 3.964.23 1.567.24 1.1214.41Contributions Axe 1Axe 2 1.691.05 0.300.23 0.080.07 0.420.11 0.000.06 0.90 3.100.02 1.441.18 3.680.27 4.660.98 1.400.29 0.441.17 0.010.21 0.263.55 0.152.97 0.070.63 0.270.14 0.050.21 0.060.00 1.101.17 0.200.94 3.0739.56

13 Méthodologie de calcul Axe 1Axe 2 36.0122.40 0.640.49 0.200.18 1.000.26 0.010.21 0.121.98 9.220.05 9.157.51 16.201.20 13.122.75 2.600.54 2.185.88 0.071.07 0.729.67 0.7314.49 0.333.17 0.360.18 0.532.09 0.150.01 3.964.23 1.567.24 1.1214.41Contributions Axe 1Axe 2 0.770.21 0.390.13 0.200.07 0.180.02 0.16 0.050.38 0.810.00 0.540.19 0.890.03 0.800.07 0.710.06 0.300.35 0.030.17 0.130.78 0.080.73 0.150.63 0.200.04 0.150.26 0.090.00 0.660.31 0.300.61 0.110.63 Cosinus carrés 1/22=4.55 %

14 Méthodologie de calcul 1/8=12.5 %

15 Résultats sans la Corse Numéro Valeur propre Pourcentage cumulé 10.012058.71 20.004522.2580.96 30.00167.7488.70 40.00104.7693.46 50.00073.6497.09 60.00052.3499.43 70.00010.57100.00 Somme0.0204 Effectif 202100 Produit4124.07

16 Résultats sans la Corse 1/21=4.76 % 1/8=12.5 %

17 Représentation graphique sans la Corse


Télécharger ppt "Analyse Factorielle des Correspondances Généralisation de l’A.C.P. adaptée au traitement de données qualitatives se présentant sous la forme d’un tableau."

Présentations similaires


Annonces Google