La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

1 Analyse Factorielle des Correspondances multiples et Classification Ascendante Hiérarchique Michel Tenenhaus.

Présentations similaires


Présentation au sujet: "1 Analyse Factorielle des Correspondances multiples et Classification Ascendante Hiérarchique Michel Tenenhaus."— Transcription de la présentation:

1 1 Analyse Factorielle des Correspondances multiples et Classification Ascendante Hiérarchique Michel Tenenhaus

2 2 1.Les données

3 3 2.Le tableau de Burt

4 4 3.Le tableau des khi-deux Les niveaux de signification sont entre parenthèses. Rouge = liaison significative Bleu = liaison non significative

5 5 4.Le tableau disjonctif complet x ijl = 1 si lindividu i possède la modalité l de la variable j = 0 sinon

6 6 5. Analyse Factorielle des Correspondances Multiples ANALYSE FACTORIELLE DES CORRESPONDANCES MULTIPLES DES VARIABLES x 1, x 2, …, x m = ANALYSE FACTORIELLE DES CORRESPONDANCES DU TABLEAU DISJONCTIF COMPLET

7 7 Visualisation des données * i 0 F 1 (i) F 2 (i) Carte des individus jl 0 G 1 (jl) G 2 (jl) Carte des modalités G 1 (11) …G 1 (mp m ) G1G1 G 2 (11) …G 2 (mp m ) G2G2 Tableau disjonctif complet

8 8 Notations Les données -n individus -m variables qualitatives x 1, …, x m -la variable x j a p j modalités {j1, j2, …, jp j } -p = p 1 + p 2 + … + p m -la modalité jl a une fréquence absolue n jl et une fréquence relative n jl /n m dans le tableau disjonctif complet. Application -n = 27 chiens -m = 6 variables (Fonction en supplémentaire) -p = 16 = somme des modalités des variables actives

9 9 Le nuage de points associés aux profils-lignes Taille- Agressivité+ Taille *f J * Chihuahua * Cocker * Mastiff

10 10 Résultats Inertie totale : Dimension du nuage de points : p - m Moyenne des valeurs propres : On retient les axes associés à des valeurs propres supérieures à 1/m.

11 11 Résultats VALEURS PROPRES INERTIE TOTALE | NUMERO | VALEUR | POURCENT.| POURCENT.| | | PROPRE | | CUMULE | | 1 | | | | | 2 | | | | | 3 | | | | | 4 | | 9.45 | | | 5 | | 9.01 | | | 6 | | 7.40 | | | 7 | | 4.89 | | | 8 | | 2.74 | | | 9 | | 1.41 | | | 10 | | 0.46 | | Il y a 3 valeurs propres supérieures à 1/m = 1/6 =.16667

12 12 Résultats COORDONNEES, CONTRIBUTIONS ET COSINUS CARRES DES INDIVIDUS AXES 1 A | INDIVIDUS | COORDONNEES | CONTRIBUTIONS | COSINUS CARRES | | | | IDENTIFICATEUR P.REL DISTO | | | | | beauceron | | | | | basset | | | | | berger allemand | | | | | boxer | | | | | bull-dog | | | | | bull-mastiff | | | | | caniche | | | | | chihuahua | | | | | cocker | | | | | colley | | | | | dalmatien | | | | | doberman | | | | | dogue allemand | | | | | epagneul breton | | | | | epagneul français | | | | | fox-hound | | | | | fox-terrier | | | | | grand bleu de gascogne | | | | | labrador | | | | | levrier | | | | | mastiff | | | | | pékinois | | | | | pointer | | | | | saint-bernard | | | | | setter | | | | | teckel | | | | | terre-neuve | | | |

13 13 Contribution des individus à la construction des axes Variance de F h : Contribution de lindividu i à la construction de laxe h :

14 14 Contribution des modalités à la construction des axes Variance de G h : Contribution de la modalité jl à la construction de laxe h :

15 15 Résultats COORDONNEES, CONTRIBUTIONS ET COSINUS CARRES DES MODALITES ACTIVES AXES 1 A | MODALITES | COORDONNEES | CONTRIBUTIONS | COSINUS CARRES | | | | LIBELLE P.REL DISTO | | | | | 1. Taille | | ta | | | | | ta | | | | | ta | | | | CONTRIBUTION CUMULEE = | 2. Poids | | po | | | | | po | | | | | po | | | | CONTRIBUTION CUMULEE = | 3. Vélocité | | v | | | | | v | | | | | v | | | | CONTRIBUTION CUMULEE = | 4. Intelligence | | int | | | | | int | | | | | int | | | | CONTRIBUTION CUMULEE = | 5. Affection | | af | | | | | af | | | | CONTRIBUTION CUMULEE = | 6. Aggressivité | | ag | | | | | ag | | | | CONTRIBUTION CUMULEE =

16 16 Résultats (modalités actives) COORDONNEES ET VALEURS-TEST DES MODALITES AXES 1 A | MODALITES | VALEURS-TEST | | | | | LIBELLE | | | 1. Taille | | ta- | | | ta+ | | | ta++ | | | 2. Poids | | po- | | | po+ | | | po++ | | | 3. Vélocité | | v- | | | v+ | | | v++ | | | 4. Intelligence | | int- | | | int+ | | | int++ | | | 5. Affection | | af- | | | af+ | | | 6. Aggressivité | | ag- | | | ag+ | | Une modalité jl a une position sur laxe h significativement différente du centre de gravité 0 si la valeur-test est supérieur à 2 en valeur absolue.

17 17 Résultats (modalités illustratives) COORDONNEES ET VALEURS-TEST DES MODALITES AXES 1 A | MODALITES | VALEURS-TEST | COORDONNEES | | | | | | | | LIBELLE EFF. | | | DISTO. | | 7. Fonction | | compagnie 10 | | | 1.70 | | chasse 9 | | | 2.00 | | utilité 8 | | | 2.38 | Pourquoi la chasse nest-elle pas significative ?

18 18 Carte des individus Mettre la fonction en couleur

19 19 Carte des modalités

20 20 Carte des modalités (avec contributions et trajectoires)

21 21 Lien entre les deux analyses : les relations de transition A près, chaque individu est représenté au milieu de ses caractéristiques : A près, chaque modalité est représentée au milieu de ses caractéristiques : Conséquence : La représentation graphique des modalités dune variable est centrée ( ).

22 22 Représentation simultanée des individus et des modalités (Représentation pseudo-barycentrique) Mettre la fonction en couleur

23 23 Représentation des modalités au milieu des individus (Représentation barycentrique)

24 24 Représentation dun individu supplémentaire Le Porcelaine On ignore lorigine du nom de ce très beau chien courant de petite vénerie. Il est fort probable quil le doit à la délicatesse et à lélégance de sa robe blanche tachée dorange clair. Descendant des chiens blancs du roy, qui constituèrent en grande partie les meutes royales de François 1 er à Louis XV, il fut croisé au XIX e siècle avec plusieurs races françaises (Céris, Montemboeuf, Billy). Son élégance cache beaucoup dardeur et dendurance et son odorat très fin en fait un chien de lièvre très apprécié. Club du Porcelaine : Président : M. Frappier, Château de la Touche, Queaux, L Isle-Jourdain Taille : 55 à 58 cm, Poids : 25 à 30 kg

25 25 Le Porcelaine

26 26 6.Classification ascendante hiérarchique (Méthode de Ward) F1F1 F2F2 F p-m ** * * * * g2g2 ** * * * * g1g1 ** * * * * g3g3 ** * * * Distance de Ward : D(G i, G j ) = * * * * * * * * * *

27 27 Classification Ascendante Hiérarchique Etape initiale Chaque individu forme une classe. On regroupe les deux individus les plus proches. Etape courante A chaque étape, on regroupe les deux classes G i et G j minimisant le critère de Ward D(G i, G j ).

28 28 Décomposition de linertie totale * * * * F1F1 F2F2 F p-m * * * * g2g2 ** * * * * g1g1 ** * * * * g3g3 * * * * g Inertie totale = (p/m)-1 Inertie inter-classesInertie intra-classes =+

29 29 Inertie inter-classes et critère de Ward Dans SPAD Critère de Ward = Indice G2G2 Toute la population G1G1 G3G3 G4G4 G5G5 G6G6 D(G 1,G 2 ) D(G 3,G 4 ) D(G 5,G 6 ) - Inertie expliquée par la typologie G 1, G 2 = D(G 1,G 2 ) - Inertie expliquée par la typologie G 1, G 5, G 6 = D(G 1,G 2 ) + D(G 5,G 6 ) - Inertie expliquée par la typologie G 3, G 4, G 5, G 6 = D(G 1,G 2 ) + D(G 5,G 6 ) + D(G 3,G 4 )

30 30 Qualité de la typologie en K classes Le critère de Ward cumulé sur les K-1 dernières étapes représente linertie inter-classes de la typologie en K classes. La qualité de la typologie est mesurée par la part dinertie totale expliquée par la typologie.

31 31 CAH sur les dix composantes principales CLASSIFICATION HIERARCHIQUE (VOISINS RECIPROQUES) SUR LES 10 PREMIERS AXES FACTORIELS DESCRIPTION DES NOEUDS NUM. AINE BENJ EFF. POIDS INDICE HISTOGRAMME DES INDICES DE NIVEAU * * * * ** ** ** *** *** *** **** **** ***** ***** ****** ****** ******* ******* ******** ********* ********** ************ ************** ************************ ******************************* ****************************************************************** SOMME DES INDICES DE NIVEAU =

32 32 DENDROGRAMME (% d inertie expliquée) beau | coll -----* | sett | | | epag *-----* | levr | | | fox *---+ | | | gran * *-+ | poin | | | berg | | | | | dobe -----*-* * | dogu | | | mast * | | | bull | | | | | terr | | | | | | | sain -----*---*----* * | cock | | | epag | | | | | boxe | | | | | | | labr --+ | | | | | | | | | dalm --*---*---* * | | | fox | | | | | cani * | | | | | teck --+ | | | | | | | bull --* | | | | | | | bass | | | | | | | | | péki --+ | | | | | | | | | | | chih --* *--* * * *

33 33 Étude de la typologie en 4 classes DECOMPOSITION DE L'INERTIE CALCULEE SUR 10 AXES | INERTIES |INERTIES |EFFECTIFS | DISTANCES | | | | | | | INTER-CLASSES | | | | | | | | | | INTRA-CLASSE | | | | | | | | | | CLASSE 1 / 4 | | 10 | | | CLASSE 2 / 4 | | 5 | | | CLASSE 3 / 4 | | 5 | | | CLASSE 4 / 4 | | 7 | | | | | | | | TOTALE | | | | QUOTIENT (INERTIE INTER / INERTIE TOTALE) :

34 34 Visualisation de la typologie dans le premier plan principal

35 35

36 36

37 37 Description des classes : les parangons PARANGONS CLASSE 1/ 4 EFFECTIF: |RG | DISTANCE | IDENT. | | 1| |setter | CLASSE 2/ 4 EFFECTIF: |RG | DISTANCE | IDENT. | | 1| |saint-bernard | CLASSE 3/ 4 EFFECTIF: |RG | DISTANCE | IDENT. | | 1| |dalmatien | CLASSE 4/ 4 EFFECTIF: |RG | DISTANCE | IDENT. | | 1| |bull-dog |

38 38 Description des classes : les khi-deux entre les variables et la typologie | VARIABLE | KHI-2 | DEG.LIB | SIG | | Taille | | 6 | | | Poids | | 6 | | | Vélocité | | 6 | | | Fonction | | 6 | | | Affection | | 3 | | | Agressivité | 3.25 | 3 | | | intelligence | 3.87 | 6 | |

39 39 Tableaux de contingence croisant la Taille et le Poids avec la typologie CROISEMENT DE LA PARTITION AVEC LA TAILLE | EFFECTIF | CL1 | CL2 | CL3 | CL4 | | ta- | 0 | 0 | 0 | 7 | | ta+ | 0 | 0 | 5 | 0 | | ta++ | 10 | 5 | 0 | 0 | CROISEMENT DE LA PARTITION AVEC LE POIDS | EFFECTIF | CL1 | CL2 | CL3 | CL4 | | po- | 0 | 0 | 1 | 7 | | po+ | 10 | 0 | 4 | 0 | | po++ | 0 | 5 | 0 | 0 |

40 40 Description de la typologie à laide de la Taille et du Poids Taille Petite Moyenne Grande Poids Moyen Grand Classe 4Classe 3 Classe 1Classe 2

41 41 Description de la typologie à laide des variables CLASSE 1 / POURC MODALITES MOD/CLA CARACTERISTIQUES DE LA VARIABLE LA CLASSE : CLASSE 1 / 4 CONTIENT % de po+ Poids 100.0% de ta++ Taille 80.0% de v++ Vélocité 70.0% de af- Affection 60.0% de chasse Fonction 50.0% de ag- Agressivité 50.0% de ag+ Agressivité CLASSE 3 / POURC MODALITES MOD/CLA CARACTERISTIQUES DE LA VARIABLE LA CLASSE : CLASSE 3 / 4 CONTIENT % de ta+ Taille 100.0% de af+ Affection 80.0% de po+ Poids 80.0% de int+ Intelligence 80.0% de v+ Vélocité 60.0% de compagnie Fonction 60.0% de ag- Agressivité CLASSE 2 / POURC MODALITES MOD/CLA CARACTERISTIQUES DE LA VARIABLE LA CLASSE : CLASSE 2 / 4 CONTIENT % de utilité Fonction 100.0% de ta++ Taille 100.0% de af- Affection 100.0% de po++ Poids 80.0% de v- Vélocité 80.0% de ag+ Agressivité CLASSE 4 / POURC MODALITES MOD/CLA CARACTERISTIQUES DE LA VARIABLE LA CLASSE : CLASSE 4 / 4 CONTIENT % de po- Poids 100.0% de ta- Taille 85.7% de compagnie Fonction 85.7% de af+ Affection 71.4% de ag- Agressivité 71.4% de v- Vélocité


Télécharger ppt "1 Analyse Factorielle des Correspondances multiples et Classification Ascendante Hiérarchique Michel Tenenhaus."

Présentations similaires


Annonces Google