La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Analyses typologiques But : Classer en groupes (les plus homogènes possibles) des unités statistiques en partant d’un ensemble de variables. Supposition.

Présentations similaires


Présentation au sujet: "Analyses typologiques But : Classer en groupes (les plus homogènes possibles) des unités statistiques en partant d’un ensemble de variables. Supposition."— Transcription de la présentation:

1 Analyses typologiques But : Classer en groupes (les plus homogènes possibles) des unités statistiques en partant d’un ensemble de variables. Supposition préalable : Les regroupements existent ou peuvent exister. Deux grands types de méthodes typologiques : Méthodes non-hiérarchiques Méthodes hiérarchiques Remarque : La typologie, une fois constituée, peut devenir un nouveau critère de description et/ou d’analyse.

2 La Classification Hiérarchique Méthode « descendante »Méthode « ascendante » Les différents regroupements peuvent être représentés graphiquement à l’aide d’un dendrogramme. Représenter les individus par un ensemble de parties hiérarchiquement emboîtées. Des individus au groupe Du groupe aux individus

3 Classification Hiérarchique Méthode « descendante » Méthode « ascendante »

4 Classification Hiérarchique Méthode « ascendante » 1 3 4 2 5 1 3 4 2 5 1 3 4 2 5 1 3 4 2 5 1 3 4 2 5 Etape n°1 Etape n°2Etape n°3 Etape n°4 Etape n°5

5 Classification Hiérarchique Remarque :  le nombre d’individus doit au moins être deux fois supérieur au nombre de variables. On ne définit pas a priori le nombre de classesUtilisation du dendrogramme

6 Exemple élémentaire 12 3 4 5 Cinq points dans un plan I intra = 0 Distances euclidiennes Regroupement : 1 et 3 Nouvel individu 6 6 I intra = 1

7 Regroupement 2 et 5 Distances euclidiennes Regroupement : 2 et 5 Nouvel individu 7 12 3 4 5 67 I intra = 0I intra = 2

8 Regroupement 4 et 6 Distances euclidiennes Regroupement : 4 et 6 Nouvel individu 8 12 3 4 5 67 I intra = 2I intra = 6 8

9 Regroupement 7 et 8 et dendrogramme 12 3 4 5 67 I intra = 6I intra = 13 8 1 3 4 2 5 6 7 8 9 1 2 6 13

10 INERTIE TOTALE = INERTIE INTER + INERTIE INTRA Si on regroupe x (de poids m) et x’ (de poids m’) en y = Contribution du couple x x’ à l’inertie Contribution de y à l’inertie

11 4 individus : A B C D 4 variables : V1 V2 V3 V4 V1V2V3V4 A510134 B16761 C815143 D921112 4 POINTS dans un espace de dimension 4 Coordonnées du centre de gravité du nuage : Inertie totale : Carré de la distance entre A et B :188 9,5 8,5 11 5 262 11² + 3² + 7² + 3² Perte d’inertie consécutive au regroupement de A et B : 94 Poids de A Poids de B EXEMPLE 4,5²+1,5²+2²+1² 6,5²+1,5²+5²+4² 1,5²+6,5²+3²+2² 0,5²+6,5²+0²+7²

12 DISTANCESABCD A018836148 B1880196220 C361960260 D1482202600 PERTES D’INERTIE ABCD A0941874 B94098110 C18980130 D741101300 On regroupe A et C en une classe notée E de poids 2

13 V1V2V3V4 A510134 B16761 C815143 D921112 E : 6,5 12,5 13,5 3,5 DISTANCESBDE B0220183 D2200195 E1831950 PERTESBDE B0110122 D1100130 E1221300 F : 12,5 4,5 8,5 6,5 Carré de la distance entre E et F : 134 On regroupe E et F en G Perte d’inertie : 134

14 18 110134 92 24 1 2 3

15 CLASSIFICATION NON HIERARCHIQUE Méthode des « nuées dynamiques » Agrégation autour de centres mobiles Dans cette méthode, on définit au préalable le nombre de classes qu’on veut obtenir dans la partition finale EXEMPLE6 individus (ABCDEF) et 2 variables ABCDEF Var 1236879 Var 2125766 2 On décide d’une partition en 2 classes CF On choisit au hasard les deux premiers « centres » : C et F

16 ABCDEF Var 1236879 Var 2125766 Carré de la distance à C Carré de la distance à F Centre le + proche A B C D E F 32 18 0 8 2 10 74 52 10 2 4 0 C C C C F F ABCE DF Poids :4 Poids :2 G 1 : 4,5 3,5 G 2 : 8,5 6,5 Carré de la distance à G 1 Carré de la distance à G 2 12,5 4,5 24,5 12,5 26,5 72,5 50,5 8,5 0,5 2,5 0,5 G1G1G1G1 G1G1G1G1 G1G1G1G1 G2G2G2G2 G2G2G2G2 G2G2G2G2 Centres initiaux : C et F ABCPoids :3G’ 1 DEFPoids :3G’ 2 Et ainsi de suite…


Télécharger ppt "Analyses typologiques But : Classer en groupes (les plus homogènes possibles) des unités statistiques en partant d’un ensemble de variables. Supposition."

Présentations similaires


Annonces Google