La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Analyses typologiques But : Classer en groupes (les plus homogènes possibles) des unités statistiques en partant d’un ensemble de variables. Supposition.

Présentations similaires


Présentation au sujet: "Analyses typologiques But : Classer en groupes (les plus homogènes possibles) des unités statistiques en partant d’un ensemble de variables. Supposition."— Transcription de la présentation:

1 Analyses typologiques But : Classer en groupes (les plus homogènes possibles) des unités statistiques en partant d’un ensemble de variables. Supposition préalable : Les regroupements existent ou peuvent exister. Deux grands types de méthodes typologiques : Méthodes non-hiérarchiques Méthodes hiérarchiques Remarque : La typologie, une fois constituée, peut devenir un nouveau critère de description et/ou d’analyse.

2 La Classification Hiérarchique Méthode « descendante »Méthode « ascendante » Les différents regroupements peuvent être représentés graphiquement à l’aide d’un dendrogramme. Représenter les individus par un ensemble de parties hiérarchiquement emboîtées. Des individus au groupe Du groupe aux individus

3 Classification Hiérarchique Méthode « descendante » Méthode « ascendante »

4 Classification Hiérarchique Méthode « ascendante » Etape n°1 Etape n°2Etape n°3 Etape n°4 Etape n°5

5 Classification Hiérarchique Remarque :  le nombre d’individus doit au moins être deux fois supérieur au nombre de variables. On ne définit pas a priori le nombre de classesUtilisation du dendrogramme

6 Exemple élémentaire Cinq points dans un plan I intra = 0 Distances euclidiennes Regroupement : 1 et 3 Nouvel individu 6 6 I intra = 1

7 Regroupement 2 et 5 Distances euclidiennes Regroupement : 2 et 5 Nouvel individu I intra = 0I intra = 2

8 Regroupement 4 et 6 Distances euclidiennes Regroupement : 4 et 6 Nouvel individu I intra = 2I intra = 6 8

9 Regroupement 7 et 8 et dendrogramme I intra = 6I intra =

10 INERTIE TOTALE = INERTIE INTER + INERTIE INTRA Si on regroupe x (de poids m) et x’ (de poids m’) en y = Contribution du couple x x’ à l’inertie Contribution de y à l’inertie

11 4 individus : A B C D 4 variables : V1 V2 V3 V4 V1V2V3V4 A B16761 C D POINTS dans un espace de dimension 4 Coordonnées du centre de gravité du nuage : Inertie totale : Carré de la distance entre A et B :188 9,5 8, ² + 3² + 7² + 3² Perte d’inertie consécutive au regroupement de A et B : 94 Poids de A Poids de B EXEMPLE 4,5²+1,5²+2²+1² 6,5²+1,5²+5²+4² 1,5²+6,5²+3²+2² 0,5²+6,5²+0²+7²

12 DISTANCESABCD A B C D PERTES D’INERTIE ABCD A B C D On regroupe A et C en une classe notée E de poids 2

13 V1V2V3V4 A B16761 C D E : 6,5 12,5 13,5 3,5 DISTANCESBDE B D E PERTESBDE B D E F : 12,5 4,5 8,5 6,5 Carré de la distance entre E et F : 134 On regroupe E et F en G Perte d’inertie : 134

14

15 CLASSIFICATION NON HIERARCHIQUE Méthode des « nuées dynamiques » Agrégation autour de centres mobiles Dans cette méthode, on définit au préalable le nombre de classes qu’on veut obtenir dans la partition finale EXEMPLE6 individus (ABCDEF) et 2 variables ABCDEF Var Var On décide d’une partition en 2 classes CF On choisit au hasard les deux premiers « centres » : C et F

16 ABCDEF Var Var Carré de la distance à C Carré de la distance à F Centre le + proche A B C D E F C C C C F F ABCE DF Poids :4 Poids :2 G 1 : 4,5 3,5 G 2 : 8,5 6,5 Carré de la distance à G 1 Carré de la distance à G 2 12,5 4,5 24,5 12,5 26,5 72,5 50,5 8,5 0,5 2,5 0,5 G1G1G1G1 G1G1G1G1 G1G1G1G1 G2G2G2G2 G2G2G2G2 G2G2G2G2 Centres initiaux : C et F ABCPoids :3G’ 1 DEFPoids :3G’ 2 Et ainsi de suite…


Télécharger ppt "Analyses typologiques But : Classer en groupes (les plus homogènes possibles) des unités statistiques en partant d’un ensemble de variables. Supposition."

Présentations similaires


Annonces Google