La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

1 Les classifications hiérarchiques. 2 Cest un ensemble de méthodes qui permettent de classer des individus, des modalités, des variables… en divers groupes.

Présentations similaires


Présentation au sujet: "1 Les classifications hiérarchiques. 2 Cest un ensemble de méthodes qui permettent de classer des individus, des modalités, des variables… en divers groupes."— Transcription de la présentation:

1 1 Les classifications hiérarchiques

2 2 Cest un ensemble de méthodes qui permettent de classer des individus, des modalités, des variables… en divers groupes que lon souhaitera homogènes pour les variables que lon soumet à lanalyse. Chacune de ces méthodes conduit à la réalisation dun arbre hiérarchique à partir duquel lanalyste décidera du nombre de groupes à constituer. Le processus de classification est itératif. Il est construit dune part sur les distances entre individus et dautre part entre groupes dindividus.

3 3 La proximité entre individus est donnée par des distances telle que la distance euclidienne, du khi- deux, de Hamming, ou de Jaccard… La proximité entre groupes est une notion plus générale. Elle peut être mesurée par des distances dites ultramétriques dont les principales sont données ci-après.

4 4 Groupe 1 de taille N 1 x i ° Groupe 2 de taille N 2 ° y j d( x i, y j ) d est une distance calculée entre les individus du groupe 1 et les individus du groupe 2. A partir de là on définit une distance ultramétrique que lon choisie parmi les plus usuelles en fonction du problème que lon souhaite traiter:

5 5 la distance du saut minimal: le diamètre de la réunion:

6 6 la distance moyenne; la distance de Ward

7 7 Le processus de classification hiérarchique est itératif, et à chaque niveau de la hiérarchie, on cherche les groupes les plus proches que lon agrège; on calcule les nouvelles distances entre les divers groupes nouvellement constitués. Le processus est terminé lorsquétant parti du niveau 0 de la hiérarchie où chaque individu est à lui seul un groupe, on arrive à un seul groupe constitué de tous les individus.

8 8 Présentation sur un exemple. On dispose du tableau des distances suivant, concernant 5 individus. Distances ,50

9 9 Niveau 0 = {chaque individu constitue un groupe} Les distances entre groupes sont données. On regroupe les groupes 4 et 5 parce quils sont les plus proches. La calcul des distances ultramétriques du saut minimal est donné dans le tableau suivant: didi 123{4, 5}

10 10 Au niveau 1 de la hiérarchie, on met ensemble les groupes 2 et {4, 5}, qui sont les plus proches à une distance de 1. On calcule les proximités des groupes nouvellement constitués. didi 1{2, 4, 5}

11 11 Au niveau 2 de la hiérarchie, on met ensemble les groupes 3 et {2, 4, 5}, qui sont les plus proches à une distance de 2. On calcule les proximités des groupes nouvellement constitués. didi 1{3, 2, 4, 5} Au niveau 3 de la hiérarchie, on met ensemble les groupes 2 et {2, 3, 4, 5}, qui sont les plus proches à une distance de 3. Tout le monde est affecté.

12 12 Le déroulement de la méthode peut être représenté de la manière suivante: Distances ultramétriques ,5 0 Une coupure de larbre à 1, 5 permet de constituer 3 groupes: Groupe 1 = {2, 4, 5} Groupe 2 = {3} Groupe 3 = {1}

13 13 Si lon change la distance ultramétrique, on change la classification , Une coupure de larbre hièrarchique à 3,5 permet didentifier trois groupes: Groupe 1 = {4, 5} Groupe 2 = {1, 2} Groupe 3 ={3}

14 14 Exercice Le tableau suivant représente les réponses données par des opérateurs logistiques à un questionnaire concernant la qualité. Lévaluation globale est mesurée sur une échelle de valeurs comprises entre 1 et 10 (1 signifie que le service rendu nest absolument pas de qualité et 10 signifie que le service est jugé de très bonne qualité. ). La variable associée est notée X. Les variables explicatives retenues sont définies par une notation entre 1 et 4 à chacune des affirmations suivantes (1 signifie que lon nest pas du tout daccord avec cette affirmation et 4 que lon est parfaitement daccord.) : A :Compréhension rapide des besoins exprimés par le client. B :Bonne qualité des services. C :Gamme de services suffisamment large. D :Service après vente efficace. Notons X1, X2, X3, X4, les variables associées.

15 15 Variablesindividu 1. individu 2. individu 3. individu 4. individu 5. individu 6. X X1X X2X X3X X4X

16 16 On calcule les moyennes et écart-types; on centre et on réduit. On détermine les tableau de distances. Puis on lance la classification. Ind1Ind 2Ind 3Ind 4Ind 5Ind 6 Ind103,573,612,363,581,56 Ind 200,932,401,473,86 Ind 303,040,754,15 Ind 403,312,07 Ind 504,19 Ind 60


Télécharger ppt "1 Les classifications hiérarchiques. 2 Cest un ensemble de méthodes qui permettent de classer des individus, des modalités, des variables… en divers groupes."

Présentations similaires


Annonces Google