La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

L ANALYSE MULTIDIMENSIONNELLE DES DONNEES Méthodes analytiques détude des tableaux de données de grande taille.

Présentations similaires


Présentation au sujet: "L ANALYSE MULTIDIMENSIONNELLE DES DONNEES Méthodes analytiques détude des tableaux de données de grande taille."— Transcription de la présentation:

1 L ANALYSE MULTIDIMENSIONNELLE DES DONNEES Méthodes analytiques détude des tableaux de données de grande taille

2 L analyse en composantes principales (ACP) L analyse factorielle des correspondances (AFC) L analyse des correspondances multiples (ACM) Les analyses typologiques

3 L analyse en composantes principales (ACP) Objectifs Nature des données

4 L analyse en composantes principales (ACP) G

5 0 A B 2 1 y2b y2a y1by1a d 2 (A,B) = (y1a-y1b) 2 + (y2a-y2b) 2 L analyse en composantes principales (ACP)

6 0 A B 2 1 y2b y2a y1by1a a b y1b 1 L analyse en composantes principales (ACP) d(A,B) = d(a,b) d(a,b) = y1b – y1a

7

8

9 L analyse factorielle des correspondances (AFC) Objectifs Nature des données

10 Tableau de contingence

11 Tableau disjonctif complet

12 Dimension 1 1,0,50,0-,5-1,0-1,5-2,0 Dimension Amérique Latine Moyen Orient Afrique Pacifique/Asie Europe de l'Est OCDE Tribal Taoïste Protest. Othodoxe Musulman Juif Hindou Catho. Bouddh. Animiste

13 L analyse des correspondances multiples (ACM) Objectifs Nature des données

14

15 Quantifications Dimension 1 2,01,51,0,50,0-,5-1,0-1,5 Dimension 2 1,5 1,0,5 0,0 -,5 -1,0 -1,5 -2,0 Tendance politique Est-ce ce que la mar ijuana doit être lég Pour ou contre la pe ine de mort ? Sexe du répondant Activité professionn elle Conservateur Plutôt Conservateur Modérée plutôt Libérale Libérale Non Oui Contre Pour Femme Homme Autre Au foyer Etudiant Retraité Sans emploi Travail temporaire Travail à temps partiel Travail à temps complet

16 Les analyses typologiques Objectifs Nature des données

17 Méthodes hiérarchiques L'algorithme de base est le suivant : 1. a-t-on plus d'un groupe (si non, on termine) 2. calculer les `ressemblances' entre toutes les paires de groupes. 3. fusionner les deux groupes montrant la plus grande ressemblance (similarité) ou la plus faible dissemblance (dissimilarité).

18 Technique du plus proche voisin Technique du voisin le plus éloigné

19 Méthodes non-hiérarchiques Initialisation 1 on choisit aléatoirement k (à préciser) groupes d'observations avec un nombre donné d'observations dans chaque groupe (disons n/k). Itération 2 on calcule le vecteur moyenne (centre) des k groupes. 3 on calcule pour chaque observation la distance au centre de chaque groupe et on calcule le critère de dispersion présent. Si la dispersion décroît, on continue, sinon on arrête lalgorithme. 4. on affecte chaque observation au groupe dont elle est le plus près; on obtient ainsi k nouveaux groupes et on retourne à létape 2.

20 2 groupes 5 groupes 3 groupes


Télécharger ppt "L ANALYSE MULTIDIMENSIONNELLE DES DONNEES Méthodes analytiques détude des tableaux de données de grande taille."

Présentations similaires


Annonces Google