Analyse en Composantes Principales

Slides:



Advertisements
Présentations similaires
CHAPITRE 7 DROITES ET SYSTEMES.
Advertisements

Corrélation Position du problème Définition covariance (X,Y) r =
Cours d‘Analyse de Données
ANALYSE GÉOMÉTRIQUE DES DONNÉES
Gestion de portefeuille Support n° 5 Catherine Bruneau
Gestion de portefeuille
Cours 7 Problèmes d’ordre 2 en temps : Analyse modale
Soizic Geslin Samy Fouilleux Minh Le Hoai Maxime Chambreuil
Formation en Analyse des Données
C1 Bio-statistiques F. KOHLER
Unité #1 Analyse numérique matricielle Giansalvo EXIN Cirrincione.
Unité #2 Analyse numérique matricielle Giansalvo EXIN Cirrincione.
1. Les caractéristiques de dispersion. 11. Utilité.
Piecewise Affine Registration of Biological Images
Statistiques à deux variables
Moyenne, écart type et incertitude de mesure.
Statistique et probabilités au collège
Régression -corrélation
Equilibre d’un solide Statique analytique.
Stabilité des systèmes linéaires continus
Analyse Factorielle des Correspondances
Analyse des proximités, des préférences et typologie
Travaux pratiques sous matlab / octave
Séminaire dAnalyses comparatives et enquête sociologique Séances 8 et 9 Lanalyse des résultats.
Analyse en Composante Principale (ACP)
Chapitre 2: Les régularités et les relations
ASI 3 Méthodes numériques pour l’ingénieur
Concepts avancés en mathématiques et informatique appliquées
Jessica Monhart Camille Pitteloud Supervisé par Micha Hersch.
La segmentation
Corrélation et régression linéaire simple
Séminaire d’Analyses comparatives et enquête sociologique
La corrélation et la régression multiple
Travaux pratiques sous matlab / octave
Quelques fonctions de base
RECONNAISSANCE DE FORMES
La fonction inversement proportionnelle
La régression multiple
l’algorithme du simplexe
Rappel... Diagonalisation. Transformations linéaires.
Mesures de position Ils s’expriment dans la même unité que les observations Moyenne et moyenne pondérée Exemple : on dispose du nombre moyen d’enfants.
Analyses typologiques
ASI 3 Méthodes numériques pour l’ingénieur
Rappel... Valeurs propres et vecteurs propres. Définitions;
Interprétation de la répartition des actifs européens par profession.
Cours 4: Analyse discriminante (AFD)
Présentation du marché obligataire
Sommaire Rappel introductif sur la définition de l’ACP
STATISTIQUES DESCRIPTIVES
Présentation de l’ACP à travers un exemple
ANALYSE EN COMPOSANTES PRINCIPALES (ACP)
Sériation et traitement de données archéologiques
Gestion budgétaire des ventes
Outils d’analyse: la méthode des moindres carrées
Analyse de données Cours 3 Analyse en composantes principales (ACP)
ETUDE DE 2 VARIABLES QUANTITATIVES
STATISTIQUES.
Les dangers des drogues
Analyse de données avec R
M. YAMANAKA – Cours de mathématiques. Classe de 4ème.
ACP visualisation Représentation graphique: projection dans un plan de n individus à p caractères Un individu est un point d’un espace à p dimensions.
Classification-Segmentation
Mesures de description des valeurs des variables
Introduction à l’analyse multidimensionnelle Master BOE LATLI Adrien
Introduction à l’analyse multidimensionnelle Master BOE LATLI Adrien
Analyse en Composantes Principales Vue synoptique.
Individus Illustratifs (Supplémentaires) Individus jugés « intrinsèquement différents » Individus jugés « atypiques » Exemple Exemple :classe différente,
Résumé de l’objectif de l’A.C.P.
Analyse en Composantes Principales
Transcription de la présentation:

Analyse en Composantes Principales ACP Analyse en Composantes Principales Méthode statistique descriptive permettant de résumer le maximum de l’information contenue dans un tableau de données constitué de n individus et p variables quantitatives.

ACP Tableau de données p variables métriques valeur de la variable j prise par l’individu i n individus

Illustration graphique de l’ACP 4 8 12 16 20 C B A M1 4 8 12 16 20 C B A M1 M2 M3 4 8 12 16 20 M1 M2

Le centre de gravité du nuage est le point « moyen » Il faut faire en sorte que la perte d’inertie soit la plus faible possible La dispersion du nuage se mesure en additionnant les carrés des distances entre les points du nuage et le centre de gravité Dispersion = Information = Inertie La projection fait baisser la dispersion

Comment choisir le bon espace de projection ? ACP Le bon « plan de coupe » ?

ACP Le principe de l’A.C.P. Les individus (ou les variables ) sont décrits dans un espace à « p (ou n) dimensions » (nombre de variables (ou d’individus)) 1 3 2 Trouver des espaces de dimensions « plus petites » afin d’y voir au mieux les individus

ACP Le principe de l’A.C.P. Comment définir les nouveaux axes ? On substitue aux variables initiales des « indices synthétiques » qui sont des combinaisons linéaires de ces variables initiales. Le premier axe (ou première composante principale) sera tel que la variance des individus (sur cet axe) soit maximale. Ä cet axe explique donc une certaine proportion de la variance totale des individus.

ACP Le principe de l’A.C.P. Comment définir les nouveaux axes ? Après la 1ère composante principale, on en recherche une 2ème qui doit avoir les propriétés suivantes : ? Avoir une corrélation nulle avec la première, ? Avoir, à son tour, la plus grande variance. Le processus se répète jusqu’à obtenir les p composantes (où p représente le nombre de variables initiales)

ACP L’A.C.P. permet de : Représenter les variables en fonction de leurs corrélations Représenter les individus en fonction de leurs « proximités » Comment se structurent les variables : ü quelles sont celles qui sont associées ? ü quelles sont celles qui ne le sont pas ? ü quelles sont celles qui vont dans le même sens ? ü quelles sont celles qui s’opposent ? Comment se répartissent les individus : ü quels sont ceux qui se ressemblent ? ü quels sont ceux qui sont dissemblables ?

Quels types de tableaux peut-on traiter avec l’A.C.P. ? Le principe de l’A.C.P. Quels types de tableaux peut-on traiter avec l’A.C.P. ? Tableau de mesures

Quels types de tableaux peut-on traiter avec l’A.C.P. ? Le principe de l’A.C.P. Quels types de tableaux peut-on traiter avec l’A.C.P. ? Tableau de notes

Quels types de tableaux peut-on traiter avec l’A.C.P. ? Le principe de l’A.C.P. Quels types de tableaux peut-on traiter avec l’A.C.P. ? Tableau de rangs

Exemple de tableau « hybride » ou « mixte » ACP Le principe de l’A.C.P. Exemple de tableau « hybride » ou « mixte » Mesures Rangs Notes Centrer-réduire Problème : ce sont les variables les plus dispersées qui engendrent les premières composantes.

ACP Le principe de l’A.C.P. Objectif : Variables Composantes Transformer p variables quantitatives initiales inter-corrélées en p nouvelles variables (composantes principales) non corrélées Variables Composantes

ACP Le principe de l’A.C.P. Coefficients des combinaisons linéaires des p variables initiales Variances des individus sur les composantes principales correspondantes

ACP Le principe de l’A.C.P. Méthode : Diagonalisation Matrice des corrélations (ou var/cov) æ è ç ö ø ÷ Matrice des vecteurs propres Matrice « diagonale » des valeurs propres Diagonalisation

Présentation de l’exemple ACP Présentation de l’exemple /40

Présentation de l’exemple ACP Présentation de l’exemple

Description des calculs et commentaires ACP Description des calculs et commentaires Interprétation des valeurs propres Exemple : A.C.P. sur données centrées-réduites " variable Ø variance = 1 Part de l’information ini- tiale restituée par l’axe i S variance = nombre de variables

Description des calculs et commentaires ACP Description des calculs et commentaires

Description des calculs et commentaires ACP Description des calculs et commentaires

Description des calculs et commentaires ACP Description des calculs et commentaires

Description des calculs et commentaires ACP Description des calculs et commentaires Ind1 + Ind2 - Ind3 + Ind4 - Ind5 - Ind6 - Ind7 + Ind8 - Ind9 + Ind10 - -3.00 -2.50 -2.00 -1.50 -1.00 -0.50 0.00 0.50 1.00 1.50 2.00 2.50

Description des calculs et commentaires ACP Description des calculs et commentaires

Description des calculs et commentaires ACP Description des calculs et commentaires

Description des calculs et commentaires ACP Description des calculs et commentaires f1 et f2 paraissent proches alors que e1 et e2 ne le sont pas