ACP Analyse en Composantes Principales

Slides:



Advertisements
Présentations similaires
Soizic Geslin Samy Fouilleux Minh Le Hoai Maxime Chambreuil
Advertisements

Catalog fonctionne sur vos données Catalog est préconfiguré pour fonctionner directement avec les données – WinBooks Accounting – WinBooks Logistics –
Visualisation dynamique d'arbres hiérarchiques de très grande taille Par Rémi Fusade TER encadré par Thomas Hurtut et Thierry Stein.
L'image: Le codage des images BacPro SEN Lycée Condorcet.
Nouveaux programmes de Seconde Géométrie dans le plan et dans l'espace.
1- Introduction 1ère partie Le langage SQL 2- Connexion 3- Structure & Contenu 4- Requêtes.
Organisation, gestion de données Les connaissances que l'enseignant doit maîtriser à son niveau Présentation réalisée à partir de l'ouvrage de Roland Charnay.
Utilisation du logiciel EduStat © Analyse classique d’items L’examen du rapport.
SITUATION DE REFERENCE
Suites ordonnées ou mettre de l’ordre
Les Observations.
Thème 3 – La résistance au mouvement des charges
Chapitre 1 Généralités sur les données
Les tableaux différencier les variables simples des variables indicées (ordonnées et numérotées) un identificateur unique désigne un ensemble, une collection.
I- ANALYSE DU BESOIN / Plan
Analyse, Classification,Indexation des Données ACID
Pierre Joli Cours de Mathématique Pierre Joli
Comprendre, classer et analyser les problèmes multiplicatifs
Les distributions en classes
Chapitre 1 nombres, chaînes de caractères, booléens, et VARIABLES
1. La moyenne arithmétique ( )
Chapitre 1 Généralités sur les données
Loi Normale (Laplace-Gauss)
Résumé de l’objectif de l’A.C.P.
7.1 Transformation linéaire
Dimitri Zuchowski et Marc-Élie Lapointe
2.1. Présentation de l’exemple
Analyse en Composantes Principales A.C.P. M. Rehailia Laboratoire de Mathématiques de l’Université de Saint Etienne (LaMUSE).
Fonctions affines.
Projet Analyse numérique – 2
Session 1 31 mai 2017 Plateforme ICONICS Justine Guégan
DESSIN TECHNIQUE Té de dessin Collège technique Sousse Collège technique Sousse.
Coefficient de corrélation linéaire
POL1803: Analyse des techniques quantitatives
Plans d’experiences : plans de melanges
Quelques méthodes de traitement des tableaux multiblocs
Analyse en Composantes Principales
Exploitation de mesures scientifiques.
MOYENNE, MEDIANE et ECART TYPE d’une série statistique
Scénario Quatre hipsters entrent en collision un dans l'autre dans un ascenseur plein de personnes. En conséquence ils laissent tomber leurs téléphones.
République Algérienne Démocratique et Populaire Ministère de l'Enseignement Supérieur et de la Recherche Scientifique Université Saad.
Cours N°9: Algorithmiques Les Tableaux 1
La méthode du simplexe. 1) Algorithme du simplexe  Cet algorithme permet de déterminer la solution optimale, si elle existe, d’un problème de programmation.
Cours N°10: Algorithmiques Tableaux - Matrices
METHODE DES CHAÎNONS Méthode permettant d’implanter des postes de travail dans les usines ou entrepôts. Optimisation recherchée Gain sur le temps de fabrication.
Calcul Scientifique Initiation à SCILB
Statistiques. Moyenne, Moyenne pondérée, Tableur et graphiques.
Calculs des incertitudes Lundi 30 Avril 2018 Master de Management de la Qualité, de la Sécurité et de l’Environnement.
Royaume de Maroc Université Hassan Premier Settat Faculté des Sciences et Techniques de Settat LA CLASSIFICATION K-MEANS SOUS R /MATLAB Master :Automatique.
Programme financé par l’Union européenne
Statistiques.
Analyse des Données M.H. ZAIEM.
Comment personnaliser Microsoft SharePoint Site web
P LAMBOLEZ Partie maths V GILLOT Partie anglais
2.4 La loi de vitesse d’une réaction chimique
Les Gratte-ciel.
L’ANALYSE DES DONNEES Samuel MAYOL S. Mayol - L’analyse des données.
Formation MATLAB PRÉSENTER PAR : BOUKHIRA NASREDDINE.
Janvier 2019 IA-IPR Physique-Chimie
Information, Calcul, Communication
Les erreurs de mesure Projet d’Appui au renforcement des capacités
METHODE DES CHAÎNONS Méthode permettant d’implanter des postes de travail dans les usines ou entrepôts. Optimisation recherchée Gain sur le temps de fabrication.
Programme d’appui à la gestion publique et aux statistiques
Conception cartographique
PROGRAMMATION SCIENTIFIQUE EN C
Utiliser le modèle log-linéaire pour mettre au jour la structure du lien entre les deux variables d’un tableau de contingence : un exemple d’application.
Des chiffres pour être compris
Package JADE : Analyse en composantes principales (ACI)
Type Tableau Partie 1 : Vecteurs
STATISTIQUE INFERENTIELLE LES TESTS STATISTIQUES.
Transcription de la présentation:

ACP Analyse en Composantes Principales 19/09/2018 Groupe TT6 - KikiTeam

Description multidimensionnelle de données numériques Dans la plupart des applications, on travaille non pas avec une seule variable, mais avec un nombre de variable souvent élevé. L’étude séparée de chacune de ces variables n’est pas suffisante. ->Il faut donc analyser les données en tenant compte de leur caractère multidimensionnel 19/09/2018 Groupe TT6 - KikiTeam

Les méthodes multifactorielles d'Analyse des Données ACP : Analyse en Composantes Principales, pour les tableaux de variables quantitatives. AFTD : Analyse Factorielle d'un Tableau de Distances, pour les tableaux de distances. AFC : Analyse Factorielle des Correspondances, pour les tableaux de contingence. ACM : Analyse des Correspondances Multiples, pour les tableaux de variables qualitatives. STATIS : Structuration des Tableaux A Trois Indices de la Statistique AFM : Analyse Factorielle Multiple DACP : Double Analyse en Composante Principale La liste n'est pas exhaustive. 19/09/2018 Groupe TT6 - KikiTeam

Présentation générale de l'ACP L'étude séparée de chacune de ces variables donne quelques informations mais est insuffisante car elle laisse de côté les liaisons entre elles, ce qui est pourtant souvent ce que l'on veut étudier. C'est le rôle de la statistique multifactorielle, que d'analyser les données dans leur ensemble, en prenant en compte toutes les variables. L'Analyse en Composantes Principales est alors une bonne méthode pour étudier les données multidimensionnelles, lorsque toutes les variables observées sont de type numérique, de préférence dans les mêmes unités, et que l'on veut voir s’il y a des liens entre ces variables. 19/09/2018 Groupe TT6 - KikiTeam

Le principe d’ACP La mise en oeuvre mathématique de l'ACP peut être divisée en 6 étapes principales : 1. Préparer les données pour le traitement 2. Calculer la matrice des coefficients de corrélations des variables 3. Extraire les valeurs et vecteurs propres de cette matrice 4. Classer les vecteurs propres dans l'ordre décroissant des valeurs propres associées 5. Calculer la matrice des composantes principales 19/09/2018 Groupe TT6 - KikiTeam

Le principe d’ACP - 1 - Préparer les données pour le traitement Les observations de p variables sur n individus sont rassemblées dans uns matrice X à n lignes et p colonnes. 19/09/2018 Groupe TT6 - KikiTeam

Le principe d’ACP Le problème est que si on analyse directement la matrice X, les résultats seraient faussés par les valeurs relatives des variables (Par exemple si les valeurs ont été mesurées dans des unités différentes). Préparer les données pour le traitement consiste donc à transformer le tableau de données pour réduire ces effets. On peut alors travailler sur une version centrée-réduite Xcr de la matrice X. Pour centrer la matrice X, on soustrait à chacune des valeurs la moyenne de sa variable. Pour réduire la matrice centrée, on divise chacune des valeurs par l'écart-type de sa variable. 19/09/2018 Groupe TT6 - KikiTeam

Le principe d’ACP 5. Matrice des composantes principales     La matrice appelée matrice des composantes principales est celle qui contient les coordonnées des individus dans l'espace formé par les composantes principales.     Soit CP la matrice des composantes principales. On a alors : CP = Xrc . u 19/09/2018 Groupe TT6 - KikiTeam

ACP - Avantages Simplicité mathématique : Sur le plan mathématique, l'ACP est donc une méthode simple à mettre en oeuvre. Les seuls véritables outils mathématiques utilisés dans l'ACP sont le calcul des valeurs/vecteurs propres d'une matrice, et les changements de base. Simplicité des résultats : Grâce aux graphiques qu'elle fournit, l‘ACP permet d'appréhender une grande partie de ses résultats d'un simple coup d'oeil. Puissance : L'ACP a beau être simple. Elle offre, en quelques opérations seulement, un résumé et une vue complète des relations existant entre les variables quantitatives d'une population d'étude. Flexibilité : L'ACP est une méthode très souple, puisqu'elle s'applique sur un ensemble de données de contenu et de taille quelconques. 19/09/2018 Groupe TT6 - KikiTeam

Projet Le but du projet - Compresser une image noire blanche Le programme prend en entrée une image et à la sortie on obtiendra un certain nombre des coefficients qui présentent les niveaux de gris les plus importants dans l'image. 19/09/2018 Groupe TT6 - KikiTeam

Projet - Réalisation 0 - Choix du format d'image : Pour la raison de la simplicité de lecture et écriture d'une image, on choisit le format pgm qui est représenté par un fichier texte. Exemple: une image Pgm de taille 4x4 : P2 4 4 255 125 156 100 80 16 150 255 20 154 123 120 20 125 123 255 80 19/09/2018 Groupe TT6 - KikiTeam

Projet - Réalisation 1 - Preparer les données pour algorithme ACP Comme on a vu dans la partie de principe d'ACP, ACP prend en entrée un tableau dont chaque ligne est un individu et chaque colonne est une variable. Dans notre cas, le tableau aura une seule ligne (cas on a une seule image en entrée) et les variables seront les niveau de gris, donc il y a 256 variables qui correspondent aux 256 niveaux de gris d'une image noire et blanche. La valeur de chaque variable est donc le nombre de fois que le niveau de gris apparaît dans l'image. 19/09/2018 Groupe TT6 - KikiTeam

Projet - Réalisation 2. Calculer la matrice des coefficients de corrélations des variables 3. Extraire les valeurs et vecteurs propres de cette matrice 4. Classer les vecteurs propres dans l'ordre décroissant des valeurs propres associées 5. Calculer la matrice des composantes principales 19/09/2018 Groupe TT6 - KikiTeam

Projet - Réalisation Exemple : on reprend l’image dans l'exemple ci-dessous 19/09/2018 Groupe TT6 - KikiTeam

Projet - Résultats L'image en entrée 19/09/2018 Groupe TT6 - KikiTeam

Projet - Résultats En fonction de nombre de coefficient, on obtient les résultats suivants: Pour 9 coefficients: 19/09/2018 Groupe TT6 - KikiTeam

Projet - Résultats Pour 20 coefficients: 19/09/2018 Groupe TT6 - KikiTeam

Projet - Résultats Pour 50 coefficients: 19/09/2018 Groupe TT6 - KikiTeam

Projet - Résultats Pour 100 coefficients: 19/09/2018 Groupe TT6 - KikiTeam