Télécharger la présentation
1
Analyse de données avec R
R. Aloui 2015/2016 Disponible sur
2
Analyse de données Introduction
Lors de toute étude statistique, il est nécessaire de décrire et explorer les données avant d’en tirer de quelconques lois ou modèles prédictifs. Dans beaucoup de situations, les données sont trop nombreuses pour pouvoir être visualisables (nombre de caractéristiques trop élevées) ADD = ensemble de méthodes descriptives ayant pour objectif de Résumer et visualiser l’information pertinente contenue dans un grand tableau de données. Fournissez une brève vue d’ensemble de la présentation. Décrivez l’objectif principal de la présentation et expliquez son importance. Présentez chaque sujet principal. Pour fournir une feuille de route à votre audience, vous pouvez répéter cette diapositive de vue d’ensemble tout au long de la présentation afin de mettre en évidence le sujet suivant.
3
Analyse de données Fournissez une brève vue d’ensemble de la présentation. Décrivez l’objectif principal de la présentation et expliquez son importance. Présentez chaque sujet principal. Pour fournir une feuille de route à votre audience, vous pouvez répéter cette diapositive de vue d’ensemble tout au long de la présentation afin de mettre en évidence le sujet suivant.
4
Analyse Factorielle de Correspondance
Cette technique s'applique à des tableaux de contingence croisant deux variables qualitatives avec de nombreuses modalités chacun, Variable qualitative : des valeurs non numériques (sauf des numéros) appelé classe ou modalité. Exemple : catégorie SP: cadre/Ouvrier/commerçant, sexe : Mâle/femelle… Fournissez une brève vue d’ensemble de la présentation. Décrivez l’objectif principal de la présentation et expliquez son importance. Présentez chaque sujet principal. Pour fournir une feuille de route à votre audience, vous pouvez répéter cette diapositive de vue d’ensemble tout au long de la présentation afin de mettre en évidence le sujet suivant.
5
Analyse Factorielle de Correspondance
Fournissez une brève vue d’ensemble de la présentation. Décrivez l’objectif principal de la présentation et expliquez son importance. Présentez chaque sujet principal. Pour fournir une feuille de route à votre audience, vous pouvez répéter cette diapositive de vue d’ensemble tout au long de la présentation afin de mettre en évidence le sujet suivant.
6
Analyse Factorielle de Correspondance
Exemple: Fournissez une brève vue d’ensemble de la présentation. Décrivez l’objectif principal de la présentation et expliquez son importance. Présentez chaque sujet principal. Pour fournir une feuille de route à votre audience, vous pouvez répéter cette diapositive de vue d’ensemble tout au long de la présentation afin de mettre en évidence le sujet suivant.
7
Tableau de contingence
Un TC (2 variables) est un tableau croisant les modalités de 2 variables, l’ensemble des lignes correspond aux modalités de la 1ère variable et l’ensemble des colonnes aux modalités de la 2ème (la distribution des valeurs). Fournissez une brève vue d’ensemble de la présentation. Décrivez l’objectif principal de la présentation et expliquez son importance. Présentez chaque sujet principal. Pour fournir une feuille de route à votre audience, vous pouvez répéter cette diapositive de vue d’ensemble tout au long de la présentation afin de mettre en évidence le sujet suivant.
8
Tableau de contingence
Fournissez une brève vue d’ensemble de la présentation. Décrivez l’objectif principal de la présentation et expliquez son importance. Présentez chaque sujet principal. Pour fournir une feuille de route à votre audience, vous pouvez répéter cette diapositive de vue d’ensemble tout au long de la présentation afin de mettre en évidence le sujet suivant.
9
Tableau de fréquence Fournissez une brève vue d’ensemble de la présentation. Décrivez l’objectif principal de la présentation et expliquez son importance. Présentez chaque sujet principal. Pour fournir une feuille de route à votre audience, vous pouvez répéter cette diapositive de vue d’ensemble tout au long de la présentation afin de mettre en évidence le sujet suivant.
10
Objectifs de l'AFC Pour une variable donnée, certaines modalités sont-elles proches ou éloignées? Exple: yeux bleus et verts sont proches si les deux groupes ont les mêmes distributions de couleurs de cheveux. Entre les deux variables, certaines modalités « s'attirent-elles» davantage ou au contraire « se repoussent »? Exple: les yeux bleus et les cheveux blond « s'attirent », au contraire des yeux noirs et des cheveux blond. Fournissez une brève vue d’ensemble de la présentation. Décrivez l’objectif principal de la présentation et expliquez son importance. Présentez chaque sujet principal. Pour fournir une feuille de route à votre audience, vous pouvez répéter cette diapositive de vue d’ensemble tout au long de la présentation afin de mettre en évidence le sujet suivant.
11
Test d’indépendance L'AFC n'a d'intérêt que si il y a dépendance entre les deux variables, en cas contraire elle n'apporte pas d'information Fournissez une brève vue d’ensemble de la présentation. Décrivez l’objectif principal de la présentation et expliquez son importance. Présentez chaque sujet principal. Pour fournir une feuille de route à votre audience, vous pouvez répéter cette diapositive de vue d’ensemble tout au long de la présentation afin de mettre en évidence le sujet suivant.
12
Illustration Installer le package FactoMineR.
Importer les données dans le fichier AFC_DonTraF.csv Présentation des données: 1724 femmes ont répondu à différentes questions à propos du travail des femmes, parmi lesquelles : Quelle est selon vous la famille parfaite ? L'homme et la femme travaillent L'homme travaille plus que la femme Seul l'homme travaille Quelle activité est la meilleure pour une mère quand les enfants vont à l'école ? Rester à la maison Travailler à mi-temps Travailler à temps complet
13
Illustration > Res.acf<-read.table("AFC_DonTraF.csv", header=TRUE, sep=“;", row.names=1) > Res.acf<-CA(women_work) Pour voir les nuages des lignes et des colonnes séparément, tapez : > plot(Res.acf, invisible="col") > plot(Res.acf, invisible="row")
14
Le nuage des colonnes montre que le premier axe oppse « rester au foyer" et « trav.plein temps« -> oppose deux profils de femmes. Les femmes qui ont répondu " rester au foyer " ont répondu « seul le mari trav." plus souvent que l'ensemble de la population.
15
> summary(Res.acf) Valeurs propres % d’inertie (variance) associé à chaque dimension (la 1ere dimension explique 86% de l’inertie Les résultats sur les lignes actives (cord de chaque ligne sur la 1ere dimension, la contri. De cette ligne à la construction de la 1ere dimension et la qualité de representation qui varie entre 0 et 1 (cos2) proche de 1 le point est parfaitement representé sur l’axe Les résultats sur les colonnes
16
Microsoft Excellence en ingénierie
Annexe Votre présentation est-elle aussi claire que possible ? Pensez à placer du contenu supplémentaire dans l’annexe. Utilisez des diapositives en annexe pour y placer du contenu auquel vous pouvez faire référence pendant la diapositive relative aux questions ou que les participants peuvent approfondir ultérieurement. Microsoft Confidentiel
Présentations similaires
© 2024 SlidePlayer.fr Inc.
All rights reserved.