La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Vérification des données

Présentations similaires


Présentation au sujet: "Vérification des données"— Transcription de la présentation:

1 Vérification des données

2 Entrée des données Fichier Excel
Données brutes Nom Note score R age sexe Houle, N. A f Darcy, T. B m Petit, M. C m Legrand, P. A f . Baron, C. B m

3 «Data window»

4 Premières vérifications
Vérification du fichier de données Données manquantes Exclusion des variables ou des cas générant un pourcentage important de données manquantes Remplacement des valeurs manquantes Moyenne de groupe Régression Valeurs extrêmes Univariées Multivariées

5 Influence des valeurs extrêmes
Examine <nom de variable>

6 Valeurs extrêmes univariées (SPSS - Explore)
tracé en arborescence

7 Valeurs extrêmes multivariées

8 Normalité de distribution
Number of valid observations (listwise)=454.00 Variable <nom de variable> Mean Std Dev Kurtosis S.E. Kurt Skewness S.E. Skew Minimum Maximum Distribution normale => Coefficient de dissymétrie (skewness) = 0 et Coefficient d’aplatissement (kurtosis) = 0

9 Vérification de normalité SPSS Explore

10

11 Homocédasticité Homogénéité de la variance: La variance d’une variable dépendante est la même pour les différents niveaux de la variable indépendante Homocédasticité: La variance des scores pour une variable est la même pour toutes les valeurs d’une autre variable Manque de Homocédasticité Non normalité d’une des variables Ex: âge et salaire (salaire est biaisé positivement) Plus d’erreur de mesure pour certains niveaux d’une des variables Ex: des personnes d’une certain âge sont plus préoccupées avec leur santé et donnent donc des informations plus fiables à ce sujet

12 Solutions Taille de l’échantillon Transformations
Normalité: Une Anova avec plus de 20 dferreur est assez robuste dans le cas de violation de normalité Homogénéité des variances: Taille des groupes égale -> peu problématique Taille inégale (Fmax: rapport entre la variance la plus large et la variance la plus petite) rapport entre la cellule la plus importante et la cellule la plus petite env. 4 pour 1: Fmax ≤ 10 rapport entre la cellule la plus importante et la cellule la plus petite plus important: Fmax < 3 Transformations

13 Transformations

14 Transformation logarithmique

15

16 Interprétation des résultats

17 Le test statistique Un test statistique répond à la question:
Quelles sont les informations fournies par un test statistique? Un test statistique répond à la question: Est-ce que la différence entre le groupe expérimental et le groupe contrôle est telle que l’on puisse conclure qu’elle n’est pas due au hasard? La réponse dépend: de la taille d’effet du nombre de sujets du test statistique utilisé du niveau alpha fixé

18 MAGIC Magnitude  la taille de l’effet  est-ce que l’influence de la VI sur la VD est importante? Articulation  le degré de détail énoncé  facilité de tirer des conclusions utiles (ex “les moyennes des cinq groupes A,B,C,D,E ne sont pas les mêmes” vs “les moyennes des groupes C,D,E sont significativement différentes des moyennes de A et B bien que ceux-ci ne différent pas entre eux” ou “on observe une augmentation linéaire des moyennes de A à E” Generality validité externe  permet la généralisation des résultats Interestingness  l’importance théorique est-ce que l’étude fournit des nouvelles connaissances? Credibility  validité interne  la qualité de l’opérationnalisation des variables, contrôle des artefacts potentiels Magnitude: here we have to note that sometimes small effects are just as exciting as large effects. This is the case when small effects establish a phenomenon (e.g. FFH) or when in a given situation one would not believe the variable to be able to have any effect at all (Isen, cookies) Articulation: “les moyennes des cinq groupes A,B,C,D,E ne sont pas les mêmes” vs “les moyennes des C,D,E sont significativement differents des moyennes de A et B bien qu’il ne different pas entre eux” vs “on observe une augmentation linéaire des moyennes de A à E” Style and conventions (p < .05) on peut presenter ces données avec plus ou moins de caution. Un style liberal vise à explorer les données à un maximum et a cerner les differents liens possible. Un style conservateur se restreint à la verifications des hypothèse préetablis en ignorant des résultats marginaux ou inattendus. (Discuss problems with both)

19 Significatif ou non Exemples: Tukey (1991):
Le résultat est significatif au niveau de .07 Le résultat est marginalement significatif Bien que le résultat ne soit pas significatif au niveau conventionnel de .05, il suggère que ... Tukey (1991): .05 < p < .15 «the difference leans in the ... direction» .15 < p < .25 «there is a hint regarding the direction» Discuss: Significance tests are not always needed

20 Style Style conservateur n’utilise jamais des tests unidirectionnels
n’utilise qu’une seule analyse pré- déterminée n’exclue jamais de valeurs extrêmes évite de se concentrer sur un seul résultat en particulier, surtout s’il est favorable ne dévie jamais d’un seuil de signification pré-établi 1) planned one-tailed on one direction, difference in the other direction is sig. under two-tailed test => result is p = .075! 2) Rosenthal => .05 on one side and .005 on the other, result .055 test

21 Présentation des résultats

22 Analyse de la variance Degrées de liberté (effet, erreur) Valeur p
Eta2 = taille d’effet Valeur F

23 Les tableaux et les figures
PSY7102

24 Les erreurs les plus communes
Répéter les mêmes informations dans une figure, un tableau, ou bien dans le texte Présenter des tableaux ou des figures qui sont incompréhensibles sans l ’aide du texte Présenter des données dans des tableaux ou des figures sans discuter de leur signification dans le texte

25 Les tableaux Quand ? Pour des petites séries de données peu complexes
Comment ? Mettre les informations dans les colonnes et les lignes dans un ordre logique (p.ex: dans l’ordre de l’importance des items) Choisissez un nombre de chiffres raisonnable (p.ex: plutôt que 3578,887, 1,34 plutôt que 1, ) Arrangez les items tel que les comparaisons importantes soient faciles à faire

26 ----------------------
APA Emplacement Après les notes de bas de page, à la fin du document Dans le texte on signale: Insert Table 1 here Numérotation Chiffres arabes sans suffixes (donc 5 et 6 à la place de 5a et 5b) Titre Doit décrire de manière précise les variables indépendantes et dépendantes tel que le lecteur sait ce qui est présenté sans avoir recours au texte (ex: « Mean log-transformed post-auricular reflex magnitude as a function of emotional facial expression and expresser sex »)

27 Figures Pour des fins de vérification et d’interprétation des données
Pour des fins de communication des résultats

28 Née en 1323 à Allemagne (À l’ouest de Riez), France Mort le 11 juillet 1382 à Lisieux, France

29 Stem-and-leaf Plot (Tracés en arborescence)
Exemple: Un enseignant a demandé à 10 élèves d'indiquer combien de livres ils avaient lu au cours des 12 derniers mois. Voici leurs réponses : 12, 23, 19, 6, 10, 7, 15, 25, 21, 12 Tige Feuille Cette forme de présentation des données permet facilement de détecter des distributions problématiques

30 Box Plot Ce type de figure est construit à partir de la médiane, des deux quartiles et des valeurs extrêmes Les valeurs extrêmes se retrouvent à plus de 1.5 espaces interquartiles en bas ou en haut des quartiles Les valeurs extrêmement extrêmes se retrouvent à plus de 3 espaces interquartiles en bas ou en haut des quartiles

31 Box Plot : exemple

32 Comparaison des séries des données

33 Communication des résultats
Présentation claire avec des symboles distincts Supprimez des informations non essentielles Éviter trop de points sur l ’échelle Ne mettez pas d’informations supplémentaires (ex: légende) dans la région des données Quand des symboles ou des lignes chevauchent, utiliser des moyennes qui aident à la discrimination visuelle Faire plusieurs essais afin de voir quel type de graphique communique le mieux les données

34 suite Deux graphiques clairs sont mieux qu’un graphique surchargé par des données ou des symboles Il est acceptable de se servir d’un graphique complexe s’il permet de visualiser un résultat complexe Quand plusieurs graphiques devraient être comparés il faut qu’ils aient la même échelle Il est possible d’indiquer l’étendue de mesure (ex: ) sur le titre de l’axe et de la commencer avec une autre valeur afin d’améliorer la résolution Voir aussi:

35 Exemple I Problème: peu de données avec un patron simple -> mieux sous forme de tableaux

36 Exemple II Problème: demande le jugement des longueurs relatives, ce qui est plutôt difficile

37 Capacités cognitives impliquées dans la lecture de figures
Position sur une échelle commune Position sur des échelles identiques mais non alignées Longueur Angle/pente Surface Volume Gradation des couleurs

38 Exemple III

39 -----------------------
APA Impression Très bonne qualité sur une feuille 8 x 11.5 Emplacement: Après les tableaux (pages non numérotées) Dans le texte on signale: Insert Figure 1 here La légende est sur la page de la figure et ne fait pas partie du titre Numérotation Chiffres arabes Titres Sur une feuille à part (la dernière page numérotée du document)

40 Références Abelson, R.P. (1995). Statistics as principled argument. Hillsdale, NJ: Lawrence Erlbaum. Sternberg, R.J. (2005). The psychologist’s companion (4th ed.). New York, NY: Cambride University Press . Cohen, J. (1994). The earth is round (p < .05). American Psychologist, 49, Cohen, J. (1990). Things that I have learned (so far). American psychologist, 45, Cowles, M. & Davis, C. (1982). On the origins of the .05 level of statistical significance. American Psychologist, 37,


Télécharger ppt "Vérification des données"

Présentations similaires


Annonces Google