La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Vérification des données. Entrée des données Données brutes Nom Note score R age sexe Houle, N.A3021 f Darcy, T. B2725 m Petit, M. C3123 m Legrand, P.

Présentations similaires


Présentation au sujet: "Vérification des données. Entrée des données Données brutes Nom Note score R age sexe Houle, N.A3021 f Darcy, T. B2725 m Petit, M. C3123 m Legrand, P."— Transcription de la présentation:

1 Vérification des données

2 Entrée des données Données brutes Nom Note score R age sexe Houle, N.A3021 f Darcy, T. B2725 m Petit, M. C3123 m Legrand, P. A 2824 f. Baron, C. B2924 m Fichier Excel

3 «Data window»

4 Premières vérifications Vérification du fichier de données Données manquantes Exclusion des variables ou des cas générant un pourcentage important de données manquantes Remplacement des valeurs manquantes Moyenne de groupe Régression Valeurs extrêmes Univariées Multivariées

5 Influence des valeurs extrêmes Examine

6 Valeurs extrêmes univariées (SPSS - Explore)

7 Valeurs extrêmes multivariées

8 Normalité de distribution Number of valid observations (listwise)= Variable Mean Std Dev Kurtosis S.E. Kurt.229 Skewness S.E. Skew.115 Minimum 1.00 Maximum Distribution normale => Coefficient de dissymétrie (skewness) = 0 et Coefficient daplatissement (kurtosis) = 0

9 Vérification de normalité SPSS Explore

10

11 Homocédasticité Homogénéité de la variance: La variance dune variable dépendante est la même pour les différents niveaux de la variable indépendante Homocédasticité: La variance des scores pour une variable est la même pour toutes les valeurs dune autre variable Manque de Homocédasticité Non normalité dune des variables Ex: âge et salaire (salaire est biaisé positivement) Plus derreur de mesure pour certains niveaux dune des variables Ex: des personnes dune certain âge sont plus préoccupées avec leur santé et donnent donc des informations plus fiables à ce sujet

12 Solutions Taille de léchantillon Normalité: Une Anova avec plus de 20 df erreur est assez robuste dans le cas de violation de normalité Homogénéité des variances: Taille des groupes égale -> peu problématique Taille inégale (F max : rapport entre la variance la plus large et la variance la plus petite) rapport entre la cellule la plus importante et la cellule la plus petite env. 4 pour 1: F max 10 rapport entre la cellule la plus importante et la cellule la plus petite plus important: F max < 3 Transformations

13 Transformations

14 Transformation logarithmique

15

16 Interprétation des résultats

17 Le test statistique Quelles sont les informations fournies par un test statistique? Un test statistique répond à la question: Est-ce que la différence entre le groupe expérimental et le groupe contrôle est telle que lon puisse conclure quelle nest pas due au hasard? La réponse dépend: de la taille deffet du nombre de sujets du test statistique utilisé du niveau alpha fixé

18 MAGIC Magnitude la taille de leffet est-ce que linfluence de la VI sur la VD est importante? Articulation le degré de détail énoncé facilité de tirer des conclusions utiles (ex les moyennes des cinq groupes A,B,C,D,E ne sont pas les mêmes vs les moyennes des groupes C,D,E sont significativement différentes des moyennes de A et B bien que ceux-ci ne différent pas entre eux ou on observe une augmentation linéaire des moyennes de A à E Generality validité externe permet la généralisation des résultats Interestingness limportance théorique est-ce que létude fournit des nouvelles connaissances? Credibility validité interne la qualité de lopérationnalisation des variables, contrôle des artefacts potentiels

19 Significatif ou non Exemples: Le résultat est significatif au niveau de.07 Le résultat est marginalement significatif Bien que le résultat ne soit pas significatif au niveau conventionnel de.05, il suggère que... Tukey (1991):.05 < p <.15 «the difference leans in the... direction».15 < p <.25 «there is a hint regarding the direction»

20 Style Style conservateur nutilise jamais des tests unidirectionnels nutilise quune seule analyse pré- déterminée nexclue jamais de valeurs extrêmes évite de se concentrer sur un seul résultat en particulier, surtout sil est favorable ne dévie jamais dun seuil de signification pré-établi

21 Présentation des résultats

22 Analyse de la variance Degrées de liberté (effet, erreur) Valeur F Valeur p Eta 2 = taille deffet

23 Les tableaux et les figures PSY7102

24 Les erreurs les plus communes Répéter les mêmes informations dans une figure, un tableau, ou bien dans le texte Présenter des tableaux ou des figures qui sont incompréhensibles sans l aide du texte Présenter des données dans des tableaux ou des figures sans discuter de leur signification dans le texte

25 Les tableaux Quand ? Pour des petites séries de données peu complexes Comment ? Mettre les informations dans les colonnes et les lignes dans un ordre logique (p.ex: dans lordre de limportance des items) Choisissez un nombre de chiffres raisonnable (p.ex: 3578 plutôt que 3578,887, 1,34 plutôt que 1, ) Arrangez les items tel que les comparaisons importantes soient faciles à faire

26 APA Emplacement Après les notes de bas de page, à la fin du document Dans le texte on signale: Insert Table 1 here Numérotation Chiffres arabes sans suffixes (donc 5 et 6 à la place de 5a et 5b) Titre Doit décrire de manière précise les variables indépendantes et dépendantes tel que le lecteur sait ce qui est présenté sans avoir recours au texte (ex: « Mean log-transformed post-auricular reflex magnitude as a function of emotional facial expression and expresser sex »)

27 Figures Pour des fins de vérification et dinterprétation des données Pour des fins de communication des résultats

28 Née en 1323 à Allemagne (À louest de Riez), France Mort le 11 juillet 1382 à Lisieux, France

29 Stem-and-leaf Plot ( Tracés en arborescence) Cette forme de présentation des données permet facilement de détecter des distributions problématiques Exemple: Un enseignant a demandé à 10 élèves d'indiquer combien de livres ils avaient lu au cours des 12 derniers mois. Voici leurs réponses : 12, 23, 19, 6, 10, 7, 15, 25, 21, 12 Tige Feuille

30 Box Plot Ce type de figure est construit à partir de la médiane, des deux quartiles et des valeurs extrêmes Les valeurs extrêmes se retrouvent à plus de 1.5 espaces interquartiles en bas ou en haut des quartiles Les valeurs extrêmement extrêmes se retrouvent à plus de 3 espaces interquartiles en bas ou en haut des quartiles

31 Box Plot : exemple

32 Comparaison des séries des données

33 Communication des résultats Présentation claire avec des symboles distincts Supprimez des informations non essentielles Éviter trop de points sur l échelle Ne mettez pas dinformations supplémentaires (ex: légende) dans la région des données Quand des symboles ou des lignes chevauchent, utiliser des moyennes qui aident à la discrimination visuelle Faire plusieurs essais afin de voir quel type de graphique communique le mieux les données

34 suite Deux graphiques clairs sont mieux quun graphique surchargé par des données ou des symboles Il est acceptable de se servir dun graphique complexe sil permet de visualiser un résultat complexe Quand plusieurs graphiques devraient être comparés il faut quils aient la même échelle Il est possible dindiquer létendue de mesure (ex: ) sur le titre de laxe et de la commencer avec une autre valeur afin daméliorer la résolution Voir aussi:

35 Exemple I Problème: peu de données avec un patron simple -> mieux sous forme de tableaux

36 Exemple II Problème: demande le jugement des longueurs relatives, ce qui est plutôt difficile

37 Capacités cognitives impliquées dans la lecture de figures Position sur une échelle commune Position sur des échelles identiques mais non alignées Longueur Angle/pente Surface Volume Gradation des couleurs

38 Exemple III

39 APA Impression Très bonne qualité sur une feuille 8 x 11.5 Emplacement: Après les tableaux (pages non numérotées) Dans le texte on signale: Insert Figure 1 here La légende est sur la page de la figure et ne fait pas partie du titre Numérotation Chiffres arabes Titres Sur une feuille à part (la dernière page numérotée du document)

40 Références Abelson, R.P. (1995). Statistics as principled argument. Hillsdale, NJ: Lawrence Erlbaum. Sternberg, R.J. (2005). The psychologists companion (4th ed.). New York, NY: Cambride University Press. Cohen, J. (1994). The earth is round (p <.05). American Psychologist, 49, Cohen, J. (1990). Things that I have learned (so far). American psychologist, 45, Cowles, M. & Davis, C. (1982). On the origins of the.05 level of statistical significance. American Psychologist, 37,


Télécharger ppt "Vérification des données. Entrée des données Données brutes Nom Note score R age sexe Houle, N.A3021 f Darcy, T. B2725 m Petit, M. C3123 m Legrand, P."

Présentations similaires


Annonces Google