Statistiques Séance 10 N. Yamaguchi
Résumé de la séance précédente Les ANOVA À 1 facteur à n niveaux À 1 facteur à mesures répétées À 2 facteurs (+ notion d’interaction) Les corrélations Test paramétrique: Pearson Test non paramétrique: Spearman
Rappel : corrélation de Spearman Prend en compte les rangs Exercice sur Spearman
Exercice Sujet Note de maths Note de français 1 15 18 2 5 10 3 4 11 12 16 6 8 7 14
Le Khi (Chi) 2 Ou χ2
Pourquoi faire? Comparer des distributions ou des formes de distributions Etude des fréquences ou des effectifs impliquant des variables nominales. Pas de variables continues! Exemple du début : la BU.
Comparaison d’une distr observée et d’une distr théorique Une seule variable nominale On analyse une seule distribution. Question : est-elle homogène (= semblable à la distribution théorique) H0: oui. Répartition homogène des effectifs.
Exemple (1) cf I. Lehiste Perception du contexte d’une phrase par 30 auditeurs. Tableau pour la phrase lue isolément Comparaison avec la distrib théorique: répartition homogène des effectifs. Note: variable nominale à 4 modalités (les rentrer comme une variable continue ds Statview) H0?
Procédure Données: comme une variable continue Analyse: Pas d’étiquettes! Pas besoin de rentrer la distribution théorique Analyse: Analyse univariée > Khi 2 (désselectionner test-t) > rentrer la distrib théorique!!! Menu Analyse > test-t > Editer analyse > Khi 2
Résultats Valeur du Khi 2 à comparer avec p. Hypothèse nulle non rejetée Conclusion? Mais…
Exemple (2ème partie) Même phrase lue à l’initiale. Distribution aléatoire? Données: on rajoute une colonne Procédure : même chose. On peut assigner une autre variable! Résultats Conclusion
Un autre cas du Chi 2 Comparaison de 2 distributions indépendantes Voir si les 2 distributions sont homogènes. (répartition de fréquences) Hypothèse nulle: il n’y a pas de relation entre les fréquences des lignes et les fréquences des colonnes
Tableau de contingence Exemple Étude sur l’efficacité d’une méthode d’enseignement des langues: labo vs méthode traditionnelle Tableau de contingence
Calcul du Chi 2 Tableau de contingence: la colonne ds laquelle un sujet se trouve (= réussite vs échec) est contingente (= dépend de) la ligne ds laquelle le sujet se trouve (= exp vs méthode trad) H0: il n’y a pas de relation entre ligne et colonne
Calcul du Chi 2 (suite) Calcul de la fréquence attendue si H0 est vraie, pour chaque cellule du tableau:
Calcul du Chi 2 (suite) Résultat global par rapport à toutes les cellules. Procédure: Données Tableau de contigence > tableau résumé et Chi 2 des cellules
Résultats Tableau résumé Chi 2 des cellules DDL : (C-1)(R-1) Valeur Chi 2 et p Résultats? H0? Chi 2 des cellules Décomposition du Chi 2 global selon les cellules (contribution des cellules)
Exercice Étude de Butler sur la poésie de Sylvia Plath: distribution des longueurs de mots dans 2 de ses recueils Lgr mots 1 – 3 4 – 6 7 – 9 10 -12 >12 « The Colossus » 3473 3743 1272 285 54 « Winter trees » 3000 2674 753 165 18
Exercice Quelle est H0? Quels sont les résultats?
Rappel! Quel test utiliser? Il faut connaître: Le type de distribution: test paramétrique ou non paramétrique? Le nombre de variables et le nombre de leurs modalités Le type de données: fréquences, mesures? Ce qu’on veut étudier!
1. Tester les différences entre groupes Groupes indépendants : ce ne sont pas les mêmes sujets! Paramétrique 1 variable nominale à 2 modalités; mesures : test-t indépendant (test-t univarié: moyenne théorique) 1 variable nominale à 3 ou + modalités, mesures: ANOVA à 1 facteur à n niveaux
1. Tester les différences entre groupes Paramétriques (suite): 2 variables nominales: ANOVA à 2 facteurs Non paramétriques: 1 variable nominale à 2 modalités; mesures: test U de Mann-Whitney 1 variable nominale à 3 ou + modalités, mesures: test des rangs de Kruskal-Wallis
2. Tester les différences entre variables Mêmes sujets, mais conditions différentes Paramétriques: 1 variable continue (mesures), 1 variable indépendante (à 2 modalités = 2 conditions): test-t apparié 1 variable continue (mesures), 1 variable indépendante (à 3 ou + modalités = 3 ou + conditions): ANOVA à mesures répétées
2. Tester les différences entre variables Non paramétriques: Mesures, 1 variable indépendante (à 2 modalités = 2 conditions): test des rangs de Wilcoxon Fréquences / effectifs, 1 variable indépendante aux modalités dichotomiques: Chi 2
2. Tester les différences entre variables Non paramétriques (suite) 1 variable continue (mesures), 1 variable indépendante (à 3 ou + modalités = 3 ou + conditions): test de Friedman
3. Tester les relations entre variables Paramétriques: corrélation de Pearson Non paramétriques: corrélation des rangs de Spearman ou Chi 2 (fréquences / effectifs et variable à modalités catégorielles)