Les méthodes quantitatives en éducation Jerome St-Amand
Ordre du jour Questions ? Contenu: Test d’hypothèse – T de Student Application Chap. 4, 6, 7, 8, 18
Introduction aux tests statistiques (1) Méthode scientifique: Observation d’un fait ou d’un phénomène Formulation d’une hypothèse scientifique pour expliquer ce phénomène Vérification à l’aide d’une expérience ou d’un test Le test est un outil pour confirmer quelque chose Est-ce qu’une méthode est meilleure qu’une autre méthode?
Introduction aux tests statistiques (2) À partir de: Hypothèse scientifique (de recherche) On pose des: Hypothèses statistiques
Les hypothèses statistiques H0: Hypothèse nulle (supposée vraie – généralement on espère la réfuter) H1: Hypothèse alternative (généralement on espère la supportée) Dans l’approche de Neyman-Pearson, les tests sont basés sur le paradigme suivant: « innocent jusqu’à preuve du contraire » Hypothèse nulle: JOS est innocent. L’hypothèse prudente. L’hypothèse nulle ne sera rejetée que si on a suffisamment de preuves pour démontrer que h0 est fausse. H1: l’hypothèse qui sera acceptée si H0 est rejetée.
Tests paramétriques unilatéraux et bilatéraux Un test unilatéral: on cherche à savoir si une estimation est supérieure (ou inférieure) à une autre. La zone de rejet de l'hypothèse principale est située d'un seul côté de la distribution de référence. Un test bilatéral: on cherche une différence entre deux estimations sans se préoccuper du signe ou du sens de la différence. Dans ce cas, la zone de rejet de l'hypothèse principale se fait de part et d'autre de la distribution de référence. SPSS - test bilatéral
Comment fonctionne un test? Hypothèse de recherche Hypothèses statistiques H0 et H1 Établir le niveau de signification (souvent =0,05) Calculer la statistique et la probabilité Prendre la décision Si p est petit = rejet de H0 Si p est grand = on ne rejette pas H0
Les types d’erreur (type I et II) Attention: il y a une différence entre la réalité et la décision qui est prise à partir des données Réalité Décision H0 est vraie H0 est fausse H0 est rejetée Erreur de type I 1- (puissance) H0 n’ est pas rejetée 1- Erreur de type II Total =100% Total=100% Type I: rejeter l’hypothèse nulle alors qu’elle est vraie (alpha) (revient à condamner JOS qui est innocent) Type II: Retenir l’hypothèse nulle alors qu’elle est fausse (beta) (revient à acquitter JOS alors qu’il est coupable) Alpha est notre seuil Alpha est fixé à priori (0,05 souvent) Si alpha est plus petit, la zone d’acceptation est plus grande, donc on risque d’accepter ho alors qu’elle est fausse et ainsi augmenter la probabilité de faire une erreur de 2eme espèce.
Hypothèse scientifique Hypothèses statistiques Paramétrique: énoncé quantitatif concernant un paramètre de la population (p.e.: moyenne) Test paramétrique Non paramétrique: égalité de lois, association entre des variables … Test non paramétrique
Comment choisir un test? Type de données (nominales, ordinales, mesure) L’hypothèse de recherche Taille de l’échantillon Postulats vérifiés ou pas
Test t (moyenne): 3 cas possibles Échantillon unique Deux échantillons indépendants: (par exemple les mêmes données récoltées pour les filles et pour les garçons) Postulat additionnel: on suppose que les variances des deux populations sont égales Deux échantillons appariés: (par exemple des données récoltées à deux reprises (pré-test;post-test) sur les mêmes sujets, des échantillons dépendants) 1- Un seul échantillon que l’on compare à la moyenne connue de la population de référence
Postulats Pour appliquer un test t de Student, il faut: un échantillon aléatoire Une variable continue (variable ordinale est possible si nous considérons que les écarts entre les points sont constants) que la variable soit distribuée normalement ou au moins avoir un échantillon assez grand (n30 ?) Variances égales (test T pour échantillons indépendants)
Exemple 1: page 183 Données IDP (index de développement psychomoteur) La moyenne de la population de référence est connue et vaut 100 Hypothèse de recherche: la moyenne de l’index IDP de cet échantillon s’écarte significativement de celle de la population de référence (l’hypothèse nulle sera que cet échantillon provient de cette population, on espère que ce n’est pas le cas) Hypothèses statistiques (test bilatéral) H0: = 100 H1: 100 ÉTUDE SUR LES APTITUDES PSYCHOMOTRICES DES ENFANTS À POIDS RÉDUIT À LA NAISSANCE Variable: IDP: indice de développement psychomoteur On sait que l’indice moyen pour la population de référence est égale à 100 (on connait mu)
Test sur échantillon unique À la main La statistique du test est: Il y a 56-1=55 ddl (on arrondit à 50) La lecture de la table donne: t0,05(50)=2,009 Conclusion: 2,452,009, donc on rejette H0 Avec SPSS Analyse-comparer les moyennes-test t pour échantillon unique Conclusion: 0,0170,05 donc on rejette H0 Test sur échantillon unique Valeur du test = 100 t ddl Sig. (bilatérale) Différence moyenne Intervalle de confiance 95% de la différence Inférieure Supérieure IDP 2,453 55 ,017 4,125 ,75 7,50 Probabilité associée à la statistique t 104,125-100 Expliquer avec un dessin au tableau pour le calcul à la main et la sortie SPSS Intervalle de confiance: On a une confiance égale à 0.95 que la vraie différence qui existe entre l’IDP de la population de référence et l’IDP de la population dont est tiré cet échantillon se situe entre 0.75 et 7.5 (la vraie différence ne varie pas, c’est l’intervalle qui varie d’un échantillon à l’autre). L’intervalle ne contient pas 0 ce qui est logique puisqu’on a rejeté H0 et conclu que les deux moyennes sont différentes. Interprétation: notre échantillon diffère de la population de référence
Page 704
Échantillons indépendants: Statistiques de l’échantillon: n1; X1, s1 Statistiques de la population N1; 1; 1 Échantillon 2 Statistiques de l’échantillon: n2; X2; s2 Statistiques de la population N2; 2; 2 Par exemple, pour un test non directionnel (bilatéral), les hypothèses peuvent être: Le nombre de degrés de liberté est alors: n1 + n2 - 2
Exemple 1: échantillons indépendants (page 201) L’hypothèse de recherche est que les deux groupes (homophobes et non homophobes) ont des niveaux d’excitation sexuelle semblables. Ici, les deux groupes sont constitués de sujets différents Exemple 1: deux groupes homophobes et non homophobes, variable mesure l’excitation sexuelle Les échantillons sont indépendants (ce ne sont pas les mêmes sujets) 1- On a une confiance égale à 0.95 que la vraie différence qui existe se situe entre 3.5 et 10.9 (la vraie différence ne varie pas, c’est l’intervalle qui varie d’un échantillon à l’autre). L’intervalle ne contient pas 0 ce qui est logique puisqu’on a rejeté H0 et conclu que les deux moyennes sont différentes. Exemple 2: DDL= 35 + 29 -2 = 62
Exemple 1 En moyenne, l’excitation sexuelle des homophobes est d’environ 7,5 pts supérieure à celle des non homophobes, avec une variation autour de la moyenne légèrement supérieure
Exemple 1 Le test de Levene vérifie si la variance des deux groupes est égale. Ici 0,534 0,05 donc on assume que les variances sont égales
Exemple 1 La probabilité associée à la statistique du test est égale à 0,016 0,05 donc on rejette H0 Le résultat indique une différence significative entre l’excitation sexuelle des homophobes (m=24,00, s= 12,20) et non homophobes (m=16,15, s=11,80). On conclut que la différence entre les moyennes n’est pas seulement due au hasard (t 0,05(62) = 2,48, p=0,016). erreur standard de la différence
Exemple 1 On a une confiance égale à 95% (ou 19 fois sur 20) que la vraie différence qui existe entre les deux moyennes des populations se situe entre 1,5 et 13,5 Attention: la vraie différence ne varie pas, c’est l’intervalle qui varie d’un échantillon à l’autre. L’intervalle ne contient pas 0 ce qui est logique puisqu’on a rejeté H0 et conclu que les deux moyennes sont différentes.
Échantillons appariés Sujet Mesure 1 Mesure 2 Différence d 1 45 38 7 2 35 37 -2 … n Par exemple, pour un test non directionnel, les hypothèses peuvent être: Le nombre de degrés de liberté est alors: n-1
Exemple 2: échantillons appariés (page 189) L’hypothèse de recherche est que les jeunes filles ont changé de poids entre les deux mesures (avant et après le traitement pour l’anorexie) Ici, les deux groupes sont donc constitués des mêmes sujets avec des mesures différentes L’hypothèse statistique est: Exemple 1: deux groupes Homophobes et non homophobes, variable mesure l’excitation sexuelle Les échantillons sont indépendants (ce ne sont pas les mêmes sujets) 1- On a une confiance égale à 0.95 que la vraie différence qui existe se situe entre 3.5 et 10.9 (la vraie différence ne varie pas, c’est l’intervalle qui varie d’un échantillon à l’autre). L’intervalle ne contient pas 0 ce qui est logique puisqu’on a rejeté H0 et conclu que les deux moyennes sont différentes. Exemple 2: traitement sur l’anorexie DDL= 17 – 1=16
Exemple 2 En moyenne, les jeunes filles ont pris 7 livres entre les deux mesures. Les valeurs sont un peu plus dispersées autour de la moyenne lors de la mesure après.
Exemple 2 On a une confiance égale à 95% (ou 19 fois sur 20) que la vraie différence moyenne se situe entre 3,6 et 10,9 La probabilité associée à la statistique du test est égale à 0,001 0,05 donc on rejette H0 On conclut que la différence entre les moyennes n’est pas égale à 0 et qu’il y a une augmentation de poids statistiquement significative à l’issue du traitement. On ne peut toutefois pas affirmer que c’est grâce au traitement. Le résultat nous montre qu’il y a eu une augmentation de poids statistiquement significative entre la première mesure – avant le traitement (m=83,23; s=5,02) et la seconde mesure – après le traitement (m=90,49; s=8,49), t0,05(16) = 4,18, p=0,001.
La robustesse du test T (p. 209) ETA-6505
Pensez à utiliser l’aide de SPSS ETA-6505