Les méthodes quantitatives en éducation

Slides:



Advertisements
Présentations similaires
Comparaison d’une moyenne observée à une moyenne théorique
Advertisements

Comparaison de deux moyennes observées
Comparaison de deux pourcentages observés
Les Tests dhypothèses. 1)Définition Un test cest une méthode qui permet de prendre une décision à partir des résultats dun échantillon.
Méthodes de Biostatistique
ANALYSE DE DONNEES TESTS D’ASSOCIATION
Tests relatifs aux variables qualitatives: Tests du Chi-deux.
Introduction aux statistiques Intervalles de confiance
Chap. III Statistiques inférentielles
Outils Statistiques Damien Van Gysel CHU de Nice
Atelier 1 Le problème du surpoids sur géogébra. Etude de la prévalence du surpoids: (document Ressources pour la classe de terminale) Situation: On souhaite.
Auteur : Patrice LEPISSIER Les probabilités  Notions de base Notions de base  Variable aléatoire Variable aléatoire  La loi Normale La loi Normale.
Généralisation de la comparaison de moyennes par Analyse de la variance (ANOVA)
Chapitre 6. Introduction à l’échantillonnage Les sondages Notions fondamentales Fluctuations d’échantillonnage d’une moyenne Théorème central limite C6-1.
Utilisation du logiciel EduStat © Analyse classique d’items L’examen du rapport.
Notions de statistiques et d’analyse de données
Suites ordonnées ou mettre de l’ordre
Corrélation et régression linéaire simple
Chapitre 1 Généralités sur les données
Valeurs de toutes les différences observables sous H0
Comparaison de deux pourcentages.
CHAPITRE III : La crise de la famille l’empêche-t-elle de jouer son rôle ? Compétence visée : Analyser un texte.
Loi Normale (Laplace-Gauss)
4°) Intervalle de fluctuation :
Une grande partie des données que nous serons amenés cette année à étudier sera exprimée en unités monétaires. Or, nous le savons, il existe un phénomène.
Chapitre 13 : Echantillonnage
Coefficient de corrélation linéaire
POL1803: Analyse des techniques quantitatives
Échantillonnage non-aléatoire
et discussion de l'article 2
Introduction aux Statistiques Variables aléatoires
Cours 9 Autres types de Statistiques. Article 4 BIO 3500 – Hiver 2017
Technologies de l’intelligence d’affaires Séance 12
Révision et preparation à l’examen
Risque d’erreur de 1ère espèce : α
4.3 Estimation d’une proportion
Les modèles linéaires (Generalized Linear Models, GLM)
4.5 Tests D’hypothèses sur une proportion
Chapitre 8 : Fluctuation d’échantillonnage.
Statistiques industrielles – Exemple d’application
4.4 Tests D’hypothèses sur une moyenne
3.3 loi discrète 1 cours 14.
Méthode Taguchy Analyse de la variance Anavar
4.2 Estimation d’une moyenne
Introduction aux statistiques Intervalles de confiance
Statistique. Probabilite ou risque Le risque c’est le pourcentage des valeurs qu’on neglige plus le risqué augmente plus on neglige des valeurs Hypothese.
Statistique Cours #2 et #3 Avons-nous des conditions gagnantes? Prise de décision à partir d’inférence.
Analyse de la variance et de la covariance Analyse de la variance à 1 facteur ANOVA à 2 facteurs Conditions d’utilisation.
Calculs des incertitudes Lundi 30 Avril 2018 Master de Management de la Qualité, de la Sécurité et de l’Environnement.
 1____Probabilité  2______variables aléatoires discrètes et continues  3______loi de probabilités d’une v a  4_______les moyens et les moyens centraux.
Fluctuations d’une fréquence selon les échantillons, Probabilités
La méthode scientifique
Calcul de probabilités
Rappel (3): les étapes des tests statistiques
Test 2.
Présentation 3 : Sondage aléatoire simple
Présentation 8 : Redressement des estimateurs
On lance 100 fois de suite une pièce de monnaie.
Présentation 9 : Calcul de précision des estimateurs complexes
Position, dispersion, forme
Master spécialisé sciences de l ’ environnement en milieu urbain : EER  Etude statistique du Lake d ’ Everglades - ASSAKRAR M ’ HAND - BENBAASID HICHAM.
Les calculs usuels sur les prix
Présentation 6 : Sondage à plusieurs degrés
La démarche scientifique
Programme d’appui à la gestion publique et aux statistiques
Exercice 1 : On admet qu’il naît automatiquement 49% de filles parmi les naissances annuelles en France. Le directeur d’une maternité qui a 200.
PROGRAMMATION SCIENTIFIQUE EN C
Tests d’hypothèses paramétriques 1 Cours Statistiques Chapitre 9.
Impact Evaluation 4 Peace March 2014, Lisbon, Portugal 1 Echantillonage pour une Evaluation d’Impact Latin America and the Caribbean’s Citizen Security.
STATISTIQUE INFERENTIELLE LES TESTS STATISTIQUES.
Transcription de la présentation:

Les méthodes quantitatives en éducation Jerome St-Amand

Ordre du jour Questions ? Contenu: Test d’hypothèse – T de Student Application Chap. 4, 6, 7, 8, 18

Introduction aux tests statistiques (1) Méthode scientifique: Observation d’un fait ou d’un phénomène Formulation d’une hypothèse scientifique pour expliquer ce phénomène Vérification à l’aide d’une expérience ou d’un test Le test est un outil pour confirmer quelque chose Est-ce qu’une méthode est meilleure qu’une autre méthode?

Introduction aux tests statistiques (2) À partir de: Hypothèse scientifique (de recherche) On pose des: Hypothèses statistiques

Les hypothèses statistiques H0: Hypothèse nulle (supposée vraie – généralement on espère la réfuter) H1: Hypothèse alternative (généralement on espère la supportée) Dans l’approche de Neyman-Pearson, les tests sont basés sur le paradigme suivant: « innocent jusqu’à preuve du contraire » Hypothèse nulle: JOS est innocent. L’hypothèse prudente. L’hypothèse nulle ne sera rejetée que si on a suffisamment de preuves pour démontrer que h0 est fausse. H1: l’hypothèse qui sera acceptée si H0 est rejetée.

Tests paramétriques unilatéraux et bilatéraux Un test unilatéral: on cherche à savoir si une estimation est supérieure (ou inférieure) à une autre. La zone de rejet de l'hypothèse principale est située d'un seul côté de la distribution de référence. Un test bilatéral: on cherche une différence entre deux estimations sans se préoccuper du signe ou du sens de la différence. Dans ce cas, la zone de rejet de l'hypothèse principale se fait de part et d'autre de la distribution de référence. SPSS - test bilatéral

Comment fonctionne un test? Hypothèse de recherche Hypothèses statistiques H0 et H1 Établir le niveau de signification (souvent =0,05) Calculer la statistique et la probabilité Prendre la décision Si p est petit = rejet de H0 Si p est grand = on ne rejette pas H0

Les types d’erreur (type I et II) Attention: il y a une différence entre la réalité et la décision qui est prise à partir des données Réalité Décision H0 est vraie H0 est fausse H0 est rejetée Erreur de type I  1- (puissance) H0 n’ est pas rejetée 1- Erreur de type II  Total =100% Total=100% Type I: rejeter l’hypothèse nulle alors qu’elle est vraie (alpha) (revient à condamner JOS qui est innocent) Type II: Retenir l’hypothèse nulle alors qu’elle est fausse (beta) (revient à acquitter JOS alors qu’il est coupable) Alpha est notre seuil Alpha est fixé à priori (0,05 souvent) Si alpha est plus petit, la zone d’acceptation est plus grande, donc on risque d’accepter ho alors qu’elle est fausse et ainsi augmenter la probabilité de faire une erreur de 2eme espèce.

Hypothèse scientifique Hypothèses statistiques Paramétrique: énoncé quantitatif concernant un paramètre de la population (p.e.: moyenne) Test paramétrique Non paramétrique: égalité de lois, association entre des variables … Test non paramétrique

Comment choisir un test? Type de données (nominales, ordinales, mesure) L’hypothèse de recherche Taille de l’échantillon Postulats vérifiés ou pas

Test t (moyenne): 3 cas possibles Échantillon unique Deux échantillons indépendants: (par exemple les mêmes données récoltées pour les filles et pour les garçons) Postulat additionnel: on suppose que les variances des deux populations sont égales Deux échantillons appariés: (par exemple des données récoltées à deux reprises (pré-test;post-test) sur les mêmes sujets, des échantillons dépendants) 1- Un seul échantillon que l’on compare à la moyenne connue de la population de référence

Postulats Pour appliquer un test t de Student, il faut: un échantillon aléatoire Une variable continue (variable ordinale est possible si nous considérons que les écarts entre les points sont constants) que la variable soit distribuée normalement ou au moins avoir un échantillon assez grand (n30 ?) Variances égales (test T pour échantillons indépendants)

Exemple 1: page 183 Données IDP (index de développement psychomoteur) La moyenne de la population de référence est connue et vaut 100 Hypothèse de recherche: la moyenne de l’index IDP de cet échantillon s’écarte significativement de celle de la population de référence (l’hypothèse nulle sera que cet échantillon provient de cette population, on espère que ce n’est pas le cas) Hypothèses statistiques (test bilatéral) H0:  = 100 H1:  100 ÉTUDE SUR LES APTITUDES PSYCHOMOTRICES DES ENFANTS À POIDS RÉDUIT À LA NAISSANCE Variable: IDP: indice de développement psychomoteur On sait que l’indice moyen pour la population de référence est égale à 100 (on connait mu)

Test sur échantillon unique À la main La statistique du test est: Il y a 56-1=55 ddl (on arrondit à 50) La lecture de la table donne: t0,05(50)=2,009 Conclusion: 2,452,009, donc on rejette H0 Avec SPSS Analyse-comparer les moyennes-test t pour échantillon unique Conclusion: 0,0170,05 donc on rejette H0 Test sur échantillon unique Valeur du test = 100 t ddl Sig. (bilatérale) Différence moyenne Intervalle de confiance 95% de la différence Inférieure Supérieure IDP 2,453 55 ,017 4,125 ,75 7,50 Probabilité associée à la statistique t 104,125-100 Expliquer avec un dessin au tableau pour le calcul à la main et la sortie SPSS Intervalle de confiance: On a une confiance égale à 0.95 que la vraie différence qui existe entre l’IDP de la population de référence et l’IDP de la population dont est tiré cet échantillon se situe entre 0.75 et 7.5 (la vraie différence ne varie pas, c’est l’intervalle qui varie d’un échantillon à l’autre). L’intervalle ne contient pas 0 ce qui est logique puisqu’on a rejeté H0 et conclu que les deux moyennes sont différentes. Interprétation: notre échantillon diffère de la population de référence

Page 704

Échantillons indépendants: Statistiques de l’échantillon: n1; X1, s1 Statistiques de la population N1; 1; 1 Échantillon 2 Statistiques de l’échantillon: n2; X2; s2 Statistiques de la population N2; 2; 2 Par exemple, pour un test non directionnel (bilatéral), les hypothèses peuvent être: Le nombre de degrés de liberté est alors: n1 + n2 - 2

Exemple 1: échantillons indépendants (page 201) L’hypothèse de recherche est que les deux groupes (homophobes et non homophobes) ont des niveaux d’excitation sexuelle semblables. Ici, les deux groupes sont constitués de sujets différents Exemple 1: deux groupes homophobes et non homophobes, variable mesure l’excitation sexuelle Les échantillons sont indépendants (ce ne sont pas les mêmes sujets) 1- On a une confiance égale à 0.95 que la vraie différence qui existe se situe entre 3.5 et 10.9 (la vraie différence ne varie pas, c’est l’intervalle qui varie d’un échantillon à l’autre). L’intervalle ne contient pas 0 ce qui est logique puisqu’on a rejeté H0 et conclu que les deux moyennes sont différentes. Exemple 2: DDL= 35 + 29 -2 = 62

Exemple 1 En moyenne, l’excitation sexuelle des homophobes est d’environ 7,5 pts supérieure à celle des non homophobes, avec une variation autour de la moyenne légèrement supérieure

Exemple 1 Le test de Levene vérifie si la variance des deux groupes est égale. Ici 0,534  0,05 donc on assume que les variances sont égales

Exemple 1 La probabilité associée à la statistique du test est égale à 0,016  0,05 donc on rejette H0 Le résultat indique une différence significative entre l’excitation sexuelle des homophobes (m=24,00, s= 12,20) et non homophobes (m=16,15, s=11,80). On conclut que la différence entre les moyennes n’est pas seulement due au hasard (t 0,05(62) = 2,48, p=0,016). erreur standard de la différence

Exemple 1 On a une confiance égale à 95% (ou 19 fois sur 20) que la vraie différence qui existe entre les deux moyennes des populations se situe entre 1,5 et 13,5 Attention: la vraie différence ne varie pas, c’est l’intervalle qui varie d’un échantillon à l’autre. L’intervalle ne contient pas 0 ce qui est logique puisqu’on a rejeté H0 et conclu que les deux moyennes sont différentes.

Échantillons appariés Sujet Mesure 1 Mesure 2 Différence d 1 45 38 7 2 35 37 -2 … n Par exemple, pour un test non directionnel, les hypothèses peuvent être: Le nombre de degrés de liberté est alors: n-1

Exemple 2: échantillons appariés (page 189) L’hypothèse de recherche est que les jeunes filles ont changé de poids entre les deux mesures (avant et après le traitement pour l’anorexie) Ici, les deux groupes sont donc constitués des mêmes sujets avec des mesures différentes L’hypothèse statistique est: Exemple 1: deux groupes Homophobes et non homophobes, variable mesure l’excitation sexuelle Les échantillons sont indépendants (ce ne sont pas les mêmes sujets) 1- On a une confiance égale à 0.95 que la vraie différence qui existe se situe entre 3.5 et 10.9 (la vraie différence ne varie pas, c’est l’intervalle qui varie d’un échantillon à l’autre). L’intervalle ne contient pas 0 ce qui est logique puisqu’on a rejeté H0 et conclu que les deux moyennes sont différentes. Exemple 2: traitement sur l’anorexie DDL= 17 – 1=16

Exemple 2 En moyenne, les jeunes filles ont pris 7 livres entre les deux mesures. Les valeurs sont un peu plus dispersées autour de la moyenne lors de la mesure après.

Exemple 2 On a une confiance égale à 95% (ou 19 fois sur 20) que la vraie différence moyenne se situe entre 3,6 et 10,9 La probabilité associée à la statistique du test est égale à 0,001  0,05 donc on rejette H0 On conclut que la différence entre les moyennes n’est pas égale à 0 et qu’il y a une augmentation de poids statistiquement significative à l’issue du traitement. On ne peut toutefois pas affirmer que c’est grâce au traitement. Le résultat nous montre qu’il y a eu une augmentation de poids statistiquement significative entre la première mesure – avant le traitement (m=83,23; s=5,02) et la seconde mesure – après le traitement (m=90,49; s=8,49), t0,05(16) = 4,18, p=0,001.

La robustesse du test T (p. 209) ETA-6505

Pensez à utiliser l’aide de SPSS ETA-6505