L’inférence statistique
? Résumé R Inférence Tendances centrales (mode, médiane, moyenne) Variabilités (é-t, var) Tendances centrales (mode, médiane, moyenne) R Inférence
Plan Définition Formulation d’hypothèses Prise de décision Distribution d’échantillonnage moyen Test de signification Intervalles de confiance
Inférence statistique Définition de l’inférence: généralisation d’un échantillon à une population. 2 cas: Est-ce qu’un échantillon observé appartient à une population « hypothétique » Est-ce que les observations de 2 groupes de sujets représentes des échantillons d’une même population ou de deux populations différentes
Inférence statistique Première possibilité x ? Inférence
Inférence statistique Deuxième possibilité x ? Inférence
Formulation d’hypothèses 1 2 On test H0
Prise de décision À partir des échantillons on décide de rejeter ou non l’hypothèse nulle. En faisant de l’inférence, on n’est jamais certains de prendre la bonne décision Population Échantillon Décision Identique Différente Bonne Erreur 2 Erreur 1
Prise de décision 2 Erreurs: 1 - Inférer que 2 groupes font partie de 2 populations différentes alors qu’en réalité elles font partie de la même population. On rejette H0 alors que H0 est vraie. 2 – Inférer que 2 groupes font partie de la même population alors qu’en réalité elles font partie de populations différentes. On accepte H0 alors que H0 est fausse. Population Échantillon Décision Identique Différente Bonne Erreur 2 Erreur 1
Distribution d’échantillonnage moyen 1- inférence à propos de la moyenne de la population Distribution d’échantillonnage moyen Échantillons (n) Distribution d’échantillonnage moyen Population
Distribution d’échantillonnage moyen Caractéristiques: Elle se distribuera selon une courbe normale Elle aura une moyenne égale à celle de la population Elle aura un écart-type égal à la celui de la population divisé par la racine carré de la grandeur de l’échantillon. Plus l’échantillon est grand, moins on risque de faire une erreur en inférant la valeur de la moyenne de la population à partir d’un échantillon.
Distribution d’échantillonnage moyen Échantillons Distribution d’échantillonnage moyen Population
Distribution d’échantillonnage moyen Échantillons Distribution d’échantillonnage moyen Population
Distribution d’échantillonnage moyen Échantillons Distribution d’échantillonnage moyen Population
Distribution d’échantillonnage moyen Échantillons Distribution d’échantillonnage moyen Population
(Basée sur des expériences antérieures) Test de signification Si on présuppose que l’hypothèse nulle est vraie, quelle est la probabilité d’obtenir une moyenne d’échantillonnage aussi grande que celle observée ? Si c’est peu probable on rejette H0, sinon on conserve H0. Peu probable: 5% ou 1% (convention) = a = seuil de signification 2 possibilités Ho conservée Ho rejetée Si a = 0.05, za = ? 1- Unicaudale (Basée sur des expériences antérieures)
Règle de décision Si on assume que l’hypothèse nulle est vraie, quelle est la probabilité d’obtenir une moyenne d’échantillonnage aussi grande que celle observée ? Si c’est peu probable on rejette H0, sinon on conserve H0. Peu probable: 5% ou 1% (convention) = a = seuil de signification Ho conservée Ho rejetée On conserve H0 On rejette H0
Test de signification Exemple H0: m = 72 H1: m < 72 (basée sur des expériences antérieures) a = 0.05 (5%) s = 9 = 65 n = 36
Test de signification 2- bicaudale Si a = 0.05, za = ? (par défaut) Ho conservée Ho rejetée Ho rejetée Si a = 0.05, za = ?
Test de signification Exemple 2 H0: m = 72 H1: m 72 (par défaut) = 68 n = 36
Intervalles de confiance On n’est jamais certains que la moyenne tirée de notre échantillon est exactement la véritable moyenne de la population. Donc, au lieu de donnée uniquement la moyenne, il existe une façon de quantifier notre degré de certitude voulue en spécifiant un intervalle aux alentours de la moyenne.
Intervalles de confiance Exemple: IC = 95% = 50,7 n = 100 s = 20
Intervalles de confiance Exemple: IC = 99% = 50,7 n = 100 s = 20
Relation entre le test d’hypothèse et les intervalles de confiance
Distribution d’échantillonnage moyen 2- inférence à propos de la différence entre des moyennes de la population Distribution d’échantillonnage des différences entre les moyennes Échantillons (n) Distribution d’échantillonnage moyen Population
Distribution d’échantillonnage des différences entre les moyennes Caractéristiques: Elle se distribuera selon une courbe normale Elle aura une moyenne égale à 0 (m1-m2=0) Elle aura un écart-type égal à :
Règle de décision Ho conservée Ho rejetée On conserve H0 On rejette H0
Test de signification Exemple: probabilité d’observer la différence entre les groupes suivants ? H0: m1 = m2 (m1 - m2 = 0) H1: m1 m2 (m1 - m2 0) a = 0.05 (5%) = 50 s1 = 5 n1 = 36 = 48 s2 = 5 n2 = 36
Test de signification Exemple: probabilité d’observer la différence entre les groupes suivants ? H0: m1 = m2 (m1 - m2 = 0) H1: m1 m2 (m1 - m2 0) a = 0.05 (5%) = 50 s1 = 5 n1 = 36 = 48 s2 = 5 n2 = 36
Intervalles de confiance
Test de signification Exemple: Intervalle de confiance à 95% H0: m1 = m2 (m1 - m2 = 0) H1: m1 m2 (m1 - m2 0) a = 0.05 (5%) = 50 s1 = 5 n1 = 36 = 48 s2 = 5 n2 = 36
Test de signification Exemple: Intervalle de confiance à 95% H0: m1 = m2 (m1 - m2 = 0) H1: m1 m2 (m1 - m2 0) a = 0.05 (5%) = 50 s1 = 5 n1 = 36 = 48 s2 = 5 n2 = 36