Test 2
Quand utilise-t-on le 2 On a deux variables quantitatives. On cherche s’il y a un lien entre les 2 variables
Problème Autre formulation : Garçons ou filles : qui réussi le mieux au bac ? Cigarette et cancer : y a t il un lien ? Prévention routière : moins d’accident chez les verbalisés ? Autre formulation : Y a t il un lien entre sexe et réussite au bac ? Y a t il un lien entre cancer et cigarette ? Y a t il un lien entre accident et verbalisation ?
1. H0 H0 : il n’y a pas de lien entre la variable sexe et la variable résultat.
2. Mesures Données brutes Tableau des effectifs Tableau croisé
VB or not vB ? This is the question Différence énorme On rejette H0 Pas de différence H0 n’est pas rejetable Variabilité biologique ? Différence significative ? Dans notre lycée :
Problème On veut un indice qui reflète les disparités de notre tableau. On veut qu’il soit grand pour et petit pour :
Solution : 2 Pour le calculer : Tableau des effectifs observés (tableau croisé) Tableau des effectifs attendus Tableau des écarts Tableau des écarts au carré et pondérés 2
2 : Calcul
T1 : Effectifs observés
total colonne x total ligne T2 : Effectifs attendus total colonne x total ligne total général Pour chaque case : effectif attendu = Totaux Calcul par case Résultats
Tableau des écarts bruts T3 : Écarts bruts Pour chaque case : écart brut = effectifs observés – effectifs attendus – Effectifs observés Effectifs attendus = Tableau des écarts bruts
T4 : Écarts au carré et pondérés Pour chaque case : Écart au carré pondéré = (écart brut)2 effectif attendu
Final : 2 Le 2 est la somme des écarts au carré pondérés 2 = (Écart au carré pondéré) 2 =0,035+0,015+0,009+0,004=0,63
Généralisation Y a t il un lien entre couleur des yeux et des cheveux ? H0 : il n’y a pas de lien entre la couleur des yeux et celle des cheveux
T1 : Effectifs observés
total colonne x total ligne T2 : Effectifs attendus total colonne x total ligne total général Pour chaque case : effectif attendus =
Tableau des écarts bruts T3 : Écarts bruts Pour chaque case : écart brut = effectif observé – effectif attendu – Effectifs observés Effectifs attendus = Tableau des écarts bruts
T4 : Écarts au carré et pondérés Pour chaque case : Ecart au carré pondéré = (écart brut)2 effectif attendu
Final : 2 2 = (écart au carré pondéré) 2 = 5,11+1,69+2,66+0,01+ 0,96+0,33+0,52+0,01+ 2,07+0,66+1,04+0,00 = 15,05
(effectifs observés – effectifs théoriques)2 2 en bref 2Obs = (effectifs observés – effectifs théoriques)2 effectif théorique
2 : DDL
Problème Quand un 2 est-il grand ? 2=2,6 2=5,3
DDL=(Nombre de colonnes-1)x(Nombre de lignes-1) DDL=Degrés de liberté DDL=(Nombre de colonnes-1)x(Nombre de lignes-1) DDL = (2-1)x(2-1) = 1 DDL=(4-1)x(3-1) = 6
4. Probabilité R : chisq.test(effectifs Observés) 2=2,6 DDL=1 p=0,11 2=5,3 DDL=6 p=0,51
5. Conclusion Il n’y a pas de lien entre Sexe et Réussite Sexe / Réussite : 2Obs=0,63 et DDL=1 P=0.11 On ne peut pas rejeter H0, Il n’y a pas de lien entre Sexe et Réussite C. Cheveux / C. Yeux : 2Obs=15,05 et DDL=6 P=0,0167 On peut rejeter H0, Il y a un lien entre C. Cheveux et C. Yeux >5% <5%
Interprétation
Pourquoi un 2 EST-il Grand ? Écarts au carré pondérés Parce que Blond / Bleus = 5,11 et que Noir / Bleus = 2,66 Ces deux cases « apportent » beaucoup au 2
Écarts au carré pondérés Sous / sur représenté Écarts au carré pondérés Écarts Cases qui apportent beaucoup : Sur le tableau des écarts au carré pondéré Apport positif ou négatifs ? Sur le tableau des écarts, Blonds / Bleus = + 9 : il y en a beaucoup. On dit qu’ils sont sur-représentés Sur le tableau des écarts, Noirs / Bleus = - 4,5 : il en manque beaucoup. sous-représentés