Cours 8 Les tests statistiques
Intervalle de confiance pour une proportion ● Dans le cas de grands échantillons (np>5 et n(1-p)>5 ) ● l'intervalle de confiance au niveau (1- ) est pour la proportion inconnue p : ● f=k/n ● ic (1- ) =]f-u (1- /2) /sqrt(f(1-f)/n) ; ● m+u (1- /2) /sqrt(f(1- f)/n)[ ● on utilise la fonction prop.test()
Exemple : k=121 n=241 prop.test(121,241) ; 1-sample proportions test with continuity correction data: 121 out of 241, null probability 0.5 X-squared = 0, df = 1, p-value = 1 alternative hypothesis: true p is not equal to percent confidence interval: sample estimates: p ●
Intervalles de confiance pour une moyenne, Dans le cas de grands échantillons ou de petits avec hypothèse de normalité, l'intervalle de confiance au niveau (1- ) est obtenu par : IC (1- ) =]m-t (1- /2) /sqrt(n) ; m+t (1- /2) /sqrt(n[ la fonction R correspondante est : t.test() exemple: A=iris[,1] ; t.test(A,conf.level=0,9)$conf.int [1] attr(,"conf.level") [1] 0.9
Dans le cas de petits echantillons, on fait un calcul exact, car nP suit une loi binomiale de paramètres n et p, on utilise la fonction binom.test() Exemple binom.test(121,241) data: 121 and 241 number of successes = 121, number of trials = 241, p-value = 1 alternative hypothesis: true probability of success is not equal to percent confidence interval: sample estimates: probability of success
Tableau récapitulatif
les test du chi-deux La fonction chisq.test(x,y,p) Premier exemple: on lance un dé 300 fois et on obtient le résultat suivant: x=c(43, 49, 56, 45, 66, 41) prob=rep(1/6,6) chisq.test(x,p=prob) Chi-squared test for given probabilities data: x X-squared = 8.96, df = 5, p-value =
Second exemple sur un tableau de contingence Exemple d ’un tableau donnant la cécité en fonction du sexe: tab=matrix(c(442,514,38,6),nrow=2,byrow=TRUE) colnames(tab)=c("homme","femme") rownames(tab)=c("voyant","aveugle") homme femme voyant aveugle 38 6
X2=chisq.test(tab,correct=FALSE) On teste s ’il y a une relation entre sexe et cécité (l ’hypothèse par défaut est celle d ’indépendance) Pearson's Chi-squared test data: tab X-squared = , df = 1, p-value = 1.894e-07
attributes(X2) $names [1] "statistic" "parameter" "p.value" "method" "data.name" "observed" [7] "expected" "residuals" $class [1] "htest » par exemple:
X2$expected homme femme voyant aveugle valeurs attendues sous hypothèse d ’indépendance X2$residuals homme femme voyant aveugle sum(X2$residuals^2) la somme des carrés des résidus est la valeur du chi-deux
Soit le tableau de contingence suivant: roux blond brun bleu marron le test du chi-deux d ’indépendance s ’effectue ainsi: chisq.test(m)
Pearson's Chi-squared test data: m X-squared = , df = 2, p-value = on teste l ’hypothèse nulle suivante « H0:il y a indépendance entre la couleur des yeux et celle des cheveux »
Test sur une moyenne: t.test() Pour comparer une moyenne à une valeur de référence (cas d'un échantillon) Le test Ho : m=m0 H : (m>m0 ou m<m0) Sous H0 la statistique de test est T= sqrt(n) (X -m0)/ et suit une loi de student à n- 1 ddl Mesure=IMC>30 t.test(mesure, mu=0,58,alternative = c("two.sided", "less", "greater"), conf.level = 0.95, correct = TRUE) Data mesure t=1,52 df=8 p-value=0,082 alternative hypothesis:true mean is different from 0,58 95 percent confidence interval 0,57 inf Sample estimates mean of x 0,6188
Tests du chi-deux