Tests non paramétriques Situation du problème : Les tests utilisés précédemment, utilisent des hypothèses sur les distributions et nécessitent des calculs qui peuvent être longs. On qualifie de non paramétriques les méthodes statistiques qui sont applicables dans des conditions générales quant aux distributions des populations parents : “distribution free”. Deux cas sont examinés : Application à 2 échantillons indépendants Application à 2 échantillons appariés
Test de rang pour 2 échantillons indépendants : U de Mann et Withney Hypothèses : Hypothèse nulle : Identité des 2 distributions Hypothèse alternative : Différence des 2 distributions. Méthode : La réalisation du test est basée sur le classement des observations par ordre croissant, la détermination du rang de chacune d’elle et le calcul de la somme des rangs de l’échantillon qui est la plus petite. Effectifs des 2 échantillons N1 et N2 Somme des rangs Y1 et Y2 on a : Y1+Y2 = (N1+N2)*(N1+2+1)/2 Si les deux échantillons proviennent de la même population, on doit s’attendre à ce que Y1 et Y2 soient proportionnels aux effectifs N1 et N2. Décision : N1 et N2 < 20 : On rejette H0 quand la valeur calculée est inférieure à celle lue dans la table de Mann et Withney. Transformation en variable normale centrée réduite
U de Mann et Withney : transformation Transformation en variable centrée réduite : Quand les effectifs sont grands : Y = somme des rang du groupe de plus petit effectif u = |Y - N1 * ( N1 + N2 +1)/2| (N1 * N2)*( N1 + N2 +1) 12 u est comparé à ualpha lu dans la table de la loi normale. Si u > ualpha on rejette H0.
Conditions d’application Ne pas avoir trop d’ex-aequo. On affecte aux ex-aequo, qui se présentent simultanément dans les 2 échantillons, le rang moyen. Exemple : Comparaison des vitesses de sédimentation dans deux groupes de patients.
Exemple suite Décision : U = 173,5 N1 = 13 N2 = 14 Dans la table : Dans un premier temps on trie les valeurs des 2 échantillons par ordre croissant. Puis on affecte les rangs (attention aux ex-aequo : on prend le rang moyen quand ils appartiennent simultanément aux 2 groupes) Enfin on calcule la plus petite somme des rangs : U = 173,5 N1 = 13 N2 = 14 Décision : Dans la table : U 5% pour N1 = 13 (le plus petit) et N2-N1 = 1 on lit 50 On U > U 5% : on accepte H0 Approximation normale : 204,5 - (13)(28)/2 = 1,09 ce qui est < 1, 96 => on accepte H0 u = (13)(14)(28)/12
Test de rang pour 2 échantillons appariés : T de Wilcoxon Situation : Séries appariés Hypothèse : H0 : Moyenne des différences = 0 H1 : différence Méthode On considère les différences non nulles On calcule les différences signées On calcule les rangs sur les valeurs absolues des différences. On attribue au rang le signe de la différence On calcule la somme des rangs des différences + (Y+) et celles des rangs des différences - (Y-) Si H0 est vraie on a Y+ = Y- = N(N+1)4 Décision : On rejette H0 quand la valeur calculée est inférieure à celle lue dans la table de T de Wilcoxon Transformation en variable normale centrée réduite : |Y+ - N * ( N +1)/4| u = N*( N +1)*( 2N +1) 24