TESTS NON PARAMETRIQUES Un rang de données? 2. Test exact de comparaison de 2 moyennes 3. Test de Wilcoxon-Mann-Whitney 4. Autres tests sur un rang de données
Introduction Tests paramétriques : postulats sur la famille de distribution dont est tiré l’échantillon tests non paramétriques : certaines variables échappent à ces hypothèses de par leur nature (qualitatives nominales ou ordinales) : transformation en variables ordinales => perte d’information = de puissance => gain de robustesse (moins d’influence des valeurs extremes) Vaste développement permis par l’informatique (tests de permutation)
Efficacité d’un test non paramétrique Par rapport à un test paramétrique correspondant Dépend de n, de D, de la distribution de Y test U / test t : test de Kruskal-Wallis / ANOVA 1 :
Notion de rang de données? * Plantes parasitées / non parasitées plants parasités à gauche? * Structure d’un brin ADN AAA TAA GCC TC… * Nombre d’œufs pondus par une guêpe parasite Hote à J0 : 61 - 63 - 84 - 75 - 95 Hote à J6 : 105 - 123 - 83 - 98 - 102 - 110 A au début? J0 < J6 ?
Notion de rang de données? 11101100000 AAABAABBBBB 61 63 75 83 84 95 98 102 105 110 123 J0 J0 J0 J6 J0 J0 J6 J6 J6 J6 J6 Ha : points marqués à une extrémité H0 : distribution aléatoire des points marqués
Test exact de comparaison de 2 moyennes Choix de M = 5 positions parmi 11 : Points = rangs Statistique : somme des rangs SR Distribution de SR sous Ho : * Nombre de choix possibles pour 5 points parmi 11:
Distribution de SR Points marqués SR P(SR = x) P(SR ≤ x) 1,2,3,4,5 15 1/462 1/462 1,2,3,4,6 16 1/462 2/462 1,2,3,4,7 17 1,2,3,5,6 ‘’ 2/462 4/462 1,2,3,4,8 18 1,2,3,5,7 ‘’ 1,2,4,5,6 ‘’ 3/462 7/462 1,2,3,4,9 19 1,2,3,5,8 ‘’ 1,2,3,6,7 ‘’ 1,2,4,5,7 ‘’ 1,3,4,5,6 ‘’ 5/462 12/462 … > 0,025
Test exact Test bilatéral, a = 0,05 Sous Ho : SR appartient à [19,41] 0,025 0,95 f (SR) Test bilatéral, a = 0,05 Sous Ho : SR appartient à [19,41] Ici : SR = 17 : Ho rejetée * plants parasités à G * A au début de la séquence * J0 : ponte inférieure à J6
Test de Mann-Whitney-Wilcoxon A. Test de Wilcoxon Un rang de M points marqués (A) parmi N (A+B) Ho : distribution aléatoire des points marqués Ha : points marqués à G (SR petite) ou à D (SR grande) Si M ou N-M < 10, distribution de SR sous Ho = tables Si M et N-M ≥ 10, SR suit une loi normale : Soit :
Correction pour ex-aequos Test de Mann-Whitney-Wilcoxon A. Test de Wilcoxon Correction pour ex-aequos Rang = rang moyen Ex : 2 4 6 6 7 1 2 3 3 5 1 2 3,5 3,5 5 e = nombre de groupe d’ex-aequos (AA - AB - BB) ui = nombre d’ex-aequos dans le ième groupe : V(SR) devient :
B. Test U de Mann-Whitney Test de Mann-Whitney-Wilcoxon B. Test U de Mann-Whitney Ex : AAABAABBBBB SR(A) = 1+2+3+5+6 = 17 U(A) = 0+0+0+1+1 = 2 SR « trop faible » = U « trop faible » Tables : Useuil tel que Uobs < Useuil => Ho rejetée Faire le test sur le U minimal
Test de Mann-Whitney-Wilcoxon B. Test U de Mann-Whitney Exemple A : M = 5 B : N-M = 6 m=5 n=6 Avec Uobs = 2 test bilatéral, a = 0,05 : Useuil = 3 : Ho rejetée En pratique : - M et N-M ≥ 10 : Wilcoxon - M ou N-M < 10 : Mann-Whitney
Autres tests sur un rang de données A. Nombre de suites Wilcoxon-Mann-Whitney : sous Ha : ou Ha = autocorrélation Statistique : NS = nombre de séquences homogènes Ex : CAG AAA TAC AAG CAT GGA AGC TTC GCA TGC N = 30, M = 11, NS = 15
Autres tests sur un rang de données A. Nombre de suites Sous Ho, si M et N-M ≥ 10 : NS « trop petit » : autocorrélation ; agrégation (NS « trop grand » : autocorrélation négative) Exemple : NS* = -1,98 = 0,05 : Ho rejetée, agrégation des A
Autres tests sur un rang de données B. Variance des rangs Statistique : VR = SCE entre rangs marqués et rang moyen (N+1)/2 Sous Ho, si M et N-M ≥ 10 : Sous Ha : VR « trop petite » : VR « trop grande » : groupement des points marqués au centre groupement des points marqués aux 2 extrémités Exemple : VR* = -0,28 : Ho acceptée
Autres tests sur un rang de données C. La plus longue suite Statistique : LS = longueur de la plus longue suite Sous Ho : P(LS > LS observée) Sous Ha : Existence d’un regroupement Exemple : LS(A) = 3, P(LS(A) ≥ 3) = 0,556 : Ho acceptée LS(B) = 7, P(LS(B) ≥ 7) = 0,257 : Ho acceptée
Conclusion Statistique faible moyenne élevée SR/U VR LS Ho : distribution aléatoire des 2 couleurs dans le rang Exemple : CAG AAA TAC AAG CAT GGA AGC TTC GCA TGC SR faible : A à gauche NS faible : agrégation