La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Tests de normalité Test de F Tests non paramétriques de comparaison de moyennes Dr Marc Cuggia UMR 936.

Présentations similaires


Présentation au sujet: "Tests de normalité Test de F Tests non paramétriques de comparaison de moyennes Dr Marc Cuggia UMR 936."— Transcription de la présentation:

1 Tests de normalité Test de F Tests non paramétriques de comparaison de moyennes Dr Marc Cuggia UMR 936

2 Rappel Comparaison de moyenne : Test de Z Condition : Effectifs supérieurs à 30 Si condition non remplie alors : Test de T (student) Conditions : Distributions des populations d'où sont issues les échantillons doivent être normale Tests de normalité (Test de Shapiro, Test de kolmogorov- smirnoff) Les variances des deux populations d'où sont issus les échantillons doivent être égales. (Leur rapport <3) Test d'homoscedasticité (test de F)

3 Et sinon ? Si Petit effectif et pas de normalité et/ou pas d'homoscedasiticité alors Tests non paramétriques Mann et witney Wilcoxon

4 Test de normalité Exemple : Tour de poitrines de soldats écossais en pouces Données :

5 Test de Kolmogorov-Smirnov Hypothèse Ho : La distribution étudiée est distribution normale H1 : La distribution étudiée nest pas normale Ici p lhypothèse Ho est rejettée : La distribution nest pas normale

6 Test de Shapiro en 9 étapes 1.Classer les diffrentes valeurs de la série par ordre croissant 2.Calculer S 2 tel que 3.Calculer m 4.Calculer les differences respectives tel que 5.d1=Xn-X1;d2=X(n-1)-X2 etc... dn 6.A chacune des differences, on affecte un coéfficient a, avec n nombre de difference 7.Calculer la quantité b tel que 8.Calculer le rapport W 9.Comparer W calculé à W tabulé avec le nombre n de données

7 SHAPIRO WILK La méthode développée par Shapiro-Wilk est dans bien des cas, la plus puissante, en particulier lorsque léchantillon provient dune distribution asymétrique. Cette méthode implique lemploi de tables, actuellement calculées pour une taille déchantillon comprise entre 5 et 50. (5 n 50) Comme dans tout autre test, il faudra déterminer à lavance un risque de rejeter lhypothèse nulle alors que celle-ci est vraie (α).

8 Étapes de réalisation du test de Shapiro-Wilk Étape 1 Classer les n observations par ordre de grandeur croissante : Étape 2 Calculer la Somme des Carrés des Écarts:

9 Étape 3 Calculer les différences : Si n est pair il y aura alors n/2 différences. Si n est impair il y aura alors (n-1)/2 différences, lobservation médiane ne sera pas utilisée.

10 Étape 4 Calculer : Les coefficients ai sont donnés dans une table en fonction de n et i.

11 Étape 5 Calculer :

12 Étape 6 Comparer W à W 1-α,n W 1-α,n est trouvé dans la table de Shapiro-Wilk en fonction du risque derreur α et de la taille de léchantillon (le nombre dobservations) n On peut écrire P() = 1- α Finalement, si W < W 1-α,n la distribution ne suit pas une loi normale si W W 1-α,n la distribution suit une loi normale

13 exercice Exemple : On a fait des essais de fatigue sur un certain biomatériau utilisé dans les prothèses dépaule (nombre de cycles avant rupture) et on a obtenu la série suivante : 31, 39, 62, 89, 115, 125, 140, 225, 251, 270, 342, 400, 442, 580, 850. Peut-on conclure avec un risque derreur de 5% (niveau de confiance 95%) que ces données proviennent dune distribution suivant une loi normale?

14 Étape 1 : On place les données en ordre croissant : 31, 39, 62, 89, 115, 125, 140, 225, 251, 270, 342, 400, 442, 580, 850

15 Étape 2 : On calcule la somme des carrés des écarts

16 Étape 3 : On calcule les différences di

17 Étape 4 : On calcule la valeur de b Pour ce calcul nous avons besoins des coefficients ai de la table Shapiro-Wilk pour n = 15.

18 Étape 5 : On calcule

19 Étape 6 : On compare W à W1-α,n Avec α=5% et n = 15 on trouvera dans la table le W 95%,15 = 0,881 Puisque 0,876<0,881 on a donc W < W 1-α,n et par le fait même, la distribution ne suit pas une loi normale avec un risque derreur de 5%.

20 Exercice à faire 1,08 7,68 8,28 8,23 7,63 11,74 10,30 11,72 12,87 9,02

21 No1 Oui la distribution de la quantité de minéraux suit une loi normale W=0,9278

22

23

24 Au travail : Soit l'échantillon suivant. Déterminez grace à la méthode de shapiro si la population d'où est issu l'échantillon est normale. Patient Glycémie 2 1,7 2,5 3 2,3 4

25 Test de comparaison des variances test de F test de fisher snedecor

26 Test dégalité des variances Test de Fisher-Senecor Utilisé pour comparer les variances de 2 séries de variable quantitatives Lorsquon veut vérifier les conditions dapplications de certains tests paramétriques qui exigent une HOMOSEDASTICITE Variables :quantitatives Paramètre:variances Tailles des échantillons :indifférentes Séries étudiées :indépendantes Ho : σ 2 1 = σ 2 2 H1 : bilateral σ 2 1 =/= σ 2 2 ET unilateralσ 2 1 > σ 2 2 ou σ 2 1 <σ 2 2 Avec σ 2 1 et σ 2 2 les variances des deux populations dont sont issus les échantillons s 2 1 et s 2 2 : les variances des deux échantillons à comparer n 1 et n 2 les effectifs des deux échantillons k1 et k2 : les degrés de libertés pour chaque échantillons Conditions dapplications : les distributions doivent être normales dans les deux populations doù proviennent les deux échantillons

27 Principe du test : on teste le rapport F des deux variances s 2 1 et s 2 2, en nommant la s 2 1 la variance la plus élevée. Sous lhypothèse nulle, ce rapport F est peut different de 1 et les fluctuations déchantillonage suivent une loi de Fisher.

28 H1FRejet HoInterprétation bilatérale= F 2,5% Oui σ 2 1 diffère significativement de σ 2 2 unilatérale= F 5% OuiUne variance des deux séries est significativement proportionnellement plus grande à lautre

29 On désire comparer la PAD dun groupe de sujets sains (m=70,1) et dune groupe de sujets atteints de drépanocytose (m=61,8). On dispose que de 20 individus par groupe. La variance de la PAD est respectivement de 116,7 et de 47,6. Peut on comparer ces moyennes ?

30 En raison du faible effectif des groupe, on réalise un test de T. Ce test nécessite une homoscédasticité des populations à comparer. On test légalité des variances avec un test de F Ho : les 2 variances ne sont pas différentes H 1 : les deux variances diffèrent. F=116,7/47,6 = 2,45 avec k 1 =k 2 =20-1=19 On lit la table F 2,5% : elle ne donne pas la valeur pour 19 mais pour 20 (F 2,5% =2,46). La valeur de F trouvée est inférieure à ce seuil: On ne rejette pas Ho, et on admet que les variances sont identiques. On peut donc réaliser un test de student

31

32 Test non paramétriques Test de Mann Whitney : Utilisé pour comparer deux séries indépendantes ou appariées dune variables quantitative On ne sintéresse pas aux valeurs mais aux rangs des valeurs après les avoir ordonnées Le test ne nécessite aucune condition dapplication,

33 Le test de et Mann-Whitney (ou test U) séries indépendantes Variables :quantitatives Grandeur étudiées:rangs des valeurs Séries étudiées :indépendantes Ho : Distributions superposées H1 : bilatérale : distributions décalées Unilatérale : distributions décalées dans un sens ou dans un autre Nota : pour les séries appariées, on utilise le test de wilcoxon

34 Étapes du test : Détermination du rang des valeurs Il faut classer toutes les observations des deux séries selon leurs valeurs, de la première à la nième, et numéroter leurs valeurs. Cela définit le rang de chaque observation Lorsque deux valeurs sont identiques, on calcule leur rang moyen ex-aequo Calculer w1 = somme des rangs dune série (la plus courte) Calculer la somme attendue des rangs w a = n1(N+1)/2 Calculer la variance de w1 s w1 2 =n 1 n 2 (N+1)/12 Calculer -

35 H1ZRejet HoInterprétation bilatérale<1,96NonLes distribution ne sont pas significativement décalées >=1,96OuiLes distribution sont significativement décalées unilatérale<1,65NonLes distribution ne sont pas significativement décalées >1,65OuiLes distributions sont décalées dans un sens donné

36

37

38

39

40

41

42 Réferences Thierry Ancelle. Statistique – Epidémiologie chez Maloine Jean Bouyer : Méthodes statistiques : médecine-biologie chez ESTEM


Télécharger ppt "Tests de normalité Test de F Tests non paramétriques de comparaison de moyennes Dr Marc Cuggia UMR 936."

Présentations similaires


Annonces Google