La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Tests de comparaison de moyennes Dr Marc CUGGIA PACES 2013-2014.

Présentations similaires


Présentation au sujet: "Tests de comparaison de moyennes Dr Marc CUGGIA PACES 2013-2014."— Transcription de la présentation:

1 Tests de comparaison de moyennes Dr Marc CUGGIA PACES

2 Comparaison dune moyenne observée à une moyenne théorique (ou donnée) Soit un échantillon E de taille n, tirée dune population inconnue P de moyenne μ p sur lequel on a mesuré une variable quantitative de moyenne m et de variance s 2 e Soit une population P de référence, dans laquelle la moyenne pour cette variable quantitative est connue (μ P ) Problème posé : Léchantillon E provient il de la population P ? Y a t il une différence significative entre la moyenne m mesurée sur léchantillon (tirée de P) et μ P ?

3 2 hypothèses : Ho : (hypothèse nulle) –léchantillon provient de la population P –les deux populations étudiées P et celle inconnue sont les mêmes –μ P =μ P H1 : (hypothèse alternative) –Léchantillon provient dune population P différente de P –les deux populations P et P sont différentes –μ P μ P Comparaison dune moyenne observée à un moyenne théorique (ou donnée)

4 Le choix entre les 2 hypothèses se résout par un test statistique. Le test seffectue en plusieurs étapes : 1.On définie Ho et H1 2.On calcule un certain indicateur U, exprimant lécart des moyennes, et dont on connaît la distribution sous Ho 3.On choisit un seuil de probabilité (ou un risque) pour le test statistique : en général α=5% ou α=1% –α est le risque de rejeter Ho à tord (cad que Ho est en fait vrai) Comparaison dune moyenne observée à un moyenne théorique (ou donnée)

5 4. On cherche dans la table de la distribution du paramètre choisi la valeur pour le risque α. ex : U α =1,96 si α=5% veut dire que du seul fait du hasard, IUI a moins de 5 chances sur 100 dêtre > à 1,96

6 5. On compare lindicateur calculé à lindicateur donné (par ex la moyenne) par la table adéquate : 2 situations Si I indicateur calculé I indicateur tabulé on rejette Ho, et on accepte H1 car on sait que du seul fait du hasard, lindicateur calculé a une probabilité < α datteindre lindicateur tabulé On rejette Ho au risque α choisi (Ho est fausse au risque α) Si I indicateur calculé I < indicateur tabulé on accepte Ho On ne dit jamais que Ho est vraie On dit « on ne peut pas rejetter Ho », ou on ne met pas en évidence de différence significative entre μ P et μ P

7 comparaison de moyennes Cas des grands échantillons (n30) On utilise en premier lieu le test de Z on sait sous Ho, on fixe α α=5% Z α =1,96 α=1% Z α =2,57 Si IZoI1,96 On rejette Ho au risque α choisi On conclut quil existe une différence significative entre μ P et μ P IZoI<1,96 on ne met pas en évidence de différence significative entre μ P et μ P Z~N(0;1)

8 Petits échantillons (n<30) et P est normale Dans ce cas, compte tenu du faible effectif de léchantillon, les conditions dapplications ne sont pas respectées. Il est alors nécessaire de supposer que la distribution de la variable étudiée suit une loi normale et que la variance inconnue (σ P ) soit égale à σ P (on dit quil existe une égalité des variances ou une homoscedasticité entres les 2 populations)

9 Petits échantillons (n<30) et P est normale Si ces 2 conditions sont réunies, sous Ho, lindicateur calculé est t suit une loi de Student à (n-1) ddl on calcule t o On cherche dans la table de student le t tabulé à (n-1) ddl pour le risque α chosi On compare t o à t tabulé si It o It tabulé on rejette Ho il nexiste pas de difference significative au seuil α entre si It o I < t tabulé on ne peut pas rejeter Ho. On ne met pas en évidence de différence significative entre μ P et μ P au seuil α choisi

10 Petits échantillons (n<30) et P est normale : exercice Le temps de réaction moyen dun animal à un certain stimulus est μ=23,7s On mesure les temps de réaction chez 100 souris par un traitement médicamenteux X On trouve : m=22,9s, et s 2 =13,98s 2 La drogue X modifie-t-elle le temps de réaction ? Même question si leffectif est de 16 souris 1)on calcule zo sous Ho les hypothèses sont : Ho = Léchantillon des 100 souris provient dune population P identique à la population P (la drogue ne semble donc pas modifier les temps de réactions) H1= Léchantillon est tirée dune population P différente de la population P. Le fait de donner le traitement X semble modifier les temps de réactions

11 Le test Z est choisi car comparaison de moyenne à une moyenne théorique et grand échantillon (n=100) Z tabulé= Z α=5% =1,96 Z o >Z tabulé on rejette Ho au risque 5% « au seuil 5%, le traitement X modifie es temps de réaction au stimulus »

12 exemple Cas où n=16 Petit échantillon test t de student Ho et H1 idem t α=5%;ddl=15 =2,13 It o I

13 Zone de rejet dHo Zone de non rejet dHo

14 Comparaison de moyennes observées sur deux échantillons indépendants On dispose de deux échantillons E 1 et E 2 tirés de deux populations (P1 et P2) de moyennes et de variances inconnues (μ 1; σ 1 ) et (μ 2; σ 2 ) Le pb posé est de savoir si les deux échantillons proviennent de deux population similaires ou différentes? Y-a-t il une différence significative entre les moyennes des deux populations ? P1 μ 1 ? σ 1 ? P1 μ 1 ? σ 1 ? P2 μ 2 ? σ 2 ? P2 μ 2 ? σ 2 ? m1s1n1m1s1n1 E1E1 m2s2n2m2s2n2 E2E2

15 Comparaison des moyennes observées sur deux échantillons indépendants : Grands échantillons (n1 et n2 >=30) Ho : –Les deux échantillons proviennent de la même population –P1 et P2 sont identiques –Il ny pas de différence significative entre les moyennes des deux populations P1 et P2 H1 : Les deux échantillons proviennent de deux populations différentes

16 Comparaison des moyennes observées sur deux échantillons indépendants : Grands échantillons (n1 et n2 >=30) Choix du test Z de comparaison de moyennes sur deux échantillons indépendants Z tabulé= Z α=5% =1,96 Comparer IzoI à Z tabulé Si IZoI1,96 On rejette Ho au risque α choisi On conclut quil existe une différence significative entre μ P1 et μ P2 IZoI<1,96 on ne met pas en évidence de différence significative entre μ P1 et μ P2

17 Comparaison des moyennes observées sur deux échantillons indépendants : Grands échantillons (n 1 et n 2 >=30) - Exercice Poids des nouveau nés mesurés dans une maternité Comparaison entre les moyennes des poids des NN filles et garçons Question : à partir de deux échantillons, peut on déduire une différence significative en général des poids des NN selon le sexe ?

18 Garcons:n1=41m1=3,4kgs1=0,385 kg Filles:n2=65m2=3,36kgs2=0,363 kg Peut on déduire une différence de poids significative entre ces 2 populations ? Ho:pas de différence H1: il existe une différence z o =0,54 Z tabulé= Z α=5% =1,96 Z o

19 Comparaison des moyennes observées sur deux échantillons indépendants : petits échantillons (n1 ou n2 < 30) Les tests utilisés sont fonction de deux conditions dapplications –La normalité de la distribution de la variable étudiée dans la population dorigine –légalité des variances des populations (homocedasticité) Test de mann whitney test T de Student test de Cochran Normalité ? test Kolmogorov Smirnoff égalité des variances Test F de Snedecor non oui

20 Comparaison des variances Les variances σ 2 1 et σ 2 2 des deux populations étudiées sont inconnues On les estime à partir des échantillons en calculant s 2 1 et s 2 2 On les compare avec un test de F de snedecor Lindicateur calculé est Ho : égalité des variances H1 : inégalité des variances Sous Ho, F suit une loi de distribution qui est tabulée en fonction de α,ν 1 et ν 2 ν 1 degrés de liberté de la variance du numérateur= taille de léchantillon le plus grand -1 ν 2 degrés de liberté de la variance au dénominateur= taille de léchantillon le plus petit -1

21 Comparaison des variances Par construction, on lit la valeur seuil en bilateral sur une table de F au risque de 2,5% Si Fc

22 Test t de student Pour effectuer le test t, on estime la variance commune s 2 de la population par : Sous Ho, les 2 échantillons de moyennes m 1 et m 2 proviennent dune même population de moyenne μ ou il nexiste pas de différence significative entre les moyennes des 2 populations Sous H1, les 2 échantillons proviennent de 2 populations différentes

23 to suit une loi de student à n1+n2-2 ddl

24 pour un risque α donné on va chercher la valeur de t α à n1+n2-2 ddl on compare to avec t α si ItoI>t α, on rejette Ho et lon conclut quil existe une différence significative au seuil α entre les 2 moyennes si ItoI

25 Test de mann whitney test T de Student test de Cochran Normalité ? test Kolmogorov Smirnoff égalité des variances Test F de Snedecor non oui

26 test de Mann et Whitney Utilisé lors que la distribution nest pas normale ou inconnue Test non paramétrique La comparaison ne seffectue pas sur la variable elle-même Mais sur les rangs des valeurs Après avoir classé les valeurs prises par la variable par ordre croissant ou décroissant

27 test « tout terrain » utilisable quelque soit la nature de la distribution test non paramétrique car ne fait appel à aucun des paramètres de la distribution (ex m ou σ 2 )

28 exemple On souhaite comparer les notes obtenues à un test psychomoteurs par des patients atteints de la maladie A et B On classe lensemble des notes par valeurs croissants maladie A (n A =7) maladie B (n B =5) maladie A (n A =7) maladie B (n B =5) RANGS123,

29 Ici il y des rangs ex-equo On effectue les calculs intermédiaires suivants T A =Σ Rang A =3, =59,5 T B =Σ rang B =1+2+3,5+5+7=18,5 Puis les statistiques U A et U B

30 exemple On souhaite comparer les notes obtenues à un test psychomoteurs par des patients atteints de la maladie A et B On classe lensemble des notes par valeurs croissants maladie A (n A =7) maladie B (n B =5) maladie A (n A =7) maladie B (n B =5) RANGS123,

31 exemple On souhaite comparer les notes obtenues à un test psychomoteurs par des patients atteints de la maladie A et B On classe lensemble des notes par valeurs croissants maladie A (n A =7) maladie B (n B =5) maladie A (n A =7) maladie B (n B =5) RANGS123,

32 on détermine la statistique U de mann & Whitney Situation 1 : si n A ou n B < 10 Uo=min (U A,U B ) que lon compare aux valeurs de la table Sous Ho, les 2 échantillons proviennent dune même population la table donne les valeurs de U tel que Proba(UoU table )=α (attention !!!)

33

34 pour lire U table il faut déterminer m et n tels que m=max(n a,n b ) n=min(n a,n b ) on lit Utable à lintersection de m-n et n si min(U A,U B )U table on accepte Ho attention ici m nest pas une moyenne !!!

35 Ici U A =3,5 m=7 n=5 m-n=2 α=5% U table =5 U A

36 Situation 2 : n A et n B 10 U A et U B suivent une distribution normale de On compare Uo à la valeur de la table de la loi normale au risque α UoUtabulé on rejette Ho et on accepte H1

37 Mann & Whitney Cas sans ex-aequo En cas de non ex-aequo on peut calculer directement U A et U B (plus rapide) On détermine –U AB le nombre nombre de fois où une valeur de rang du groupe B précède une valeur du groupe A –U BA le nombre nombre de fois où une valeur de rang du groupe A précède une valeur du groupe B

38 A B Rang U AB = = 8 U BA = = 22 Equivalent à Seulement si pas dex aequo

39 Comparaison de moyennes de séries appariées Situation ou lon veut comparer des données de 2 échantillons qui sont « liés » Essai thérapeutique ou le patient est son propre témoin : –on mesure une variable (ex glycémie) avant et après traitement –Les données recueillies avant et après sont dites appariées

40 Comparaison de moyennes de séries appariées : tests paramétriques ex: on mesure la TAs avant et après 1 mois de traitement par le médicament X, sur N patients Y-a-t il une différence significative entre les TAs avant et après traitement n° patient123…N TA avant TA après d (différence)+2+1

41 Pour faire le test, on calcule les différences d 1,d 2,d 3 On calcule

42 Sous Ho, il nexiste pas de différence significative entre la TA avant et après traitement Dans ce cas la moyenne des d dans la population est nulle H1 : il existe une différence des valeurs avant et après. Le traitement semble avoir un effet sur la TA

43 on calcule : On choisit α et on lit dans la table t α à (n-1) dll. On compare to et t α Si to>t α on rejette Ho au risque α, on accepte H1 si to=30 Cela est vrai si la distribution des d suit une loi normale si n<30

44 Comparaison de moyennes appariées : test non paramétrique de Wilcoxon Ne suppose aucune condition sur la distribution des di Utilisé pour les petits échantillons, lorsquon ne peut pas vérifier ou quon ne connaît pas la distribution des di Classement des di par ordre croissant Détermination des rang des di Si il existe des di de même valeur absolue, on leur affecte un rang moyen. On enlève les d nulles, sil en existe (il reste N di) On calcule : R+ : somme des rangs des di positifs R- : Somme des rangs des di négatifs

45 si N d0 >25 on montre que R+ et R- suivent une loi normale on calcule Uo : Puis on se reporte à la table de la loi normale

46 Si N d0 25 On prend R=min(R+ et R-) et on compare R à la table de Wilcoxon pour un α choisi. Si RR table on accepte Ho, donc on ne met pas en évidence de différence significative entre les valeurs


Télécharger ppt "Tests de comparaison de moyennes Dr Marc CUGGIA PACES 2013-2014."

Présentations similaires


Annonces Google