La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Tests Statistiques de Base. 2 Test statistique : Test dhypothèse Objectif : Aide à la décision en réduisant la part de subjectivité Teste des hypothèses.

Présentations similaires


Présentation au sujet: "Tests Statistiques de Base. 2 Test statistique : Test dhypothèse Objectif : Aide à la décision en réduisant la part de subjectivité Teste des hypothèses."— Transcription de la présentation:

1 Tests Statistiques de Base

2 2 Test statistique : Test dhypothèse Objectif : Aide à la décision en réduisant la part de subjectivité Teste des hypothèses sur quoi ? Sur les « rapports » entre des distributions de variables aléatoires (va) Quest-ce quune va ? Variable mesure dun phénomène Aléatoire résultat soumis au hasard

3 3 Test statistique : Test dhypothèse Objectif : Teste des hypothèses sur quoi ? Quest-ce quune variable aléatoire? Rappel sur les va (variable aléatoire) Va quantitatives Continues Discrètes Va qualitatives Ordonnées Non ordonnées Binaires

4 4 Test statistique : Test dhypothèse Quest-ce quune va ? Rappel sur les va Mesures sur les va 1. Position Va quantitatives : Moyenne Médiane Va qualitative :% & Mode 2. Dispersion Va quantitative : EtendueIntervalle interquartile Ecart-typeCoefficient de variation Va qualitative : Ecart-type

5 5 Test statistique : Test dhypothèse Objectif : Aide à la décision en réduisant la part de subjectivité A différentes étapes de la démarche médicale Etape diagnostique : comparaison de deux examens pour choisir le plus utile (écho & TDM pour DG de méta hépatique) Etape thérapeutique : comparaison de deux traitements pour choisir le plus efficace (2 ATB pour stériliser les hémocultures) Etape pronostique : comparaison du rôle pronostique de la présence ou absence de métastase sur la survie Etape étiologique (connaissance ou prévention) : comparaison du tabagisme sur la survenue de KBP

6 6 Test statistique : Test dhypothèse Objectif : Aide à la décision en réduisant la part de subjectivité Les bases Test statistique est utile qd il faut trancher entre 2 H Nulle H 0 Statut quo Alternative H 1 H à démontrer : nouveauté Ex1 : Compare deux anti ulcéreux A & B P A & P B H 0 P A = P B H 1 P A P B Décision éventuelle de mettre ou pas B sur le marché

7 7 Test statistique : Test dhypothèse Objectif : Aide à la décision en la part de subjectivité Les bases Test statistique est utile qd il faut trancher entre 2 H Nulle H 0 Statut quo Alternative H 1 H à démontrer : nouveauté Ex2 : La mortalité en USI est-elle liée à lexistence dune IC pré existante (entre autres) H 0 P (DC/IC) = P (DC/IC-) H 1 P (DC/IC) P (DC/IC-) Connaissance & faut-il traiter + activement lIC ?

8 8 Test statistique : Test dhypothèse Les bases Test statistique est utile qd il faut trancher entre 2 H Nulle H 0 Statut quo Alternative H 1 H à démontrer : nouveauté Choix : statut quo ou H 1 Rejet ou pas de H 0 ; ne démontre pas H 0 Les risques α et β : risques derreur liés au choix dH 0 ou H 1 α : Conclure à H 1 si H 0 vraie Conclusion à une différence qui pas β : Conclure à H 0 si H 1 vraie Conclusion à une absence de alors quelle 1- β : puissance de létude

9 9 Test statistique : Test dhypothèse Vérité Vraie A B Conclusion étude A B OK (VP) Erreur (FP) A B Erreur (FN) OK (VN)

10 10 Test statistique : Test dhypothèse Vérité Vraie A B Conclusion étude A B OK 1- : puissance Erreur de type I : p A B Erreur de type II : manque de puissance OK

11 11 Test statistique : Test dhypothèse Les bases Les risques α et β : risques derreur liés au choix dH 0 ou H 1 α : P(accepter H 1 alors que H 0 vraie (P A =P B ) Mise sur le marché dun mdt non efficace β : P(accepter H 0 alors que H 1 vraie (P A P B ) Manquer un mdt efficace Pour H 1 nbreuses situations ou P A - P B = Δ avec Δ 0 β calculé pour une valeur Δ fixée α et β sont définis a priori Choix de H 1, H 0, α et β le test statistique employé

12 12 Région de rejet –Cette région est constituée par le sous-ensemble des valeurs de la distribution d'échantillonnage qui sont si extrêmes que lorsque H0 est vrai, la probabilité que l'échantillon observé ait une valeur parmi celles-ci est très faible (la probabilité est alpha). –La position de cette région de rejet est affectée par la nature de H1, mais non pas sa taille : –Dans un test unilatéral, la région de rejet est entièrement située à une des extrémités de la distribution d'échantillonnage, –alors que dans un test bilatéral, cette région est située aux deux extrémités de la distribution. La taille de cette région de rejet est définie par alpha. Si alpha est = 0,05 (5%), la taille de la région de rejet correspond à 5% de l'espace inclus dans la courbe de la distribution d'échantillonnage. Cela signifie que dans d'une distribution suivant une loi normale, il n'y a que 5 chances sur 100 pour que l'écart entre la variable et sa valeur moyenne dépasse 2 fois l'écart-type.

13 13 Test statistique : Test dhypothèse Les bases Les risques α et β : risques derreur liés au choix dH 0 ou H 1 Choix de H 1, H 0, α et β le test statistique employé Et que veut dire « p » ? « p » « petit p » « p-value » Probabilité dobserver par le biais du hasard des résultats au moins autant en désaccord avec H 0 que ceux observés Probabilité de se tromper en rejetant H 0 p est observé a posteriori

14 14 Test statistique : Test dhypothèse Si le test statistique donne une valeur comprise dans la région de rejet, nous rejetons H0[on adopte alors H1]. Quand la probabilité associée à une valeur du test statistique est inférieure ou égale à la valeur alpha préalablement déterminée, nous concluons que H0 est faux. En effet, en rejetant l'hypothèse nulle au niveau 0,05, par exemple, nous avons 5 chances sur 100 seulement d'aboutir à une telle conclusion par le simple fait du hasard. Cette valeur est dite significative.

15 15 J Invest Dermatol 2000; 115 : Table 1. Univariate analysis of suspected prognosis factors of TEN Dead ptsSurvivorsORp value (n=44)(n=121) SAPS II Age (> 40 y old) [ ]<0.001 Heart Rate ( 120/min) [ ]< Glasgow score < [ ]0.73 Other variables Male gender [ ]0.09

16 16 Test statistique : Test dhypothèse Déséquilibre entre α et β : α : 5% β : souvent 10% (puissance de 90%) Etre plus exigent pour démontrer une nouvelle propriété que pour conserver un statut quo

17 17 Test statistique : Test dhypothèse Les bases Pourquoi α = 5% ? Consensus historique publié en 1925 Mais varie selon la question clinique : - Grand essai sur un nouveau vaccin pour lequel on veut une preuve définitive de lefficacité : p < 1% - Essai sur une maladie rare pour laquelle il nexiste pas de traitement avéré : p < 10% Et la pertinence clinique (+++) Dans les articles : valeur du p même si « NS » (+++)

18 18 Quels tests pour quelles hypothèses ? Choix du test dépend : 1.Nature des variables : qualitative, quantitative, censurée 2.De leur distribution normale ou non (ou effectifs des groupes) 3.Du nombre déchantillons que lon veut comparer (2 ou plus) 4.Du caractère apparié ou indépendant des échantillons

19 19 Avant de faire des tests paramétriques on doit : 1 ) S'assurer que la distribution de l'échantillon est compatible avec l'hypothèse de distribution gaussienne de la variable (test de normalité). Sinon on peut essayer de rendre cette distribution compatible avec une distribution gaussienne en réalisant une transformation, par exemple logarithmique ou faire un test non paramétrique. –Pour vérifier que la distribution dun échantillon suit une loi normale, il est possible dutiliser, le test descriptif daplatissement et de symétrie donné par les logiciels (de kurtosis and skewness, en anglais).On considère que léchantillon suit une loi normale à 95 % lorsque la valeur de son aplatissement est comprise entre -2 et +2 et que la valeur de son assymétrie est comprise entre -2 et )Vérifier l'homogénéité des variances de tous les échantillons ;Vérification de l'homogénéité des variances. –Supposons que les données suivantes ont été obtenues dans une expérimentation portant sur deux traitements A et B : –Pour tester lhypothèse nulle H0: " Variance(A) = Variance(B) " contre lhypothèse alternativeH1 " Variance(A) – Variance(B) ", on calcule les deux variances, puis on fait le rapport de la plus grande sur la plus petite. Ce rapport constitue le F de Snedecor. La valeur de F est comparée, dans une table de Snedecor, à une valeur théorique et doit lui être inférieure pour un seuil de risque choisi, pour conserver l'hypothèse d'homogénéité des variances. –Pour K échantillons, test de Levene (quand on veut faire de lANOVA), ou Bartlett's test

20 20 Comparaison de moyennes 2 moyennes observées : Test t de Student v1 : v quantitative v2 : v qualitative à 2 classes Moyenne de v1 selon que v2 = x ou v2 = y Ex : Age moyen des diffère-t-il de celui des ? H 0 : m H = m F H 1 : m H m F H : v1 ~ N dans chacun des deux groupes Si n1 30 et n2 30 : OK Sinon : tester la normalité dans chaque groupe Normales : OK Pas normales : test non paramétrique

21 21 Comparaison de moyennes 2 moyennes observées : Test t de Student Ex : Age moyen des diffère-t-il de celui des ? H : v1 ~ N dans chacun des deux groupes Si n1 30 et n2 30 : OK Sinon : tester la normalité dans chaque groupe Normales : OK Pas normales : test non paramétrique 2 tests selon que les variances sont ou non égales

22 22 Comparaison de moyennes 2 moyennes observées : Test t de Student Ex : Age moyen des diffère-t-il de celui des ? BDD Stata

23 23 climsexedcdinscardagetpsec

24 24 Comparaison de moyennes 2 moyennes observées : Test t de Student Ex : Age moyen des diffère-t-il de celui des ?

25 25 Compare l'âge moyen des hommes et des femmes en supposant que les variances sont égales Two-sample t test with equal variances Group | Obs Mean Std. Err. Std. Dev. [95% CI] | | combined | diff | Degrees of freedom: 343 Ho: mean(0) - mean(1) = diff = 0 Ha: diff 0 t = t = t = P |t| = P > t = 0.000

26 26. Vérifier que les variances sont égales Group | Obs Mean Std. Err. Std. Dev. [95% Conf. Interval] | | combined | Ho: sd(0) = sd(1) Ha: sd(0) sd(1) P F_U = P > F_obs =

27 27 Comparaison de deux moyennes dont les variances ne sont pas égales Two-sample t test with unequal variances Group | Obs Mean Std. Dev. [95% Conf. Interval] | | combined | diff | Satterthwaite's degrees of freedom: Ho: mean(0) - mean(1) = diff = 0 Ha: diff 0 t = t = t = P |t| = P > t = 0.000

28 28 Comparaison de moyennes 2 moyennes observées : Test t de Student Ex : Age moyen des diffère-t-il de celui des ? Comment faire « à la main » ? H : v1 ~ N dans chacun des deux groupes Si n1 30 et n2 30 : OK m ~ N dans chaque groupe ε = | m1 – m2 | / (s 1 2 /n 1 + s 2 2 /n 2 )

29 29 Comparaison de moyennes 2 moyennes observées : Test t de Student Ex : Age moyen des diffère-t-il de celui des ? Comment faire « à la main » ? Si n 1 30 et n 2 30 : OK Si n 1 < 30 ou n 2 < 30 : H : v1 ~ N dans chaque groupe & σ 1 = σ 2 t (n1+n2-2) = |m 1 – m 2 | / s c 2 /n 1 + s c 2 /n 2 Avec s c 2 = ((n 1 -1) s (n 2 -1) s 2 2 ) / ((n 1 -1) + (n 2 -1) )

30 30 Comparaison de moyennes 2 moyennes observées : Test t de Student Ex : Age moyen des diffère-t-il de celui des ? Comment faire « à la main » ? H : v1 ~ N dans chacun des deux groupes Si n1 30 et n2 30 : OK Sinon : tester la normalité dans chaque groupe ou H Normales & variances égales : OK Pas normales : test non paramétrique

31 31 Comparaison de moyennes > 2 moyennes observées : ANOVA v1 : v quantitative v2 : v qualitative à > 2 classes Ou v2, v3,… Moyenne de v1 selon que v2 = x ou v2 = y ou v2 = z Ex : Age moyen est-il différent selon les groupes de traitement A, B ou C?

32 32 Compare 3 moyennes (v qualitative à 3 classes et 1 va quantitative) oneway age tpsecq, tabulate | Summary of AGE tpsecq | Mean Std. Dev. Freq | | | Total | Analysis of Variance Source SS df MS F Prob > F Between groups Within groups Total Bartlett's test for equal variances: chi2(2) = Prob>chi2 = 0.359

33 33 Comparaison de moyennes 1 moyenne observée / moyenne de référence connue Majorité des logiciels ne font pas : manuel –Si n 30 : m ~ N l ε = | m – μ | / (σ/n) –Si n < 30 et x ~ N l t (n-1) = | m – μ | / (σ/n)

34 34 Quand les H de normalité ne sont pas remplies Principe : tests de rangs, teste la différence des distributions –Comparer 2 échantillons : test non paramétrique de Mann- Whitney (Wilcoxon) –Comparer > 2 échantillons : test de Kruskall Wallis Tests non paramétriques

35 35 Test U de Mann & Whitney (version Wilcoxon) Teste lhypothèse de différence de position des scores et pas seulement de tendance centrale. Principe : Ordonner les valeurs obtenues en confondant les deux échantillons. Affecter le rang correspondant à chaque valeur. Comparaison de la somme des rangs dans les deux groupes. H0 : Somme des rangs dans pop°1=somme des rangs ds pop° 2 Calcul de la statistique U. Pour des échantillons d'une taille supérieure à 20, la distribution d'échantillonnage de la statistique du U tend vers une distribution Normale

36 36 Comparaison de deux moyennes par un test non paramétrique Two-sample Wilcoxon rank-sum (Mann-Whitney) test sexe | obs rank sum expected | | combined | unadjusted variance adjustment for ties adjusted variance Ho: age(sexe==0) = age(sexe==1) z = Prob > |z| =

37 37 Comparaison de pourcentages 2 pourcentages observés : Chi2 2 va qualitatives Conditions : tous les effectifs théoriques 5 Ex : Le % de DC est-il significativement supérieur chez les malades hospitalisés en USI sans climatisation ? La climatisation est-elle associée à une moindre mortalité ? H 0 : p 1 = p 2 H 1 : p 1 p 2

38 38 Observés : effectifs de chacune des cases suivant que le sujet est malade ou non et exposés ou non Tableau d'effectifs observés Théoriques : effectifs que l'on aurait trouvé dans les 4 cases sous l'hypothèse que le risque relatif de la population est 1 Tableau d'effectifs théoriques

39 39 Le 2 se définit par : 2= Exemple: Soit un échantillon x : 400 sujets, pour lesquels on compte : 39 exposés dont 18 malades 361 non exposés dont 44 malades Compléter ces tableaux et calculer le 2: ddl=(colonnes-1) (lignes-1)ddl: degrés de liberté

40 40 Effectifs théoriques : 2 =30.9

41 41 Comparaison de pourcentages Chi2 « manuel » χ2 = Σ ij (O ij -C ij ) 2 /C ij (ad-bc) 2 χ 2 = x N n 1 x n 2 x n 3 x n 4 VVDCD C C pourcentages observés : Chi2 Conditions : tous les effectifs théoriques 5 Ex : Le % de DC est-il significativement supérieur chez les malades hospitalisés en USI sans climatisation ?

42 42 Labsence de climatisation de lUSI est-elle associée au DC ? (unilatéral) Existe-t-il une relation entre la climatisation de lUSI et le DC ? (bilatéral). tab clim dcd, col row exp chi2 exact | dcd clim | 0 1 | Total | | 187 | | | | | | | | 158 | | | | | | Total | | 345 | | | | | | Pearson chi2(1) = Pr = Fisher's exact = sided Fisher's exact = 0.005

43 43 Relation entre la mortalité et lexistence dune insuffisance cardiaque pré- existante : 2 va qualitative = Chi2. tab inscard dcd, col row exp chi2 exact | dcd InsCard | 0 1 | Total | | 271 | | | | | | | | 74 | | 74.0 | | | | Total | | 345 | | | | | | Pearson chi2(1) = Pr = Fisher's exact = sided Fisher's exact = 0.000

44 44 Comparaison de pourcentages 2 pourcentages observés : Chi2 Si 1 C ij < 5 Mais tous C ij 3 Chi2 Yates (Chi2 corrigé) χ2 = Σ ij (|O ij -C ij |-0.5) 2 /C ij Si 1 C ij < 3 Test exact de Fisher (logiciel) Ex : Stata

45 45 Comparaison de pourcentages Comparer plusieurs pourcentages : Chi2 > va qualitatives à > 2 classes Conditions : tous les effectifs théoriques 5 Ex : association entre la mortalité en USI et le TP ?

46 46 Comparaison de plusieurs pourcentages Chi2. tab tpsecq dcd, row exp chi2 exact | dcd tpsecq | 0 1 | Total <=19 | | 176 | | | | | | 66 | | 66.0 | | > 26 | | 78 | | 78.0 | | Total | | 320 | | | | Pearson chi2(2) = Pr = Fisher's exact = 0.000

47 47 Comparaison de pourcentages Comparer plusieurs pourcentages : Chi2 va qualitatives à > 2 classes Conditions : tous les effectifs théoriques 5 Si C <5 Regroupements Yates Fisher

48 48 Test appariés Intérêt Diminuer la variance du paramètre étudié : élimine une part de la variance individuelle Améliore la puissance du test Ex dappariement pour la variabilité Les traitements A et B sont donnés aux mêmes sujets Alternance aléatoire avec wash out Topiques différents sur deux membres Les patients malades sont appariés à des témoins Sujets mais caractéristiques proches (études cas- témoins) Mesures faites à deux reprises sur les mêmes patients Avant-après traitement

49 49 Test appariés Intérêt σ du paramètre étudié Améliore la puissance du test Exemple fréquent : comparer deux méthodes de mesure Mesure de la glycémie par 2 tests chez le même malade 2 radiologues lisant les mêmes radiographies Variations de la PA sur le nycthémère Principe : tester la différence à zéro Mais ne permet pas de tester leffet de la variable dappariement

50 50 Tests appariés Principe : tester la différence à zéro Comparer deux moyennes appariées H0 : μd = 0H1 : μd 0 n 30 ε = m d / (σ d / n) σ d 2 : variance des d i n < 30 et d i ~ N le t n-1 = m d / (σ d /n) σ d 2 : variance des d i Dans SPSS : t-test for paired sample Test non paramétrique : test signé de wilcoxon pour données appareillées (attention diff du test de Wilcoxon pour données non appariées)

51 51 Test signé de Wilcoxon pour séries appariées le Wilcoxon prend aussi en compte l'ampleur des différences. On va ordonner les différences en fonction de leur valeur absolue. On donne la valeur 1 à la plus faible diff en V.A. On attribue à chacun de ces rangs le signe de la différence correspondante (+ ou -). Ho : on attend que la somme des rangs 0.

52 52 Test appariés Ex : 2 traitements locaux du psoriasis sont comparés, A et B, chacun étant appliqué sur un bras P A = 0.65 P B = 0.45 Analyse des paires discordantes (+et-) χ 2 = (b – c) 2 / (b + c) = 5 Condition : (b+c)/2 5 χ 2y = (|b – c | - 1) 2 / (b + c) AB S6545 E3555 Comparer deux pourcentages appariées chi² de Mac Nemar H0 : P0 = P1H1 : P0 P1 A +A- B+1530 =b 45 B-50 =c H0 teste b=c=(b+c)/2

53 53 Tests paramétriques et de leurs équivalents non paramétriques Test paramétriqueTest non paramétrique Test t de Student non appariéTest de Mann et Whitney Test t de Student appariéTest signé de Wilcoxon Analyse de varianceTest de Kruskall et Wallis Corrélation linéaire Test de Spearman Chi² de PearsonChi² de Mac Nemar

54 54 Récapitulatif * Attention il y a un test de Wilcoxon qui sapparente au test de Mann Withney, qui diffère du test signé de Wilcoxon qui est lui pour les séries appariées

55 55

56 56

57 57

58 58


Télécharger ppt "Tests Statistiques de Base. 2 Test statistique : Test dhypothèse Objectif : Aide à la décision en réduisant la part de subjectivité Teste des hypothèses."

Présentations similaires


Annonces Google