Tests Statistiques de Base

Name: Tests Statistiques de Base
Uploaded: 2017-08-28T19:38:30+00:00
Duration: PTM38S6
Channel: Emmanuelle Mace
Description: Tests Statistiques de Base

Tests Statistiques de Base

Test statistique : Test d’hypothèse
Objectif : Aide à la décision en réduisant la part de subjectivité Teste des hypothèses sur quoi ? Sur les « rapports » entre des distributions de variables aléatoires (va) Qu’est-ce qu’une va ? Variable  mesure d’un phénomène Aléatoire  résultat soumis au hasard

Objectif : Teste des hypothèses sur quoi ? Qu’est-ce qu’une variable aléatoire? Rappel sur les va (variable aléatoire) Va quantitatives Continues Discrètes Va qualitatives Ordonnées Non ordonnées Binaires

Qu’est-ce qu’une va ? Rappel sur les va Mesures sur les va Position Va quantitatives : Moyenne Médiane Va qualitative : % & Mode Dispersion Va quantitative : Etendue Intervalle interquartile Ecart-type Coefficient de variation Va qualitative : Ecart-type

Objectif : Aide à la décision en réduisant la part de subjectivité A différentes étapes de la démarche médicale Etape diagnostique : comparaison de deux examens pour choisir le plus utile (écho & TDM pour DG de méta hépatique) Etape thérapeutique : comparaison de deux traitements pour choisir le plus efficace (2 ATB pour stériliser les hémocultures) Etape pronostique : comparaison du rôle pronostique de la présence ou absence de métastase sur la survie Etape étiologique (connaissance ou prévention) : comparaison du tabagisme sur la survenue de KBP

Objectif : Aide à la décision en réduisant la part de subjectivité Les bases Test statistique est utile qd il faut trancher entre 2 H Nulle H0  Statut quo Alternative H1  H à démontrer : nouveauté Ex1 : Compare deux anti ulcéreux A & B  PA & PB H0 PA = PB H1 PA  PB → Décision éventuelle de mettre ou pas B sur le marché

Objectif : Aide à la décision en ↓ la part de subjectivité Les bases Test statistique est utile qd il faut trancher entre 2 H Nulle H0  Statut quo Alternative H1  H à démontrer : nouveauté Ex2 : La mortalité en USI est-elle liée à l’existence d’une IC pré existante (entre autres) H0 P(DC/IC) = P(DC/IC-) H1 P(DC/IC)  P(DC/IC-) → Connaissance & faut-il traiter + activement l’IC ?

Les bases Test statistique est utile qd il faut trancher entre 2 H Nulle H0  Statut quo Alternative H1  H à démontrer : nouveauté  Choix : statut quo ou H1  Rejet ou pas de H0 ; ne démontre pas H0 Les risques α et β : risques d’erreur liés au choix d’H0 ou H1 α : Conclure à H1 si H0 vraie Conclusion à une différence qui  pas β : Conclure à H0 si H1 vraie Conclusion à une absence de  alors qu’elle  1- β : puissance de l’étude

Vérité Vraie A  B A ≈ B Conclusion étude OK (VP) Erreur (FP) (FN) (VN)

Vérité Vraie A  B A ≈ B Conclusion étude OK 1- : puissance Erreur de type I  : p Erreur de type II  : manque de puissance

Les bases Les risques α et β : risques d’erreur liés au choix d’H0 ou H1 α : P(accepter H1 alors que H0 vraie (PA=PB) → Mise sur le marché d’un mdt non efficace β : P(accepter H0 alors que H1 vraie (PA PB) → Manquer un mdt efficace Pour H1  nbreuses situations ou PA - PB = Δ avec Δ  0 → β calculé pour une valeur Δ fixée α et β sont définis a priori Choix de H1, H0, α et β  le test statistique employé

Région de rejet Cette région est constituée par le sous-ensemble des valeurs de la distribution d'échantillonnage qui sont si extrêmes que lorsque H0 est vrai, la probabilité que l'échantillon observé ait une valeur parmi celles-ci est très faible (la probabilité est alpha). La position de cette région de rejet est affectée par la nature de H1, mais non pas sa taille : Dans un test unilatéral, la région de rejet est entièrement située à une des extrémités de la distribution d'échantillonnage, alors que dans un test bilatéral, cette région est située aux deux extrémités de la distribution. La taille de cette région de rejet est définie par alpha. Si alpha est = 0,05 (5%), la taille de la région de rejet correspond à 5% de l'espace inclus dans la courbe de la distribution d'échantillonnage. Cela signifie que dans d'une distribution suivant une loi normale, il n'y a que 5 chances sur 100 pour que l'écart entre la variable et sa valeur moyenne dépasse 2 fois l'écart-type.

Les bases Les risques α et β : risques d’erreur liés au choix d’H0 ou H1 Choix de H1, H0, α et β  le test statistique employé Et que veut dire « p » ? « p » « petit p » « p-value » Probabilité d’observer par le biais du hasard des résultats au moins autant en désaccord avec H0 que ceux observés Probabilité de se tromper en rejetant H0 p est observé a posteriori

Si le test statistique donne une valeur comprise dans la région de rejet, nous rejetons H0[on adopte alors H1]. Quand la probabilité associée à une valeur du test statistique est inférieure ou égale à la valeur alpha préalablement déterminée, nous concluons que H0 est faux. En effet, en rejetant l'hypothèse nulle au niveau 0,05, par exemple, nous avons 5 chances sur 100 seulement d'aboutir à une telle conclusion par le simple fait du hasard. Cette valeur est dite significative.

Table 1. Univariate analysis of suspected prognosis factors of TEN
J Invest Dermatol 2000; 115 : Table 1. Univariate analysis of suspected prognosis factors of TEN Dead pts Survivors OR p value (n=44) (n=121) SAPS II Age (> 40 y old) [ ] <0.001 Heart Rate (120/min) [ ] <0.01 --- Glasgow score < [ ] 0.73 Other variables Male gender [ ] 0.09

Déséquilibre entre α et β : α : 5% β : souvent 10% (puissance de 90%) Etre plus exigent pour démontrer une nouvelle propriété que pour conserver un statut quo

Les bases Pourquoi α = 5% ? Consensus historique publié en 1925 Mais varie selon la question clinique : - Grand essai sur un nouveau vaccin pour lequel on veut une preuve définitive de l’efficacité : p < 1% - Essai sur une maladie rare pour laquelle il n’existe pas de traitement avéré : p < 10% Et la pertinence clinique (+++) Dans les articles : valeur du p même si « NS » (+++)

Quels tests pour quelles hypothèses ?
Choix du test dépend : Nature des variables : qualitative, quantitative, censurée De leur distribution normale ou non (ou effectifs des groupes) Du nombre d’échantillons que l’on veut comparer (2 ou plus) Du caractère apparié ou indépendant des échantillons

Avant de faire des tests paramétriques on doit :
1 ) S'assurer que la distribution de l'échantillon est compatible avec l'hypothèse de distribution gaussienne de la variable (test de normalité). Sinon on peut essayer de rendre cette distribution compatible avec une distribution gaussienne en réalisant une transformation, par exemple logarithmique ou faire un test non paramétrique. Pour vérifier que la distribution d’un échantillon suit une loi normale, il est possible d’utiliser, le test descriptif d’aplatissement et de symétrie donné par les logiciels (de kurtosis and skewness, en anglais).On considère que l’échantillon suit une loi normale à 95 % lorsque la valeur de son aplatissement est comprise entre -2 et +2 et que la valeur de son assymétrie est comprise entre -2 et +2. 2 )Vérifier l'homogénéité des variances de tous les échantillons ;Vérification de l'homogénéité des variances. Supposons que les données suivantes ont été obtenues dans une expérimentation portant sur deux traitements A et B : Pour tester l’hypothèse nulle H0: " Variance(A) = Variance(B) " contre l’hypothèse alternativeH1 " Variance(A) – Variance(B) ", on calcule les deux variances, puis on fait le rapport de la plus grande sur la plus petite. Ce rapport constitue le F de Snedecor. La valeur de F est comparée, dans une table de Snedecor, à une valeur théorique et doit lui être inférieure pour un seuil de risque choisi, pour conserver l'hypothèse d'homogénéité des variances. Pour K échantillons, test de Levene (quand on veut faire de l’ANOVA), ou Bartlett's test

Comparaison de moyennes
2 moyennes observées : Test t de Student v1 : v quantitative v2 : v qualitative à 2 classes Moyenne de v1 selon que v2 = x ou v2 = y Ex : Age moyen des ♂ diffère-t-il de celui des ♀? H0 : mH = mF H1 : mH  mF H : v1 ~ N dans chacun des deux groupes  Si n1 ≥ 30 et n2 ≥ 30 : OK  Sinon : tester la normalité dans chaque groupe Normales : OK Pas normales : test non paramétrique

2 moyennes observées : Test t de Student Ex : Age moyen des ♂ diffère-t-il de celui des ♀? H : v1 ~ N dans chacun des deux groupes  Si n1 ≥ 30 et n2 ≥ 30 : OK  Sinon : tester la normalité dans chaque groupe Normales : OK Pas normales : test non paramétrique  2 tests  selon que les variances sont ou non égales

2 moyennes observées : Test t de Student Ex : Age moyen des ♂ diffère-t-il de celui des ♀? BDD Stata

clim sexe dcd inscard age tpsec

2 moyennes observées : Test t de Student Ex : Age moyen des ♂ diffère-t-il de celui des ♀?

. Vérifier que les variances sont égales
Group | Obs Mean Std. Err. Std. Dev. [95% Conf. Interval] 0 | 1 | combined | Ho: sd(0) = sd(1) Ha: sd(0) < sd(1) Ha: sd(0) != sd(1) Ha: sd(0) > sd(1) P < F_obs = P < F_L + P > F_U = P > F_obs =

2 moyennes observées : Test t de Student Ex : Age moyen des ♂ diffère-t-il de celui des ♀? Comment faire « à la main » ? H : v1 ~ N dans chacun des deux groupes  Si n1 ≥ 30 et n2 ≥ 30 : OK m ~ N dans chaque groupe ε = | m1 – m2 | / (√s12/n1 + s22/n2)

2 moyennes observées : Test t de Student Ex : Age moyen des ♂ diffère-t-il de celui des ♀? Comment faire « à la main » ?  Si n1 ≥ 30 et n2 ≥ 30 : OK  Si n1 < 30 ou n2 < 30 : H : v1 ~ N dans chaque groupe & σ1 = σ2 t(n1+n2-2) = |m1 – m2| / √ sc2/n1 + sc2/n2 Avec sc2 = ((n1-1) s12 + (n2-1) s22 ) / ((n1-1) + (n2-1) )

2 moyennes observées : Test t de Student Ex : Age moyen des ♂ diffère-t-il de celui des ♀? Comment faire « à la main » ? H : v1 ~ N dans chacun des deux groupes  Si n1 ≥ 30 et n2 ≥ 30 : OK  Sinon : tester la normalité dans chaque groupe ou H Normales & variances égales : OK Pas normales : test non paramétrique

> 2 moyennes observées : ANOVA v1 : v quantitative v2 : v qualitative à > 2 classes Ou v2, v3,… Moyenne de v1 selon que v2 = x ou v2 = y ou v2 = z Ex : Age moyen est-il différent selon les groupes de traitement A, B ou C?

Compare 3 moyennes (v qualitative à 3 classes et 1 va quantitative)
oneway age tpsecq, tabulate | Summary of AGE tpsecq | Mean Std. Dev Freq. 1 | 2 | 3 | Total | Analysis of Variance Source SS df MS F Prob > F Between groups Within groups Total Bartlett's test for equal variances: chi2(2) = Prob>chi2 = 0.359

1 moyenne observée / moyenne de référence connue Majorité des logiciels ne font pas : manuel Si n ≥ 30 : m ~ Nl ε = | m – μ | / (σ/√n) Si n < 30 et x ~ Nl t(n-1) = | m – μ | / (σ/√n)

Tests non paramétriques
Quand les H de normalité ne sont pas remplies Principe : tests de rangs, teste la différence des distributions Comparer 2 échantillons : test non paramétrique de Mann-Whitney (Wilcoxon) Comparer > 2 échantillons : test de Kruskall Wallis

Test U de Mann & Whitney (version Wilcoxon)
• Teste l’hypothèse de différence de position des scores et pas seulement de tendance centrale. • Principe : Ordonner les valeurs obtenues en confondant les deux échantillons. Affecter le rang correspondant à chaque valeur. • Comparaison de la somme des rangs dans les deux groupes. • H0 : Somme des rangs dans pop°1=somme des rangs ds pop° 2 • Calcul de la statistique U. • Pour des échantillons d'une taille supérieure à 20, la distribution d'échantillonnage de la statistique du U tend vers une distribution Normale

Comparaison de deux moyennes par un test non paramétrique
Two-sample Wilcoxon rank-sum (Mann-Whitney) test sexe | obs rank sum expected 0 | 1 | combined | unadjusted variance adjustment for ties adjusted variance Ho: age(sexe==0) = age(sexe==1) z = Prob > |z| =

Comparaison de pourcentages
2 pourcentages observés : Chi2 2 va qualitatives Conditions : tous les effectifs théoriques ≥ 5 Ex : Le % de DC est-il significativement supérieur chez les malades hospitalisés en USI sans climatisation ? ↔ La climatisation est-elle associée à une moindre mortalité ? H0 : p1 = p2 H1 : p1  p2

Tableau d'effectifs observés
Observés : effectifs de chacune des cases suivant que le sujet est malade ou non et exposés ou non Tableau d'effectifs observés Théoriques : effectifs que l'on aurait trouvé dans les 4 cases sous l'hypothèse que le risque relatif de la population est 1 Tableau d'effectifs théoriques

ddl=(colonnes-1) (lignes-1) ddl: degrés de liberté
Le 2 se définit par : 2= ddl=(colonnes-1) (lignes-1) ddl: degrés de liberté Exemple: Soit un échantillon x : 400 sujets, pour lesquels on compte : 39 exposés dont 18 malades 361 non exposés dont 44 malades Compléter ces tableaux et calculer le 2:

Effectifs théoriques :
2 =30.9

2 pourcentages observés : Chi2 Conditions : tous les effectifs théoriques ≥ 5 Ex : Le % de DC est-il significativement supérieur chez les malades hospitalisés en USI sans climatisation ? Chi2 « manuel » χ2 = Σij (Oij-Cij)2 /Cij (ad-bc)2 χ2 = x N n1 x n2 x n3 x n4 VV DCD C- 58 129 187 C+ 71 87 158 216 345

L’absence de climatisation de l’USI est-elle associée au DC
L’absence de climatisation de l’USI est-elle associée au DC ? (unilatéral) Existe-t-il une relation entre la climatisation de l’USI et le DC ? (bilatéral) . tab clim dcd, col row exp chi2 exact | dcd clim | | Total 0 | | | | | | | | 1 | | | | | | | | Total | | | | | | | | Pearson chi2(1) = Pr = 0.008 Fisher's exact = sided Fisher's exact =

Relation entre la mortalité et l’existence d’une insuffisance cardiaque pré-existante : 2 va qualitative = Chi2 . tab inscard dcd, col row exp chi2 exact | dcd InsCard | | Total 0 | | | | | | | | 1 | | | | | | | | Total | | | | | | | | Pearson chi2(1) = Pr = 0.000 Fisher's exact = sided Fisher's exact = 0.000

2 pourcentages observés : Chi2 Si ≥ 1 Cij < 5 Mais tous Cij ≥ 3 → Chi2 Yates (Chi2 corrigé) χ2 = Σij (|Oij-Cij |-0.5)2 /Cij Si ≥ 1 Cij < 3 → Test exact de Fisher (logiciel) Ex : Stata

Comparer plusieurs pourcentages : Chi2 > va qualitatives à > 2 classes Conditions : tous les effectifs théoriques ≥ 5 Ex :  association entre la mortalité en USI et le TP ?

Comparer plusieurs pourcentages : Chi2 va qualitatives à > 2 classes Conditions : tous les effectifs théoriques ≥ 5 Si  C <5  Regroupements Yates Fisher

Test appariés Intérêt Diminuer la variance du paramètre étudié : élimine une part de la variance individuelle  Améliore la puissance du test Ex d’appariement pour ↓ la variabilité Les traitements A et B sont donnés aux mêmes sujets Alternance aléatoire avec wash out Topiques différents sur deux membres Les patients malades sont appariés à des témoins Sujets  mais caractéristiques proches (études cas-témoins) Mesures faites à deux reprises sur les mêmes patients Avant-après traitement

Test appariés ↓ σ du paramètre étudié  Améliore la puissance du test
Intérêt ↓ σ du paramètre étudié  Améliore la puissance du test Exemple fréquent : comparer deux méthodes de mesure Mesure de la glycémie par 2 tests chez le même malade 2 radiologues lisant les mêmes radiographies Variations de la PA sur le nycthémère Principe : tester la différence à zéro Mais ne permet pas de tester l’effet de la variable d’appariement

Tests appariés Principe : tester la différence à zéro
Comparer deux moyennes appariées H0 : μd = 0 H1 : μd  0 n ≥ 30 ε = md / (σd/ √n) σd2 : variance des di n < 30 et di ~ Nle tn-1 = md / (σd/√n) σd2 : variance des di Dans SPSS : t-test for paired sample Test non paramétrique : test signé de wilcoxon pour données appareillées (attention diff du test de Wilcoxon pour données non appariées)

Test signé de Wilcoxon pour séries appariées
le Wilcoxon prend aussi en compte l'ampleur des différences. On va ordonner les différences en fonction de leur valeur absolue. On donne la valeur 1 à la plus faible diff en V.A. On attribue à chacun de ces rangs le signe de la différence correspondante (+ ou -). Ho : on attend que la somme des rangs <0 soit égale à celle des rangs >0.

Test appariés Comparer deux pourcentages appariées chi² de Mac Nemar
H0 : P0 = P1 H1 : P0  P1 Ex : 2 traitements locaux du psoriasis sont comparés, A et B, chacun étant appliqué sur un bras PA = PB = 0.45 Analyse des paires discordantes (+et-) χ2 = (b – c)2 / (b + c) = 5 Condition : (b+c)/2 ≥ 5 χ 2y = (|b – c | - 1)2 / (b + c) A B S 65 45 E 35 55 A + A- B+ 15 30 =b 45 B- 50 =c 5 55 65 35 H0 teste b’=c’=(b+c)/2

Tests paramétriques et de leurs équivalents non paramétriques
Test paramétrique Test non paramétrique Test t de Student non apparié Test de Mann et Whitney Test t de Student apparié Test signé de Wilcoxon Analyse de variance Test de Kruskall et Wallis Corrélation linéaire Test de Spearman Chi² de Pearson Chi² de Mac Nemar

Récapitulatif * Attention il y a un test de Wilcoxon qui s’apparente au test de Mann Withney, qui diffère du test signé de Wilcoxon qui est lui pour les séries appariées

Tests Statistiques de Base

Présentations similaires

Présentation au sujet: "Tests Statistiques de Base"— Transcription de la présentation:

Présentations similaires

Notre projet

Feed-back

Entrer

S'autoriser via un réseau social:

Tests Statistiques de Base

Présentations similaires

Présentation au sujet: "Tests Statistiques de Base"— Transcription de la présentation:

Présentations similaires

Notre projet

Feed-back