Tests non paramétriques de comparaison de moyennes

Slides:



Advertisements
Présentations similaires
Intervalles de confiance
Advertisements

Introduction aux statistiques Intervalles de confiance
Comparaison d’une moyenne observée à une moyenne théorique
Corrélation Position du problème Définition covariance (X,Y) r =
ANOVA à un facteur (Rehailia)
TESTS RELATIFS AUX CARACTERES QUANTITATIFS
Echantillonnage Introduction
Inférence statistique
Comparaison de deux moyennes observées
Inférence statistique
Faculté de médecine de Nancy - SPI-EAO - Pr. F. KOHLER
Comparaison d'une distribution observée à une distribution théorique
Comparaison de deux pourcentages observés
Comparaison de plusieurs moyennes observées
Tests non paramétriques
Tests de comparaison de pourcentages
Nombre de sujets nécessaires en recherche clinique
Les Tests dhypothèses. 1)Définition Un test cest une méthode qui permet de prendre une décision à partir des résultats dun échantillon.
Régression -corrélation
Répondre aux questions suivantes :
Tests de comparaison de moyennes
Tests de comparaison de moyennes
Différences de concentrations en nitrates dans la Garonne à l’entrée de Toulouse entre l’hiver et le printemps Elise Barreau Emilie Decorsière Lionel Jimenez.
Méthodes de Biostatistique
1 - Construction d'un abaque Exemple
Lévaluation de la qualité aux services des Urgences L expérience de lHôpital Régional de Lugano: siège Italien Lucerne, avril 2001 Dr.ssa Anna De Benedetti,
Nombre de sujets nécessaires en recherche clinique
Régression linéaire simple
Howell, Chap. 1 Position générale
Corrélation et régression linéaire simple
Le test t. Procédure de linférence statistique 1. Contexte théorique 2. Hypothèses 3. Seuil de signification et puissance 4. Taille de leffet 5. Collecte.
Le test t.
Université dOttawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :47 1 Concepts fondamentaux: statistiques et distributions.
Corrélation Principe fondamental d’une analyse de corrélation
Comparaison de deux échantillons
Théorie… Inférence statistique: étude du comportement d’une population ou d’un caractère X des membres d’une population à partir d’un échantillon aléatoire.
Howell Chap. 7, test t. Différence entre une moyenne tirée dun échantillon et une moyenne dune population quand la moyenne et lécart- type de la population.
Objectifs du chapitre sur les distributions déchantillonnage Comprendre la relation entre les distributions déchantillonnage et les tests dinférence statistique.
ORGANIGRAMME-MÉTHODES STATISTIQUES-COMPARAISONS DE MOYENNES
Méthodes de Biostatistique
Chapitre 3 - Comparer plusieurs groupes
ESTIMATION 1. Principe 2. Estimateur 3. Distribution d’échantillonnage
Théorème de la limite centrale l’inférence statistique
Tests d’hypothèse Tests de conformité Tests d’égalité
N. Yamaguchi1 Statistiques Séance 6 – 16 Nov 2005.
ANOVA à 1 facteur en groupes de mesure indépendants
Comparaison de deux échantillons
Probabilités et statistique Test d’hypothèse de deux moyennes
Statistiques analytiques sous STATA
STATISTIQUE INFERENTIELLE LES TESTS STATISTIQUES
L’erreur standard et les principes fondamentaux du test de t
Test.
Examen SPSS
ATELIERS STATISTIQUES
Distribution de probabilité du vent
LOI NORMALE LOI STUDENT ECHANTILLONS ET TESTS DE MOYENNE
ECHANTILLONAGE ET ESTIMATION
Comparaison de plusieurs moyennes observées
Tests relatifs aux variables qualitatives: Tests du Chi-deux.
Tests relatifs aux variables qualitatives: Tests du Chi-deux.
Distributions d’échantillonnage pour des proportions
Introduction aux statistiques Intervalles de confiance
Par Raphael Medang, et Dr Gbaguidi Emmanuel Disponibilité en Préservatifs Masculins dans le Contexte du Marketing Social en Afrique Centrale : Analyse.
Test.
Test.
test
TEST.
Test test.
Transcription de la présentation:

Tests non paramétriques de comparaison de moyennes Tests de normalité Test de F Tests non paramétriques de comparaison de moyennes Dr Marc Cuggia UMR 936

Rappel Comparaison de moyenne : Test de Z Test de T (student)‏ Condition : Effectifs supérieurs à 30 Si condition non remplie alors : Test de T (student)‏ Conditions : Distributions des populations d'où sont issues les échantillons doivent être normale Tests de normalité (Test de Shapiro, Test de kolmogorov- smirnoff)‏ Les variances des deux populations d'où sont issus les échantillons doivent être égales. (Leur rapport <3)‏ Test d'homoscedasticité (test de F)‏

Et sinon ? Si Petit effectif et pas de normalité et/ou pas d'homoscedasiticité alors Tests non paramétriques Mann et witney Wilcoxon

Test de normalité Exemple : Tour de poitrines de soldats écossais en pouces Données :

Test de Kolmogorov-Smirnov Hypothèse Ho : La distribution étudiée est distribution normale H1 : La distribution étudiée n’est pas normale Ici p<0,000 => l’hypothèse Ho est rejettée : La distribution n’est pas normale

Test de Shapiro en 9 étapes Classer les diffrentes valeurs de la série par ordre croissant Calculer S2 tel que Calculer m Calculer les differences respectives tel que d1=Xn-X1;d2=X(n-1)-X2 etc... dn A chacune des differences, on affecte un coéfficient a, avec n nombre de difference Calculer la quantité b tel que Calculer le rapport W Comparer W calculé à W tabulé avec le nombre n de données

SHAPIRO WILK La méthode développée par Shapiro-Wilk est dans bien des cas, la plus puissante, en particulier lorsque l’échantillon provient d’une distribution asymétrique. Cette méthode implique l’emploi de tables, actuellement calculées pour une taille d’échantillon comprise entre 5 et 50. (5 ≤ n ≤ 50) Comme dans tout autre test, il faudra déterminer à l’avance un risque de rejeter l’hypothèse nulle alors que celle-ci est vraie (α).

Étapes de réalisation du test de Shapiro-Wilk Étape 1 Classer les n observations par ordre de grandeur croissante : Étape 2 Calculer la Somme des Carrés des Écarts:

Étape 3 Calculer les différences : Si n est pair il y aura alors n/2 différences. Si n est impair il y aura alors (n-1)/2 différences, l’observation médiane ne sera pas utilisée.

Étape 4 Calculer : Les coefficients ai sont donnés dans une table en fonction de n et i .

Étape 5 Calculer :

Étape 6 Comparer W à W1-α,n W1-α,n est trouvé dans la table de Shapiro-Wilk en fonction du risque d’erreur α et de la taille de l’échantillon (le nombre d’observations) n On peut écrire P() = 1- α Finalement, si W < W1-α,n la distribution ne suit pas une loi normale si W ≥ W1-α,n la distribution suit une loi normale

exercice Exemple : On a fait des essais de fatigue sur un certain biomatériau utilisé dans les prothèses d’épaule (nombre de cycles avant rupture) et on a obtenu la série suivante : 31, 39, 62, 89, 115, 125, 140, 225, 251, 270, 342, 400, 442, 580, 850. Peut-on conclure avec un risque d’erreur de 5% (niveau de confiance 95%) que ces données proviennent d’une distribution suivant une loi normale?

Étape 1 : On place les données en ordre croissant : 31, 39, 62, 89, 115, 125, 140, 225, 251, 270, 342, 400, 442, 580, 850

Étape 2 : On calcule la somme des carrés des écarts

Étape 3 : On calcule les différences di

Étape 4 : On calcule la valeur de b Pour ce calcul nous avons besoins des coefficients ai de la table Shapiro-Wilk pour n = 15.

Étape 5 : On calcule

Étape 6 : On compare W à W1-α,n Avec α=5% et n = 15 on trouvera dans la table le W95%,15= 0,881 Puisque 0,876<0,881 on a donc W < W1-α,n et par le fait même, la distribution ne suit pas une loi normale avec un risque d’erreur de 5%.

Exercice à faire 1,08 7,68 8,28 8,23 7,63 11,74 10,30 11,72 12,87 9,02

No1 Oui la distribution de la quantité de minéraux suit une loi normale W=0,9278

Au travail : Soit l'échantillon suivant. Déterminez grace à la méthode de shapiro si la population d'où est issu l'échantillon est normale. Patient 1 2 3 4 5 6 Glycémie 2 1,7 2,5 3 2,3 4

Test de comparaison des variances test de F test de fisher snedecor

Test d’égalité des variances Test de Fisher-Senecor Utilisé pour comparer les variances de 2 séries de variable quantitatives Lorsqu’on veut vérifier les conditions d’applications de certains tests paramétriques qui exigent une HOMOSEDASTICITE Variables : quantitatives Paramètre: variances Tailles des échantillons : indifférentes Séries étudiées : indépendantes Ho : σ21= σ22 H1 : bilateral σ21=/= σ22 ET unilateral σ21> σ22 ou σ21<σ22 Avec σ21 et σ22 les variances des deux populations dont sont issus les échantillons s21 et s22: les variances des deux échantillons à comparer n1 et n2 les effectifs des deux échantillons k1 et k2 : les degrés de libertés pour chaque échantillons Conditions d’applications : les distributions doivent être normales dans les deux populations d’où proviennent les deux échantillons

Principe du test : on teste le rapport F des deux variances s21 et s22, en nommant la s21 la variance la plus élevée. Sous l’hypothèse nulle, ce rapport F est peut different de 1 et les fluctuations d’échantillonage suivent une loi de Fisher.

σ21 ne diffère pas significativement de σ22 H1 F Rejet Ho Interprétation bilatérale <F2,5% Non σ21 ne diffère pas significativement de σ22 >= F2,5% Oui σ21 diffère significativement de σ22 unilatérale <F5% >= F5% Une variance des deux séries est significativement proportionnellement plus grande à l’autre

On désire comparer la PAD d’un groupe de sujets sains (m=70,1) et d’une groupe de sujets atteints de drépanocytose (m=61,8). On dispose que de 20 individus par groupe. La variance de la PAD est respectivement de 116,7 et de 47,6. Peut on comparer ces moyennes ?

En raison du faible effectif des groupe, on réalise un test de T. Ce test nécessite une homoscédasticité des populations à comparer. On test l’égalité des variances avec un test de F Ho : les 2 variances ne sont pas différentes H1 : les deux variances diffèrent. F=116,7/47,6 = 2,45 avec k1=k2=20-1=19 On lit la table F2,5% : elle ne donne pas la valeur pour 19 mais pour 20 (F2,5%=2,46). La valeur de F trouvée est inférieure à ce seuil: On ne rejette pas Ho, et on admet que les variances sont identiques. On peut donc réaliser un test de student

Test non paramétriques Test de Mann Whitney : Utilisé pour comparer deux séries indépendantes ou appariées d’une variables quantitative On ne s’intéresse pas aux valeurs mais aux rangs des valeurs après les avoir ordonnées Le test ne nécessite aucune condition d’application,

Le test de et Mann-Whitney (ou test U) séries indépendantes Variables : quantitatives Grandeur étudiées: rangs des valeurs Séries étudiées : indépendantes Ho : Distributions superposées H1 : bilatérale : distributions décalées Unilatérale : distributions décalées dans un sens ou dans un autre Nota : pour les séries appariées, on utilise le test de wilcoxon

Détermination du rang des valeurs Étapes du test : Détermination du rang des valeurs Il faut classer toutes les observations des deux séries selon leurs valeurs, de la première à la nième, et numéroter leurs valeurs. Cela définit le rang de chaque observation Lorsque deux valeurs sont identiques, on calcule leur rang moyen ex-aequo Calculer w1 = somme des rangs d’une série (la plus courte) Calculer la somme attendue des rangs wa= n1(N+1)/2 Calculer la variance de w1 sw12=n1n2(N+1)/12 Calculer -

H1 Z Rejet Ho Interprétation bilatérale <1,96 Non Les distribution ne sont pas significativement décalées >=1,96 Oui Les distribution sont significativement décalées unilatérale <1,65 >1,65 Les distributions sont décalées dans un sens donné

Réferences Thierry Ancelle. Statistique – Epidémiologie chez Maloine Jean Bouyer : Méthodes statistiques : médecine-biologie chez ESTEM