Comparaison de deux moyennes observées

Slides:

Advertisements

Présentations similaires

Introduction aux statistiques Intervalles de confiance

Advertisements

L’échantillonnage & Ses Fluctuations

Statistique II Chapitre 3: Tests d’hypothèses

Comparaison d’une moyenne observée à une moyenne théorique

Corrélation Position du problème Définition covariance (X,Y) r =

ANOVA à un facteur (Rehailia)

Présentation des données

Thomas G. Dietterich Approximate Statistical Tests for Comparing

Test statistique : principe

Introduction aux statistiques

Les tests d’hypothèses (II)

Les tests d’hypothèses (I)

TESTS RELATIFS AUX CARACTERES QUANTITATIFS

Inférence statistique

C1 Bio-statistiques F. KOHLER

Inférence statistique

Situation du problème :

Comparaison de pourcentages : séries appariées

Faculté de médecine de Nancy - SPI-EAO - Pr. F. KOHLER

Comparaison d'une distribution observée à une distribution théorique

Comparaison de deux pourcentages observés

Comparaison de plusieurs moyennes observées

Tests non paramétriques

Les TESTS STATISTIQUES

Tests de comparaison de pourcentages

Comparaison de plusieurs moyennes Analyse de variance

Nombre de sujets nécessaires en recherche clinique

Les tests statistiques. Une situation à risques

Tests non paramétriques de comparaison de moyennes

Les TESTS STATISTIQUES

Les Tests dhypothèses. 1)Définition Un test cest une méthode qui permet de prendre une décision à partir des résultats dun échantillon.

Les tests d’hypothèses

Comparaison de plusieurs moyennes Analyse de variance

Régression -corrélation

Tests de comparaison de moyennes

Autres LOIS de PROBABILITES

Méthodes de Biostatistique

Nombre de sujets nécessaires en recherche clinique

Corrélation et régression linéaire simple

Le test t. Procédure de linférence statistique 1. Contexte théorique 2. Hypothèses 3. Seuil de signification et puissance 4. Taille de leffet 5. Collecte.

La corrélation et la régression

Corrélation Principe fondamental d’une analyse de corrélation

Comparaison de deux échantillons

Lien entre alpha et bêta

Tests d’hypothèses.

ORGANIGRAMME-MÉTHODES STATISTIQUES-COMPARAISONS DE MOYENNES

Méthodes de Biostatistique

ANALYSE DE DONNEES TESTS D’ASSOCIATION

Micro-intro aux stats.

M2 Sciences des Procédés - Sciences des Aliments

ANOVA à 1 facteur en groupes de mesure indépendants

STATISTIQUE INFERENTIELLE LES TESTS STATISTIQUES

L’erreur standard et les principes fondamentaux du test de t

ATELIERS STATISTIQUES

1 Licence Stat-info CM3 a 2004 V1.2Christophe Genolini Problème des groupes Un amphi de 200 élèves : loi normale moyenne X et écart type s –Un élève :

1 L2 STE. Test du χ2 d’adéquation/conformité: Il s'agit de juger de l'adéquation entre une série de données statistiques et une loi de probabilité définie.

Probabilités et statistique MQT-1102

Chapitre 4 Concepts fondamentaux Les composantes d’un test statistique Les hypothèses nulles en statistiques Le sens de p Inférence: comment traduire p.

Comparaison de plusieurs moyennes observées

Tests relatifs aux variables qualitatives: Tests du Chi-deux.

Tests relatifs aux variables qualitatives: Tests du Chi-deux.

Introduction aux statistiques Intervalles de confiance

UED SIM – Département OLCI Année Arts & Métiers ParisTech CER ANGERS Probabilités et statistiques Cours n° 2.

Chapitre 6 Les tests d ’ hypoth è se 1 – Comparer des moyennes ou des proportions.

Notions de statistiques et d’analyse de données Master 1 MGS – Sarah MISCHLER –

Chap. III Statistiques inférentielles

Transcription de la présentation:

Comparaison de deux moyennes observées Situation du problème : On dispose d’une variable qualitative binaire qui permet de définir deux groupes. On mesure une variable quantitative qui permet de calculer dans chaque groupe les différents paramètres de la distribution : moyenne, estimateur de l’écart type... On désire savoir si les moyennes observées dans chacun des groupes peuvent être considérées comme des estimateurs de la même moyenne aux fluctuations du hasard près. Par exemple, on a administré à deux groupes de patients tirés au sort deux somnifères. Dans le premier groupe, la durée moyenne du sommeil a été de 5,6 heures et dans le second de 4,9 heures. Les deux somnifères peuvent-ils être considérés comme entraînant la même durée moyenne de sommeil ? Attention : les techniques développées ci après ne concernent que le cas particulier de 2 groupes. Si il y a plus de deux groupes on utilise une autre approche. pour établir le test, on a besoin de l’hypothèse (que l’on peut tester) que les variances des populations dont sont issus les deux groupes sont identiques.

En pratiques deux cas de figure : Hypothèses Hypothèses : Hypothèse nulle : les deux moyennes observées xa et xb sont des estimateurs de deux moyennes µa et µb tels que µa = µb les deux échantillons sont issus d’une même population (même moyenne et même variance) Hypothèses alternatives Test bilatéral µa # µb Test unilatéral µa > µb o u (exclusif) µa < µb En pratiques deux cas de figure : Les effectifs des deux échantillons sont grands (supérieurs à 30) : Les calculs sont simplifiés, on peut utiliser une approche par la loi normale. Un des effectifs ou les deux sont petits. En plus de l’égalité des variances, la loi de distribution du paramètre doit suivre une loi normale. Il est nécessaire de calculer la variance commune. Eléments nécessaires aux calculs les deux moyennes, les effectifs des deux échantillons, les deux estimateurs des écart types (ou autres paramètres reliés : SCE, ESM, CV...)

Cas des grands échantillons Approximation par la loi normale : Lorsque les deux échantillons sont grands, xa suit une distribution normale de moyenne µa et de variance sa/Na Il en est de même pour xb Si les deux échantillons sont indépendants, la différence xa - xb suit une loi normale dont la moyenne est µa - µb et la variance sa/Na+ sb/Nb Si H0 est vraie µa - µb = 0 et 2 2 2 xa - xb u = suit approximativement une loi normale centrée réduite 2 Na Nb sa + sb 2 2 Si Na et Nb sont grands, sa + sb sont de bonnes approximations des “vraies” variances et on peut les utiliser dans le calcul. Il y a deux approximations de nature différente : Celle de la distribution de la moyenne par une loi normale. Celle de la variance par son estimateur. Si u est supérieur à ualpha on rejette l’hypothèse nulle. Lire dans la table le degré de signification p

Cas général (petits échantillons) Il doit être utilisé lorsqu’au moins un des échantillon a un effectif faible. Il est utilisable pour de grands échantillons mais nécessite plus de calculs. Calcul de la variance commune : * (Nb -1) s commun = SCEa + SCE b Na + Nb- 2 = sa 2 sb * (Na -1) + On démontre que : scommun |xa - xb | Na Nb + = t 2 suit une loi de student à Na + Nb- 2 DDL t alpha lu dans la table de Student pour le DDL correspondant • Si t > t alpha on rejette H0 : les deux moyennes diffèrent au risque alpha. On cherche le degré de signification p dans la table de t • Si t < t alpha on ne peut pas rejeter H0. Il n'y a pas de différence significative au seuil de risque alpha mais ATTENTION au risque bêta.

Reemarques Remarques sur les conditions d’applications : cas des petits effectifs : Egalité des variances : homocédasticité Cette condition est d’autant plus importante à respecter que les effectifs dans les deux échantillons sont très différents. Si cette condition n’est pas remplie certains proposent de prendre une sécurité en diminuant le degré de liberté du t. Normalité : Le test t est robuste à un écart de normalité en particulier si les effectifs des deux échantillons sont identiques et que les variances sont voisines.

Comparaison de deux variances Comparaison de 2 variances Pour vérifier l’homocédasticité : sa2 F = On met arbitrairement la plus grande variance au numérateur donc F > 1. DDL (Na-1), (Nb-1) sb2 On utilise la table du F pour déterminer la valeur critique. ATTENTION : le choix arbitraire nous met en condition unilatérale. Il faut donc utiliser la table F à 2,5% pour avoir un risque bilatéral de 5%. Si F > Falpha on rejette l’hypothèse d’égalité des variances. La comparaison des deux moyennes suppose l’égalité des variances. Ainsi, dans le cas de nos deux somnifères cela suppose qu’ils n’entraînent pas de différence de dispersion du temps de sommeil mais uniquement une translation de la moyenne. xa xb

Exemple Exemple : On compare la consommation de caféine chez 112 cancéreux : moyenne 147,2 mg/jour - écart type estimé 101,8 mg/jour à celle de 185 non cancéreux : moyenne 132,9 mg/jour - écart type 115,7 mg/jour. On prend un risque à 5%. Test bilatéral, grands échantillons 147,2 - 132,9 u = = 1,11 101,82 112 115,72 185 + 1,11 est inférieur à 1,96 => Différence non significative On aurait pu utiliser un t mais ce serait plus long car il faut alors calculer la variance commune.