TESTS RELATIFS AUX CARACTERES QUANTITATIFS

Slides:



Advertisements
Présentations similaires
Intervalles de confiance
Advertisements

Intervalles de confiance
Introduction aux statistiques Intervalles de confiance
L’échantillonnage & Ses Fluctuations
Indicateurs de Suivi, Risques & Mesure d’Associations
Comparaison d’une moyenne observée à une moyenne théorique
Corrélation Position du problème Définition covariance (X,Y) r =
STATISTIQUE INFERENTIELLE L ’ESTIMATION
Echantillonnage Introduction
CTPC du 16 décembre Situation des effectifs des personnels fonctionnaires.
Inférence statistique
Comparaison de deux moyennes observées
Inférence statistique
Faculté de médecine de Nancy - SPI-EAO - Pr. F. KOHLER
Comparaison d'une distribution observée à une distribution théorique
Comparaison de deux pourcentages observés
Comparaison de plusieurs moyennes observées
Variable aléatoire, estimation ponctuelle et par intervalle
Les TESTS STATISTIQUES
Tests de comparaison de pourcentages
Nombre de sujets nécessaires en recherche clinique
Tests non paramétriques de comparaison de moyennes
Les TESTS STATISTIQUES
Les Tests dhypothèses. 1)Définition Un test cest une méthode qui permet de prendre une décision à partir des résultats dun échantillon.
Échantillonnage-Estimation
5 La Loi de Laplace Gauss ou loi Normale
Comparaison de plusieurs moyennes Analyse de variance
Régression -corrélation
Fluctuations d’une fréquence selon les échantillons, Probabilités
Tests de comparaison de moyennes
FERRAFIAT Nicolas Le logiciel d’estimation statistique en fiabilité
Méthodes de Biostatistique
1 - Construction d'un abaque Exemple
Nombre de sujets nécessaires en recherche clinique
Régression linéaire simple
Échantillonnage (STT-2000)
Mathématiques Les statistiques et probabilités en STI2d/STL
Partie 3 La psychophysique.
Howell, Chap. 1 Position générale
Université dOttawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :47 1 Concepts fondamentaux: statistiques et distributions.
Théorie… Inférence statistique: étude du comportement d’une population ou d’un caractère X des membres d’une population à partir d’un échantillon aléatoire.
Distribution d’échantillonnage
Lectures Volume du cours : Chapitre 7
Tests d’hypothèses.
Mesures de position Ils s’expriment dans la même unité que les observations Moyenne et moyenne pondérée Exemple : on dispose du nombre moyen d’enfants.
1 - Programme de Seconde (juin 2009) Statistique et probabilités
Méthodes de Biostatistique
ESTIMATION 1. Principe 2. Estimateur 3. Distribution d’échantillonnage
Théorème de la limite centrale l’inférence statistique
Probabilités et Statistiques
STATISTIQUES DESCRIPTIVES
Vers une loi à densité. Masse en gEffectifFréquence % [600,800[1162,32 [800,900[3957,9 [900,1000[91818,36 [1000,1100[124824,96 [1100,1200[121824,36 [1200,1300[71514,3.
STATISTIQUE INFERENTIELLE LES TESTS STATISTIQUES
L’erreur standard et les principes fondamentaux du test de t
Intervalles de fluctuation et de confiance. Dans une population, la proportion d’individus ayant un caractère donné est notée p Population.
Échantillonnage (STT-2000)
Analyse des données. Plan Lien entre les statistiques et l’analyse des données Propagation des erreurs Ajustement de fonctions.
1 Licence Stat-info CM3 a 2004 V1.2Christophe Genolini Problème des groupes Un amphi de 200 élèves : loi normale moyenne X et écart type s –Un élève :
LOI NORMALE LOI STUDENT ECHANTILLONS ET TESTS DE MOYENNE
Probabilités et statistique MQT-1102
ECHANTILLONAGE ET ESTIMATION
Tests relatifs aux variables qualitatives: Tests du Chi-deux.
Tests relatifs aux variables qualitatives: Tests du Chi-deux.
Distributions d’échantillonnage pour des proportions
Académie européenne des patients sur l'innovation thérapeutique Rôle et notions élémentaires des statistiques dans les essais cliniques.
Scénario Quatre hipsters entrent en collision un dans l'autre dans un ascenseur plein de personnes. En conséquence ils laissent tomber leurs téléphones.
Introduction aux statistiques Intervalles de confiance
Chapitre 4 Statistique descriptive 1. Echantillonnage statistique population On appelle population, un ensemble d’individus auquel on s’intéresse échantillon.
Chapitre 6 Les tests d ’ hypoth è se 1 – Comparer des moyennes ou des proportions.
Transcription de la présentation:

TESTS RELATIFS AUX CARACTERES QUANTITATIFS

I- Position du Problème

Généralités Supposons une population infiniment grande pour laquelle la moyenne d’un caractère quantitatif X est m = m0. On dispose d’un ou de plusieurs échantillons de moyennes m1, m2,….mi… ;mk. mk m= m0 m1 m2 mi Les observations mi sont elles compatibles avec l’hypothèse que dans la population m = m0 ? Population

Trois problèmes peuvent être posés dans ces conditions : La comparaison d’une moyenne observée à une moyenne théorique, L’estimation d’une moyenne théorique à partir d’une moyenne observée et La comparaison des moyennes observées deux à deux.

II- Estimation statistique

au hasard d’un échantillon Soit X, une variable aléatoire quantitative de moyenne m et de variance s2. Ces paramètres sont ceux d’une population de taille infini et peuvent être indéterminés. m = m0 Tirage parfaitement au hasard d’un échantillon de taille N m

La moyenne de la variable aléatoire X de cet échantillon est m de sorte que: La quantité S2 est un bon estimateur de s2 au niveau de l’échantillon; telle que:

En tirant plusieurs échantillon de la population, les moyennes observées sont m1, m2,….mk. …… Population La distribution de ces différentes moyennes est appelée distribution d’échantillonnage de la moyenne.

Il est évident, et l’expérience le montre que ces différentes moyennes ne sont pas identiques. Les observations mi varient, et ses variations expriment les fluctuations de l’échantillonnage. Autrement dit, la distribution des moyennes des différents échantillons constitue une nouvelle variable aléatoire, sur laquelle on peut appliquer les règles de calcul des variables aléatoires.. m = {m1, m2,……..m3,……….mk}

Les Différents paramètres de cette nouvelle distribution m = {m1, m2,……..m3,……….mk} sont: La moyenne théorique de la distribution des moyennes est égale à E(m) = m . Les différentes moyennes observées m1, m2…mi…mk sont regroupées autour de cette moyenne théorique m. La variance de la moyenne s2m et son écart type sm de la nouvelle distribution sont:

Il est clair que plus la taille N des échantillons est grande, plus les différentes moyennes observées m1, m2…mi…mk sont regroupées de manière très proche autour de la moyenne théorique m. Plus N augmente Plus la variance diminue

La Loi de probabilité de la distribution des moyennes La forme de la distribution des moyennes ne peut être connue que si l’on connaît la distribution de la variable aléatoire X dans la population. D’une manière générale, si le caractère étudié (V.A X) obéit à une loi de Laplace Gauss dans la population, alors la distribution des moyennes mi suit également une loi normale η(m,sm) ou encore une Loi normale centrée réduite e(0,1).

Toutefois, on peut admettre que lorsque l’effectif N tend vers l’infini, la loi de probabilité de la distribution de m suit une loi normale quelque soit la distribution de X dans la population. En pratique, on considère des moyennes normale une distribution à partir de N>=30 m1 mi mk -sm m +sm

Intervention de la loi de student: Sx est l’écart - type Estimé de la Variable aléatoire X Lorsque la taille de l’échantillon est petite, N<30; la loi de probabilité de la distribution des moyennes mi pour une variable aléatoire X distribuée normalement, ne suit pas une loi normale, mais une loi de student t à (N-1) degré de liberté, centrée réduite, de sorte que:

on considère que la loi de En pratique, Student tend vers une loi Le remplacement de s par son estimateur S a pour effet de modifier les calculs et les rendres sans biais. La forme de la loi montre que dès que l’effectif augment, la loi de student tend vers une loi normale centrée réduite e (0,1). on considère que la loi de En pratique, Student tend vers une loi Normale centrée réduite si N>=30

En résumé, on distingue 4 situations selon la distribution de X: X suit une loi normale dans la population X ne suit pas une loi normale dans la population Grand Échantillon N≥30 La distribution des moyennes suit une loi normale La distribution des moyennes suit une loi approximativement normale Petit Échantillon N<30 La distribution des moyennes suit une loi de student Loi Indéterminée !!!!!!!!!!!???

III- Comparaison d’une moyenne observée m à une moyenne théorique m

Tirage parfaitement au hasard Population de taille infini Soit un échantillon E de N individus sur lequel on mesure la valeur d’une variable aléatoire continue X. Tirage parfaitement au hasard Population de taille infini De moyenne m Échantillon (N) m On cherche à savoir si la moyenne de x au niveau de l’échantillon est compatible à celle de la population?.

En d’autre termes, le problème peut être posé de 3 manières: Sur le critère de la VA X, l’échantillon E est-il issu de la population P? (Situation bilatérale) L’échantillon E provient-il d’une population P’ dont la moyenne de la VA X est supérieure à celle de la population P? (Situation unilatérale) L’échantillon E provient-il d’une population P’’ dont la moyenne de la VA X est inférieure à celle de la population P? (Situation unilatérale)

Situation unilatérale Situation unilatérale En situation bilatérale; la signification est testée à 5% Situation bilatérale m ≠ m Situation unilatérale m > m Situation unilatérale m < m En situation Unilatérale; la signification est testée à 10% m

Dans la suite du résonnement, on pose les notations suivantes: m : moyenne de X observée ou calculée sur l’échantillon. m: moyenne théorique de X au niveau de la population de référence P. s2: Variance théorique de X dans la population. s2: Estimateur sans biais de la variance de X dans la population.

III-1. Cas de petits échantillons: (N<30) III-1-1. Si la distribution de la VA X suit une loi normale et la variance est inconnue: Dans ce cas, on utilise une loi de student t à N-1 ddl de sorte que:

1 2 3 4 5 6 7 8 t suit une loi de student à N-1 ddl La valeur de t calculé est confrontée à celle de t lue sur la table théorique à (N-1) ddl et au seuil choisi selon que le test soit bilatéral (5%) ou unilatéral (10%).

Exemple: On sait que la concentration plasmatique du calcium du sujet sain est m=2,5 mmol/mt Sur un échantillon de 18 personnes, on a trouvé une moyenne m de 3,2 mmole/ml et un écart type estimé Sx = 1,1 mmole/ml. Peut-on conclure que la calcémie moyenne des 18 personnes soit augmentée? NB: On suppose que la moyenne m’ de la calcémie, de la population dont l’échantillon est issu, suit une loi binomiale.

Suit une loi de student à 17 ddl Réponse: Choix du Test et vérification des conditions de son application L’échantillon est Petit N<30, mais la VA « Calcémie » suit une loi normale dans la population dont l’échantillon est issu. Application du Test: Suit une loi de student à 17 ddl (18-1)

Définir H0 et H1 H0: On considère que m’ = m. La moyenne de la calcémie au niveau de l’échantillon ne diffère pas significativement de la moyenne des sujets sains. H1: On considère que m’ > m. La moyenne de la calcémie au niveau de l’échantillon est supérieure à la moyenne des sujets sains.

en situation Unilatérale Fixer la taille du test et définir la règle de décision Puisqu’on veut savoir si la moyenne au niveau de l’échantillon est supérieure à celle de la population, on est dans une situation unilatérale. La valeur critique (ou limite) en situation bilatérale est t(5% / 17ddl) = 2,11. La valeur de t calculée va être comparée à 1,74 puisqu’on est en situation Unilatérale La valeur critique (ou limite) en situation unilatérale est t(10% / 17ddl) = 1,74.

Application de la règle de décision Calcul de t observée On rejette H0 au risque de 5% on conclu que la moyenne au on retient H1 & niveau de l’échantillon est supérieure à celle de la population de référence. Application de la règle de décision La valeur de t calculée va être comparée à 1,74 puisqu’on est en situation Unilatérale La valeur de tcalculée = 2,7 est supérieure à la valeur de la table t(10% / 17ddl) = 1,74.

III-1. Cas de petits échantillons (Suite): (N<30) III-1-2. Si la distribution de la VA X est inconnue: Dans ces conditions (cf Tableau) il n’existe pas de test non paramétrique pour comparer les moyennes!!!? On utilise alors la médiane. On utilise alors la médiane en comparant la proportion des sujets à droite de la médiane de la population (ou à gauche) par rapport à 50%.

Exemple: Score de la douleur sur 15 patients traité a avec un nouvel morphinique. La médiane de la population de référence traité par un ancien médicament est de 4. Ce score varie de 0 (aucune douleur) à 10 (douleur intense). Les résultats obtenus sont repectivement: 0,0,1,1,2,2,2,3,3,4,5,6,7,8,8 Solution: Dans l’échantillon le % des patient ayant un score <4 est de 60% (9/15)

On doit donc utiliser un test de conformité Le problème revient donc à la comparaison d’une proportion observée (60%) à une proportion théorique au niveau de la population (50%) On doit donc utiliser un test de conformité pour comparer une fréquence observée à une fréquence théorique. (cf. Chap. Manipulation des fréquences)

III-2. Cas des grands échantillons :(N≥30) Dans ce cas, quelque soit la distribution de la VA X dans la population, on suppose que la distribution des moyenne m suit une loi normale d’espérance m et d’écart type sm.

Cet écart suit une loi normale centrée et réduite e (0,1). Le test consiste donc à calculer l’écart réduit et le confronter à l’écart théorique au niveau de la table de l’écart réduit.

La valeur de l’écart calculé e est confrontée à celle de e lue sur la table théorique au seuil choisi selon que le test soit bilatéral (5%) ou unilatéral (10%).

IV- Estimation d’une moyenne théorique m à partir d’une moyenne observée m

Intervalle de confiance d’une moyenne théorique m

III-1. Cas de petits échantillons : (N<30) Dans ces conditions, il est nécessaire de s’assurer de la normalité de la distribution des moyennes. Il est également, obligatoire, de remplacer la variance s2 par son estimation S2. On utilisera pour le calcul statistique le t de student.

En pratique, le calcul se fait de la manière suivante:

III-1. Cas des grands échantillons : (N≥30) Dans ces conditions, on suppose que la variance est connue, et que l’échantillon est assez grand pour considérer une distribution de moyenne normale. On utilisera pour le calcul statistique le e de l’écart centré réduit.

En pratique, le calcul se fait de la manière suivante:

L’intervalle de confiance de la moyenne a (1-a)% chance de recouvrir la moyenne théorique de la population à partir de laquelle l’échantillon de moyenne m a été issu. Une meilleure estimation de l’intervalle de confiance de la moyenne est obtenue en utilisant l’estimateur sans biais de la variance S2 pour le calcul au lieu de la variance s2.

V- Comparaison de deux moyennes observées m1 & m2

On dispose de 2 Échantillon E1 et E2. E1 E2 Population E1 E2 m1 m2 m= m0 On veut comparer les moyennes observées aux niveaux des 2 Échantillon E1 et E2.

En d’autre termes, le problème peut être posé de 3 manières: Sur le critère de la VA X, la moyenne m1 de l’échantillon E1 est-elle différente de la moyenne m2 de l’échantillon E2? (Situation bilatérale) Sur le critère de la VA X, la moyenne m1 de l’échantillon E1 est-elle supérieure à la moyenne m2 de l’échantillon E2? (Situation unilatérale) Sur le critère de la VA X, la moyenne m1 de l’échantillon E1 est-elle inférieure à la moyenne m2 de l’échantillon E2? (Situation unilatérale)

Définir H0 et H1 Sur le critère de la VA X, la moyenne m1 de l’échantillon E1 est-elle différente de la moyenne m2 de l’échantillon E2? (Situation bilatérale) m1 et m2 sont respectivement les moyennes théoriques des 2 populations dont on a tirées E1 et E2. H0: On considère que m1 = m2. La moyenne m1 au niveau de l’échantillon E1 ne diffère pas significativement de la moyenne m2 de E2. H1: On considère que m1 ≠ m2. La moyenne m1 au niveau de l’échantillon E1 diffère significativement de la moyenne m2 de E2.

Définir H0 et H1 Sur le critère de la VA X, la moyenne m1 de l’échantillon E1 est-elle supérieure à la moyenne m2 de l’échantillon E2? (Situation unilatérale) m1 et m2 sont respectivement les moyennes théoriques des 2 populations dont on a tirées E1 et E2. H0: On considère que m1 = m2. La moyenne m1 au niveau de l’échantillon E1 ne diffère pas significativement de la moyenne m2 de E2. H1: On considère que m1 > m2. La moyenne m1 au niveau de l’échantillon E1 es supérieure significativement de la moyenne m2 de E2.

Définir H0 et H1 Sur le critère de la VA X, la moyenne m1 de l’échantillon E1 est-elle inférieure à la moyenne m2 de l’échantillon E2? (Situation unilatérale) m1 et m2 sont respectivement les moyennes théoriques des 2 populations dont on a tirées E1 et E2. H0: On considère que m1 = m2. La moyenne m1 au niveau de l’échantillon E1 ne diffère pas significativement de la moyenne m2 de E2. H1: On considère que m1 < m2. La moyenne m1 au niveau de l’échantillon E1 est inférieure significativement de la moyenne m2 de E2.

V.1- Cas des petits échantillons N1 ou N2 < 30

On suppose que les variables au niveau des 2 échantillons suivent une loi normale et que les 2 variances sont égales s1 = s2. Dans ces conditions; on estime la variance commune aux 2 échantillons:

On calcul l’écart observé en utilisant le test t de student: La quantité tobs. Suit une loi de student à (N1 +N2-2)ddl sous l’hypothèse nulle. La quantité tobs. Est donc comparée à la table à(N1+N2-2)ddl et à 5%(test bilatéral) ou à 10% (test unilatéral).