STATISTIQUE INFERENTIELLE LES TESTS STATISTIQUES.

Présentations similaires


Présentation au sujet: "STATISTIQUE INFERENTIELLE LES TESTS STATISTIQUES."— Transcription de la présentation:

1 STATISTIQUE INFERENTIELLE LES TESTS STATISTIQUES

2 Un test consiste à Population caractère observé X, de moyenne  de variance  ² Émettre une hypothèse, notée H 0, appelée hypothèse nulle, sur un paramètre de X, sa loi... Construire une règle de décision Déterminer la zone de rejet de l’hypothèse H 0 en fonction d’un risque d’erreur  que l’on veut bien accepter Prendre une décision Choisir une grandeur calculée à partir de l’échantillon, appelée statistique Proposer une hypothèse alternative, notée H 1

3 LES RISQUES D’ERREUR DANS UN TEST La réalité est La décision est Accepter H 0 H 0 vraie Rejeter H 0 H 0 fausse Bonne décision Mauvaise décision: Erreur   = P(Rejeter H 0 sachant que H 0 est vraie) Mauvaise décision: Erreur   = P(Accepter H 0 sachant que H 0 est fausse)

4 IMPORTANCE DU CHOIX DES HYPOTHESES H 0 est l’hypothèse à laquelle on tient le plus, la plus vraisemblable... Il est donc plus grave de la rejeter à tort que de l’accepter à tort  = P(Rejeter H 0 sachant que H 0 est vraie) Pour construire le test on se fixe  = P(Accepter H 0 sachant que H 0 est fausse) Souvent l’utilisateur ne calcule pas EXEMPLE: Les OGM sont-ils bons pour la santé? Point de vue de MONSANTO H 0 = les OGM sont bons Si  n’est pas calculé, le choix de H 0 n’est pas innocent Point de vue du consommateur H 0 = les OGM ne sont pas bons

5 Test de comparaison d’une moyenne à une valeur donnée (variance connue) Hypothèses: H 0 = {  =  0 } contre Statistique:qui est un bon estimateur de la moyenne Conditions d’application:  connu. X suit une loi N( ,  ), n quelconque X quelconque, n > 5 (AFNOR) Si H 0 est vraie,  =  0  Si H 1 est vraie,  <  0   0 -h est une bonne estimation de  donc est proche de  Règle de décision: 00 Conclusion: Il existe  0 -h tel que  0 -h On rejette H 0 On accepte H 0  0 -h H 0 est vraie H 1 est vraie

6 suit une Test de comparaison d’une moyenne à une valeur donnée (variance connue) ……. Suite 1  donné et donc h  = P(Rejeter H 0 sachant que H 0 est vraie) Zone de rejet: Règle de décision: 00    0 -h H 0 est vraie H 1 est vraie  0 -h On rejette H 0 On accepte H 0  0 -h

7 suit une Test de comparaison d’une moyenne à une valeur donnée (variance connue) ……. Suite 2 Décision: Règle de décision: 00    0 -h H 0 est vraie H 1 est vraie  0 -h On rejette H 0 On accepte H 0  0 -h Si <  0 -h, on rejette H 0 avec un risque  connu de se tromper Si >  0 -h, on accepte H 0 avec un risque  de se tromper  = P(Accepter H 0 sachant que H 0 est fausse)  est fonction de , et n’est pas toujours calculée par l’utilisateur. Si c’est le cas, plutôt que d’accepter H 0, il vaut mieux conclure que l’échantillon observé ne permet pas de rejeter H 0. Zone de rejet: permet de calculer h

8 La règle de décision dépend de H 1  0 -h On rejette H 0 Règle:  0 +h On rejette H 0 Règle:  0 -h On rejette H 0 ou  0 +h Test de comparaison d’une moyenne à une valeur donnée (variance connue) ……. Suite 3 ….. et fin  H1H1  0 -h  H1H1  0 +h  H1H1  H1H1  0 -h  H0H0  H0H0 H 1 = {   0 }  H0H0

9 Test de comparaison d’une moyenne à une valeur donnée (variance inconnue) Hypothèses: H 0 = {  =  0 } contre H 1 = {   0 } Règle de décision:  0 -h On rejette H 0  0 +h On rejette H 0  0 -h On rejette H 0 ou  0 +h Zone de rejet: Décision: en comparant à  0 -h ou (et)  0 +h  = P(Rejeter H 0 sachant que H 0 est vraie) = …….. d’où h Conditions d’application:  inconnu. X suit une loi N( ,  ), n quelconque X quelconque, n 30 (AFNOR) Statistique:suit une T (n-1) (approximativement N(0,1) si n 30)

10 Test de comparaison d’une proportion à une valeur donnée Hypothèses: H 0 = { p = p 0 } contre ou f >  p 0 +h Règle de décision: f  p 0 -h On rejette H 0 f >  p 0 +h On rejette H 0 f  p 0 -h On rejette H 0  = P(Rejeter H 0 sachant que H 0 est vraie) = …….. d’où h Zone de rejet: Décision: en comparant f à p 0 -h ou (et) p 0 +h Statistique:F bon estimateur de la proportion Conditions d’application: tirage avec remise ou taux de sondage n/N < 10% n 50 et np(1-p) 9 (AFNOR)

11  1 -  2 = 0 Test de comparaison de deux moyennes (variances connues) Conditions d’application:     connus. X 1 suit une N(  ,   ), X 2 suit une N(  ,   ), n i quelconques X i quelconque, n i > 5 (AFNOR) Règle de décision: Zone de rejet: Statistique: Si H 0 vraie, suit une N( ,  d ) avec On rejette H 0 ou Décision: en comparant à h ou (et) -h  = P(Rejeter H 0 sachant que H 0 est vraie) = …….. d’où h Hypothèses: H 0 = {  1 =  2 } contre

12  1 -  2 = 0 Test de comparaison de deux moyennes (variances inconnues) Règle de décision: Zone de rejet: Hypothèses: H 0 = {  1 =  2 } contre On rejette H 0 Décision: en comparant à h ou (et) -h  = P(Rejeter H 0 sachant que H 0 est vraie) = …….. d’où h Statistique: Si H 0 vraie, suit une N( , s d ) avec On rejette H 0 ou Conditions d’application: n 1 et n 2 30 (AFNOR)

13 p 1 - p 2 = 0 Test de comparaison de deux proportions Règle de décision: Zone de rejet: Hypothèses: H 0 = { p 1 = p 2 } contre Décision: en comparant f 1 - f 2 à h ou (et) -h  = P(Rejeter H 0 sachant que H 0 est vraie) = …….. d’où h On rejette H 0 f 1 - f 2 < -h On rejette H 0 f 1 - f 2 > h On rejette H 0 ou f 1 - f 2 < -h f 1 - f 2 > h Conditions d’application: tirage avec remise ou taux de sondage n/N < 10% n 1 p, n 1 (1-p), n 2 p, n 2 (1-p) 5 Statistique: Si H 0 vraie, F 1 - F 2 suit une N( 0,  d ) avec et (estimation de p = p 1 = p 2 )

14 TEST D’AJUSTEMENT UN EXEMPLE On a observé pendant une longue période le montant hebdomadaire des dépôts en liquide dans la banque Ibardinescroak de Saint Jean de Luz. [8000 - 10000][10000 - 12000][6000 - 8000][4000 - 6000][2000 - 4000][0 - 2000] 28 100 166 222 5810 montant effectif Montant des dépôts Fréquence Le montant hebdomadaire des dépôts peut-il être considéré comme une loi Normale ?

15 Première étape: estimation des paramètres Estimation ponctuelle: Deuxième étape: ajustement à une loi normale Le montant hebdomadaire des dépôts est-il issu d’une v.a. X de loi Normale (  = 6561 ;  = 2016) ?

16 ObservationsX loi N(6561 ; 2016) Classe i n i = effectif observé dans la classe i n densité p i = P(X classe i) np i = effectif théorique dans la classe i Si les observations sont issues de la loi Normale (6561 ; 2016), les effectifs observés n i dans la classe i doivent être très proches des effectifs théoriques np i. Comment mesurer globalement la proximité des deux graphiques ? nini = aire de la surface de la classe i np i = aire de la surface de la classe i

17 Nombre de classes de la variable Nombre de paramètres estimés La proximité des 2 aires peut être mesurée par n i - np i Plus cette quantité est faible (positive ou négative) plus les aires sont proches La proximité des 2 graphiques peut être mesurée par Cependant, si les écarts positifs compensent les écarts négatifs, cette quantité peut être très faible avec des valeurs très différentes dans les 2 graphiques 2 1) Une mesure intuitive 2) Une mesure probabiliste n i est une observation d’une v.a. Effectif observé Effectif théorique = Efo i - Eft i qui suit une loi de  ² à = (k - r - 1) d.d.l. Donc est une observation d’une v.a. dont la loi n’est malheureusement pas connue. On utilise la quantité

18 Remarques importantes L’utilisation de la loi du  ² n’est justifiée que si les effectifs théoriques de chacune des classes est supérieur ou égal à 5. Si ce n’est pas le cas, il faut regrouper des classes contiguës afin d’augmenter les effectifs. Le nombre de degrés de liberté de la loi du  ² dépend du nombre de classes après regroupement. Le nombre de classes et l’amplitude des classes n’a pas d’importance

19 Résumé sur le test d’ajustement Règle de décision: Zone de rejet: Hypothèses: Décision: en comparant d à h Statistique: H 0 = { les observations sont issues d’une certaine loi} contre H 1 = { les observations ne sont pas issues de cette loi } On rejette H 0 d > h l’échantillon observé ne permet pas de rejeter H 0 d < h  = P(Rejeter H 0 sachant que H 0 est vraie) =, d’où h est une  ² à = (k - r -1) d.d.l. Si H 0 vraie,

20 TEST D’INDEPENDANCE DE 2 VARIABLES Y a-t-il un lien entre le montant des dépôts et la catégorie socio-professionnelle ? UN EXEMPLE Catégories socio- professionelles Professions libérales employés Fonctionnaires Moins de 500 €Entre 500 et 2000 €Plus de 2000 € 2050180 503020 23010 Montant des dépôts en liquide dans la banque Ibardinescroak en 2005 Total 250 100 250 21090300600 X Y

21 = = = Etudions la distribution de chacune des catégories professionnelles Si la variable X était indépendante de la variable Y, les distributions de chaque modalité de X seraient identiques, n ij / n i. = n. j / n pour tout i et j et identiques à celle du total

22 Tableau initialTableau lorsque X et Y sont indépendantes Si les 2 variables X et Y sont indépendantes, les 2 tableaux doivent contenir des valeurs très proches: n ij doit être très proche de, pour tout i et j Comment mesurer globalement la proximité des deux tableaux ?

23 Nombre de modalités de la variable en ligne Nombre de modalités de la variable en colonne La proximité de 2 cellules peut être mesurée par Plus cette quantité est faible (positive ou négative) plus les cellules sont proches La proximité des 2 tableaux peut être mesurée par Cependant, si les écarts positifs compensent les écarts négatifs, cette quantité peut être très faible avec des valeurs très différentes dans les 2 tableaux 2 1) Une mesure intuitive 2) Une mesure probabiliste n ij est une observation d’une v.a. Effectif observé Effectif théorique = Efo ij - Eft ij qui suit une loi de  ² à = ( -1)(c-1) d.d.l. Donc est une observation d’une v.a. dont la loi n’est malheureusement pas connue. On utilise la quantité

24 Remarques importantes L’utilisation de la loi du  ² n’est justifiée que si les effectifs théoriques de chacune des cellules est supérieur ou égal à 5. Si ce n’est pas le cas, il faut regrouper des modalités d’une des 2 variables afin d’augmenter les effectifs. Le nombre de degrés de liberté de la loi du  ² dépend du nombre de modalités des 2 variables après regroupement.

25 Résumé sur le test d’indépendance de deux variables Règle de décision: Zone de rejet: Hypothèses: Décision: en comparant d à h Statistique: H 0 = { les 2 variables X et Y sont indépendantes } contre H 1 = { les 2 variables X et Y sont dépendantes } On rejette H 0 d > h l’échantillon observé ne permet pas de rejeter H 0 d < h  = P(Rejeter H 0 sachant que H 0 est vraie) =, d’où h est une  ² à = ( -1)(c-1) d.d.l. Si H 0 vraie,


Télécharger ppt "STATISTIQUE INFERENTIELLE LES TESTS STATISTIQUES."

Présentations similaires


Annonces Google