La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Comprendre la variation Inférence statistique. zNous avons vu que bien souvent, nous fondons notre opinion ou prenons des décisions à partir déchantillons.

Présentations similaires


Présentation au sujet: "Comprendre la variation Inférence statistique. zNous avons vu que bien souvent, nous fondons notre opinion ou prenons des décisions à partir déchantillons."— Transcription de la présentation:

1 Comprendre la variation Inférence statistique

2 zNous avons vu que bien souvent, nous fondons notre opinion ou prenons des décisions à partir déchantillons. zSi léchantillon est représentatif et précis pour mesurer la caractéristique de la population,alors notre décision sera bonne. zLinférence statistique consiste à utiliser des méthodes sur les données de léchantillon que nous avons observées pour ensuite généraliser nos conclusions à lensemble de la population. zEn dautres termes, linférence nous permet destimer ou de déterminer quelles sont les valeurs possibles dans la populations pour sassurer que notre jugement ou décision ne serait pas modifié si nous avions les résultats pour toute la population (resensement).

3 Facteurs qui influencent la précision de linférence zReprésentativité de léchantillon – méthode déchantillonnage zTaille de léchantillon

4 Inférence statistique zEstimation et inférence pour la proportion p (pourcentage) dune population zEstimation et inférence pour la moyenne µ dune population zEstimation et inférence pour la différence entre 2 proportions.

5 Inférence pour une proportion p zExemple: Sur un échantillon de 125 étudiants d un collège interrogés pour savoir s ils ont l intention de voter aux prochaines élections de leur association, 45 ont répondu positivement. zEstimer, de façon ponctuelle, la proportion de l ensemble des étudiants de cette institution qui ont l intention de voter aux prochaines élections.

6 Inférence pour une proportion p zQuelle est la précision de cet estimé? zQuelle est linfluence de la taille de léchantillon? zEst-ce que nous sommes certains que cette proportion est nettement inférieure à 50 %?

7 Inférence pour une proportion p zPour répondre à ces questions, nous avons besoin de la distribution (estimé des résultats de plusieurs échantillons)de la statistique qui nous intéresse. ySuppose la normalité des données yUtilise les méthodes de simulation de Monté- Carlo zLa distribution nous permet ensuite de construire lintervalle de confiance

8 Estimation par intervalle de confiance zPour estimer la proportion p d individus possédant la caractéristique à l étude dans la population, ou la moyenne, on utilise un intervalle de confiance au niveau (1- ). zL estimation par intervalle de confiance consiste à établir un intervalle de valeurs qui nous permet d affirmer, avec un certain niveau de confiance ou de certitude prédéterminé (en général: 90%, 95% ou 99%), que la vraie valeur du paramètre dans la population se trouve dans cet intervalle.

9 Intervalle de confiance pour p la proportion p d individus possédant la caractéristique à l étude dans la population zPuisque cette estimé est une statistique obtenue à partir dun échantillon, on peut obtenir sa distribution: yOn suppose la normalité yOn simule la distribution (Monté-Carlo)

10 Intervalle de confiance pour estimer une proportion p (suite) zDe façon générale, si la taille de léchantillon n est assez grande, l intervalle de confiance au niveau (1 - ) pour estimer la vraie proportion p du caractère à l étude dans la population, est donnée par:

11 Exemple (suite) : zPar conséquent, un intervalle de confiance de 95% de certitude pour la proportion de l ensemble des étudiants de cette institution qui ont l intention de voter aux prochaines élections nous est donné par:

12 Exemple (suite) : zComment rapporterait-on les résultats de ce sondage dans le journal étudiant de ce collège? z36% des étudiants du collège ont l intention d exercer leur droit de vote aux prochaines élections de l association étudiante. La marge d erreur est de 8,4% avec un niveau de confiance de 95% (ou avec un degré de certitude de 95% ou 19 fois sur 20).

13 Remarques: zCette formule est approximative et s applique uniquement pour les grands échantillons. zSi je prends tous les échantillons aléatoires possibles de taille n et que je calcule pour chacun un intervalle de confiance au niveau de 95%, 95% dentre eux incluront la vraie proportion p de la population, et donc 5% ne l incluront pas. zLa quantité est appelé marge d erreur ou précision, au niveau de confiance 95% (19 fois sur 20).

14 Marge d erreur au niveau 95%

15 Marge d erreur au niveau 90%

16 Calcul de la taille n pour assurer une marge d erreur maximale zSi nous voulons estimer la proportion p au niveau de confiance (1- ) avec une marge d erreur maximale notée e, alors nous avons la relation suivante pour le calcul de la taille n de l échantillon:

17 Intervalle de confiance pour zOn estime le coût moyen du panier dépicerie avec zPuisque cette estimé est une statistique obtenue à partir dun échantillon, on peut obtenir sa distribution: yOn suppose la normalité yOn simule la distribution (Monté-Carlo)

18 Intervalle de confiance pour estimer la moyenne zDe façon générale, si la taille de léchantillon n est assez grande, l intervalle de confiance au niveau (1 - ) pour estimer la vraie moyenne de la population, est donnée par:

19 Remarques: zCette formule est approximative et s applique uniquement pour les grands échantillons (sauf si la caractéristique a une distribution normale et que l écart type est connu la formule est exacte). zLorsque l écart type est inconnu, on utilise une estimation de et on remplace la valeur de Z 0,025 =1,96 pour une valeur légèrement supérieure lu dans une table de la loi de Student qui dépend de la taille de l échantillon.

20 Remarques: (suite) zInterprétation dun intervalle de confiance au niveau 95% pour la moyenne d une caractéristique dans la population: Si je prends tous les échantillons aléatoires de taille n et que je calcule pour chacun un intervalle de confiance de 95%, 95% dentre eux incluront la vraie moyenne de la population, et donc 5% ne l incluront pas.

21 Intervalle de confiance pour Exemple zAfin de connaître le coût hebdomadaire moyen du panier d épicerie pour une famille de 4 personnes résidant à Sherbrooke, on prélève un échantillon de 50 de ces familles et on note le montant de leur épicerie de cette semaine. On obtient un montant moyen de 155$ avec une estimation de l écart type de 15$.

22 Exemple (suite) : zEstimer le coût actuel moyen du panier d épicerie d une famille de 4 personnes résidant à Sherbrooke à l aide d un intervalle de confiance de 95% de certitude (on suppose l écart type connu à 15$): zEn affirmant que le coût actuel moyen du panier d épicerie d une famille de 4 personnes résidant à Sherbrooke est dans l intervalle [150,84$; 159,16$], je suis 95% certain d avoir raison.

23 Estimation et inférence entre 2 proportions zExemple: yLa compagnie qui effectue du marketing direct en ligne désire améliorer son taux de réponse pour une de ces campagnes de promotion. yOn vous a confié le mandat de planifier ces tests et de déterminer si la nouvelle campagne est plus efficace que lancienne. yComment allez-vous procéder?

24 Estimation et inférence entre 2 proportions zSoit p 1 le taux de réponse de la campagne actuelle et p 2 le taux de réponse de la nouvelle campagne. zEn termes mathématiques, nous voulons déterminer si nous avons une évidence statistique nous permettant de conclure que la différence entre p 1 et p 2 est significativement différente, i.e p 1 p 2

25 Estimation et inférence entre 2 proportions zNous estimerons p 1 et p 2 à partir de statistiques calculées sur des échantillons. zNous savons que toutes les statistiques ont une distribution échantillonnale. zNous devons donc estimer quelle est la variation possible de

26 Estimation et inférence entre 2 proportions zLa distribution de Sera construite en supposant le statue quo,i.e p 1 = p 2 =p. Sous cette hypothèse, notre estimé de la proportion de la population est donc obtenu en combinant les résultats des deux échantillons :

27 zLintervalle de confiance pour la différence sera obtenu, en supposant la distribution normale,par zOu par simulation de Monté-Carlo


Télécharger ppt "Comprendre la variation Inférence statistique. zNous avons vu que bien souvent, nous fondons notre opinion ou prenons des décisions à partir déchantillons."

Présentations similaires


Annonces Google