Télécharger la présentation
La présentation est en train de télécharger. S'il vous plaît, attendez
1
Formation Green Belt Lean Six Sigma
Intervalles de confiance
2
Objectifs Comprendre la notion d’intervalle de confiance
Sélectionner l’intervalle de confiance approprié Utiliser l’intervalle de confiance lors de la prise de décision Apprécier les limites des intervalles de confiance Comprendre l’utilité du Théorème Central Limite
3
Rappel Paramètres de la population Statistiques de l’échantillon
Moyenne : m Écart-type : s Taille de la population : N Statistiques de l’échantillon Moyenne : x Taille de l’échantillon : n Des conclusions au sujet de la population sont établies à partir des échantillons Cependant, un niveau d’incertitude demeure
4
Population et échantillon
La population représente la région complète d’intérêt L’échantillon est un sous-ensemble de la population Quelle est la relation entre la population et l’échantillon ? Population Échantillon Est-ce que cet échantillon est représentatif de la population ?
5
Concept de la variabilité de la moyenne
Les statistiques des échantillons estiment les paramètres de la population : Erreur-type de la moyenne : n=5 n=3 n=1
6
Théorème Central Limite
L’inférence statistique implique souvent comme hypothèse que les variables aléatoires correspondent à une distribution normale Cependant, il arrive que cette hypothèse ne tienne pas Heureusement, il existe un théorème d’une grande importance qui contourne en partie le problème de la non normalité des variables continues Ce théorème est le Théorème Central Limite
7
Théorème Central Limite (suite)
Si x1, x2, …, xn sont des mesures indépendantes (i.e. un échantillon aléatoire de taille n) d'une population de moyenne μ et d'écart-type σ Alors la distribution de a pour moyenne et écart-type : De plus, lorsque n est suffisamment grand, la distribution de X-barre est approximativement normale Erreur-type de la moyenne
8
Théorème Central Limite (suite)
Peu importe la distribution d’une population, si plusieurs échantillons de taille n de cette population sont tirés et qu’à chaque échantillon la valeur moyenne est considérée, alors la distribution de se rapprochera de la distribution normale à mesure que n augmentera Taille minimum requise pour chaque échantillon en fonction de la distribution des données individuelles Distribution symétrique et unimodale n ≥ 5 Règle pratique souvent utilisée en contrôle de la qualité Distribution symétrique mais sans mode dominant n ≥ 12 Par exemple, la distribution uniforme Distribution quelconque Dans certains cas, n ≥ 30 est suffisant Sinon, n ≥ 100
9
Intervalle de confiance (IC)
Étant donné que… La moyenne et l’écart-type d’un échantillon sont des statistiques Qui estiment la moyenne (m) et l’écart-type (s) de la population Calculées seulement avec les données de l’échantillon Ces statistiques varient d’un échantillon à l’autre … L’intervalle de confiance permet de quantifier l’incertitude associée au calcul d’une statistique Habituellement, un intervalle de confiance à 95 % est calculé Signifie qu’il est probable à 95 % que l’intervalle de confiance contienne la vraie valeur du paramètre de la population
10
IC pour la moyenne () avec écart-type de la population () connu
Exemple 1 Une compagnie aérienne a besoin d’estimer le nombre moyen de passagers sur un nouveau vol Par expérience, la compagnie sait que les données recueillies pendant le premier mois sont peu représentatives, mais qu'après un mois, le nombre de passagers se stabilise La moyenne du nombre de passagers est calculée pour les 20 premiers jours ouvrables à partir du deuxième mois d'existence de ce nouveau vol Si la moyenne de l'échantillon (x-barre) est 112 et que l'écart-type de la population (σ) est déjà connu à 25, calculez l'intervalle de confiance à 95% pour la vraie moyenne à long terme du nombre de passagers sur ce vol
11
IC pour la moyenne () avec écart-type de la population () connu (suite)
Avec un échantillon aléatoire de taille n provenant d’une population distribuée selon la loi normale et avec un écart-type connu σ, il est possible de définir l’intervalle de confiance à 100(1-α)% d’inclure la moyenne de la population μ : Lorsque la distribution d’une population n’est pas normale tout en n’étant pas trop asymétrique, il suffit de prendre un échantillon d’au moins 30 observations pour calculer un intervalle de confiance représentatif de la moyenne de la population En s’appuyant sur le Théorème Central Limite
12
IC pour la moyenne () avec écart-type de la population () connu (suite)
Solution de l’exemple 1 Nous émettons l'hypothèse que la distribution de la population des passagers par embarquement quotidien n'est pas trop asymétrique Par conséquent, la distribution de l'échantillon de x-barre est à peu près normale et les résultats des intervalles de confiance sont approximativement corrects, même pour une taille d'échantillon de seulement 20 jours ouvrables
13
IC pour la moyenne () avec écart-type de la population () connu (suite)
Pour un intervalle de confiance à 95 %, z.025= 1.96 et : L’intervalle de confiance à 95 % du nombre moyen de passagers m au fil du temps est donc :
14
Considérations sur l’écart-type de la population () connu
Il est rare de connaître la vraie valeur de l’écart-type de la population Lorsque est inconnu, il faut l’estimer à partir de l’écart-type (s) d’un échantillon provenant de cette population Si est estimé par s, il faut plutôt utiliser la distribution de Student (t) pour calculer l’intervalle de confiance Toute chose étant égale par ailleurs, l’impact de ce changement est l’obtention d’un intervalle de confiance plus étendu Il en est ainsi pour tenir compte de l’incertitude additionnelle provenant de l’ignorance de
15
Distribution de Student (t)
Il s'agit plutôt d'une famille de distributions De par leur forme (cloche symétrique), elles sont similaires à la courbe normale, bien que plus larges et plus aplaties aux extrémités La taille d'échantillon détermine dans quelle mesure la distribution est plus large et plus aplatie Plus la taille d'échantillon est petite, plus la distribution est large et aplatie aux extrémités Plus la taille d'échantillon augmente, plus la distribution t se rapproche de la distribution normale (Z)
16
IC pour la moyenne () avec écart-type de la population () inconnu
Avec un échantillon prélevé à partir d’une population distribuée selon la loi normale de moyenne μ inconnue et d’écart-type σ inconnu, il est possible de définir l’intervalle de confiance à 100(1-α)% d’inclure la moyenne de la population μ :
17
IC pour la moyenne () avec écart-type de la population () inconnu (suite)
Exemple 2 Déterminer un IC à 95 % pour la moyenne μ, à partir des 10 observations suivantes récoltées dans le cadre d’un test de survie où Données de l’échantillon : 247.5, 250.8, 283.3, 276.9, 242.4, 271.5, 275.4, 247.5, 256.6, 249.7 Moyenne (X) = Écart-type de l’échantillon (s) = 14.99 α = (1-0.95) = 0.05 = 5 % n = 10 tα/2; n-1 : valeur t de la table de Student où α / 2 (2,5 %) et avec n-1 (9) degrés de liberté
18
IC pour la moyenne () avec écart-type de la population () inconnu (suite)
Exemple 3 Selon un contrat d’approvisionnement, les clients d'une raffinerie s'attendent à recevoir des barils qui contiennent 55 gallons d'huile Un échantillonnage aléatoire de 20 barils est sélectionné pour déterminer si le contrat est respecté La moyenne des 20 barils échantillonnés est égale à gallons et l'écart-type (s) est égal à gallon Les données au sujet des 20 barils sont les suivantes : 54.1, 53.3, 56.1, 55.7, 54.0, 54.1, 54.5, 57.1, 55.2, 53.8, 54.1, 54.1, 56.1, 55.0, 55.9, 56.0, 54.9, 54.3, 53.9, 55.0 Quel est l'intervalle de confiance à 95% de la quantité moyenne d'huile versée dans les barils qui devraient contenir 55 gallons ?
19
IC à 95% pour quantité moyenne d'huile
x = s = 1.008 n = 20 t.025,19 = 2.09 (si n = 20 barils) D’après l’échantillon de 20 barils, il y a 95 chances sur 100 que la quantité d'huile versée en moyenne dans un baril de 55 gallons soit entre gallons et gallons Heureusement, Minitab peut calculer les valeurs t de la distribution de Student
20
Intervalle de confiance avec Minitab
Ouvrir le fichier OIL REFINERY.MTW
21
Intervalle de confiance avec Minitab (suite)
Stat < Basic Statistics < Graphical Summary
22
Intervalle de confiance avec Minitab (suite)
Il y a 95 chances sur 100 que cet intervalle contienne la moyenne de la quantité d’huile réellement versée dans un baril de 55 gallons
23
Intervalle de confiance pour l’écart-type σ
Comme pour toute statistique, il est possible de calculer un intervalle de confiance à 100(1-α)% pour estimer l’écart-type σ d’une population distribuée selon la loi normale, de moyenne μ inconnue, et d’écart-type σ inconnu :
24
Intervalle de confiance pour l’écart-type σ (suite)
Suite de l’exemple 3 n - 1 = = 19 s = 1,008 α = 0,05 Ainsi, il y a 95 chances sur 100 que l’écart-type de la variation de la quantité d’huile versée dans un baril de 55 gallons soit comprise dans l’intervalle suivant : [0,767 ; 1,472] Ces valeurs proviennent de la distribution du Chi-deux et sont disponibles dans une table ou par l’entremise de Minitab
25
Intervalle de confiance avec Minitab (suite)
Il y a 95 chances sur 100 que cet intervalle contienne l’écart-type de la quantité d’huile réellement versée dans un baril de 55 gallons
26
Intervalle de confiance pour une proportion
L’intervalle de confiance à 100(1-α)% pour estimer la proportion p d’éléments (ou d’individus) qui possèdent un certain caractère qualitatif dans la population est : en autant que où n = taille de l’échantillon x = quantité de succès ou de défauts p = proportion réelle de succès ou de défauts dans la population Z = valeur provenant de la distribution normale, disponible dans une table Z ou par l’entremise de Minitab, en fonction du niveau de confiance désiré (= 1.96 lorsque le niveau de confiance est 95%)
27
Précision de l’intervalle de confiance
Plus l’intervalle de confiance est étroit, plus l’information s’avère précise La largeur de l’intervalle est influencée par trois facteurs : Taille d’échantillon : n Niveau de confiance : (1 - α)% Détermine en partie la valeur de la constante Z ou t Écart-type σ de la variation présente dans la population Estimée très souvent par l’écart-type s de la variation présente dans l’échantillon
28
Précision de l’intervalle de confiance (suite)
Plus la taille d’échantillon est grande, plus l’intervalle de confiance est étroit (précis) Plus l’écart-type de la variation est petit, plus l’intervalle de confiance est étroit (précis) Plus le niveau de confiance souhaité est grand, plus l’intervalle de confiance est grand (imprécis)
29
Intervalles de confiance : Résumé des formules
Moyenne : Écart-type : Proportion :
30
Points à retenir Utiliser les intervalles de confiance permet d’identifier et de minimiser les risques dans la prise de décision La taille d’échantillon, l’écart-type estimé de la population et le niveau de confiance souhaité influence tous la largeur de l’intervalle de confiance et par le fait même sa précision
31
Politique de propriété intellectuelle
Le présent document est la propriété unique et exclusive de Promaintech Novaxa. L’utilisation non autorisée, la divulgation ou la reproduction, sous quelque forme que ce soit, du matériel contenu dans ce document est expressément interdite. Toute utilisation non autorisée ou illégale par l’usager le rendra susceptible de faire l’objet de toute procédure légale et appropriée, à la disposition de Promaintech Novaxa. © Promaintech Novaxa Tous droits réservés
Présentations similaires
© 2024 SlidePlayer.fr Inc.
All rights reserved.