Formation Green Belt Lean Six Sigma

Slides:



Advertisements
Présentations similaires
STATISTIQUE INFERENTIELLE L ’ESTIMATION
Advertisements

Les tests d’hypothèses (I)
TESTS RELATIFS AUX CARACTERES QUANTITATIFS
Echantillonnage Introduction
Collecte de données F. Kohler.
Inférence statistique
Les TESTS STATISTIQUES
Les TESTS STATISTIQUES
Échantillonnage-Estimation
Les tests d’hypothèses
Statistiques et probabilité :
Probabilités et statistique en TS
Lectures Volume obligatoire: Chapitre 8
Statistiques et Probabilités au lycée
Méthodes de Biostatistique
L’inférence statistique
Régression linéaire simple
Échantillonnage (STT-2000)
Comprendre la variation
La corrélation et la régression
Université dOttawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :47 1 Concepts fondamentaux: statistiques et distributions.
Théorie… Inférence statistique: étude du comportement d’une population ou d’un caractère X des membres d’une population à partir d’un échantillon aléatoire.
ÉCHANTILLONNAGE AU FIL DES PROGRAMMES Stage : nouveaux programmes de première Novembre 2011.
Lectures Volume du cours : Chapitre 7
Les intervalles de confiance pour la moyenne d’une population
Théorème de la limite centrale l’inférence statistique
STATISTIQUES – PROBABILITÉS
Intervalles de confiance pour des proportions L’inférence statistique
Échantillonnage (STT-2000)
Chapitre 3: Variables aléatoires réelles continues
Concepts fondamentaux: statistiques et distributions
L’erreur standard et les principes fondamentaux du test de t
Intervalles de fluctuation et de confiance. Dans une population, la proportion d’individus ayant un caractère donné est notée p Population.
Échantillonnage (STT-2000)
LOI NORMALE LOI STUDENT ECHANTILLONS ET TESTS DE MOYENNE
Chapitre 4 Concepts fondamentaux Les composantes d’un test statistique Les hypothèses nulles en statistiques Le sens de p Inférence: comment traduire p.
ECHANTILLONAGE ET ESTIMATION
Formation Green Belt Lean Six Sigma Tests d’hypothèses
Tous droits réservés © Promaintech Novaxa Introduction à la phase Contrôler Formation Green Belt Lean Six Sigma.
© Promaintech Novaxa – Tous droits d’utilisation réservés D MAIC Cartes de contrôle pour petites séries Introduction à la statistique industrielle.
Distributions d’échantillonnage pour des proportions
Tous droits réservés © Promaintech Novaxa Documentation du projet Formation Green Belt Lean Six Sigma.
Solutions Lean © Fujitsu Canada Formation Green Belt Lean Six Sigma Clôture du projet Septembre 2010.
Tous droits réservés © Promaintech Novaxa Solutionnaire Exercice Phase Innover.
© Fujitsu Canada Introduction à Minitab Version 14 - Anglais Formation Black Belt Lean Six Sigma.
Académie européenne des patients sur l'innovation thérapeutique Rôle et notions élémentaires des statistiques dans les essais cliniques.
Formation Green Belt Lean Six Sigma Atelier Statapulte
Formation Green Belt Lean Six Sigma Phase Innover / Implanter Atelier catapulte Septembre 2010.
© Promaintech Novaxa – Tous droits d’utilisation réservés Atelier Statapult Formation Green Belt Lean Six Sigma.
© Promaintech Novaxa – Tous droits d’utilisation réservés Atelier Statapult Formation Green Belt Lean Six Sigma.
© Fujitsu Canada Distributions de données discrètes et continues Formation Black Belt Lean Six Sigma.
© Promaintech Novaxa – Tous droits d’utilisation réservés Analyse de la variance (ANOVA) Introduction à la statistique industrielle.
© Promaintech Novaxa – Tous droits d’utilisation réservés D MAIC Analyse de capabilité Formation Black Belt Lean Six Sigma.
Tous droits réservés © Promaintech Novaxa Analyse des tailles de lots Formation Green Belt Lean Six Sigma.
© Promaintech Novaxa – Tous droits d’utilisation réservés Plans factoriels Introduction à la statistique industrielle.
Formation Black Belt Lean Six Sigma
Tous droits réservés © Promaintech Novaxa Clôture du projet Formation Green Belt Lean Six Sigma.
Formation Green Belt Lean Six Sigma Atelier Statapulte
Tous droits réservés © Promaintech Novaxa Équilibrer les tâches du processus Formation Green Belt Lean Six Sigma.
Formation Black Belt Lean Six Sigma
Formation Green Belt Lean Six Sigma Analyse des tailles de lots
Formation Green Belt Lean Six Sigma Documentation du projet
D MAIC © Promaintech Novaxa – Tous droits d’utilisation réservés Atelier.
© Promaintech Novaxa – Tous droits d’utilisation réservés Intervalles de confiance Introduction à la statistique industrielle.
© Promaintech Novaxa – Tous droits d’utilisation réservés Corrélation et régression linéaire Introduction à la statistique industrielle.
© Promaintech Novaxa – Tous droits d’utilisation réservés Tests d’hypothèses Introduction à la statistique industrielle.
Introduction aux statistiques Intervalles de confiance
Formation Green Belt Lean Six Sigma
© Promaintech Novaxa – Tous droits d’utilisation réservés D MAIC Représentations graphiques Formation Black Belt Lean Six Sigma.
Transcription de la présentation:

Formation Green Belt Lean Six Sigma Intervalles de confiance

Objectifs Comprendre la notion d’intervalle de confiance Sélectionner l’intervalle de confiance approprié Utiliser l’intervalle de confiance lors de la prise de décision Apprécier les limites des intervalles de confiance Comprendre l’utilité du Théorème Central Limite

Rappel Paramètres de la population Statistiques de l’échantillon Moyenne : m Écart-type : s Taille de la population : N Statistiques de l’échantillon Moyenne : x Taille de l’échantillon : n Des conclusions au sujet de la population sont établies à partir des échantillons Cependant, un niveau d’incertitude demeure

Population et échantillon La population représente la région complète d’intérêt L’échantillon est un sous-ensemble de la population Quelle est la relation entre la population et l’échantillon ? Population Échantillon Est-ce que cet échantillon est représentatif de la population ?

Concept de la variabilité de la moyenne Les statistiques des échantillons estiment les paramètres de la population : Erreur-type de la moyenne : n=5 n=3 n=1

Théorème Central Limite L’inférence statistique implique souvent comme hypothèse que les variables aléatoires correspondent à une distribution normale Cependant, il arrive que cette hypothèse ne tienne pas Heureusement, il existe un théorème d’une grande importance qui contourne en partie le problème de la non normalité des variables continues Ce théorème est le Théorème Central Limite

Théorème Central Limite (suite) Si x1, x2, …, xn sont des mesures indépendantes (i.e. un échantillon aléatoire de taille n) d'une population de moyenne μ et d'écart-type σ Alors la distribution de a pour moyenne et écart-type : De plus, lorsque n est suffisamment grand, la distribution de X-barre est approximativement normale Erreur-type de la moyenne

Théorème Central Limite (suite) Peu importe la distribution d’une population, si plusieurs échantillons de taille n de cette population sont tirés et qu’à chaque échantillon la valeur moyenne est considérée, alors la distribution de se rapprochera de la distribution normale à mesure que n augmentera Taille minimum requise pour chaque échantillon en fonction de la distribution des données individuelles Distribution symétrique et unimodale n ≥ 5 Règle pratique souvent utilisée en contrôle de la qualité Distribution symétrique mais sans mode dominant n ≥ 12 Par exemple, la distribution uniforme Distribution quelconque Dans certains cas, n ≥ 30 est suffisant Sinon, n ≥ 100

Intervalle de confiance (IC) Étant donné que… La moyenne et l’écart-type d’un échantillon sont des statistiques Qui estiment la moyenne (m) et l’écart-type (s) de la population Calculées seulement avec les données de l’échantillon Ces statistiques varient d’un échantillon à l’autre … L’intervalle de confiance permet de quantifier l’incertitude associée au calcul d’une statistique Habituellement, un intervalle de confiance à 95 % est calculé Signifie qu’il est probable à 95 % que l’intervalle de confiance contienne la vraie valeur du paramètre de la population

IC pour la moyenne () avec écart-type de la population () connu Exemple 1 Une compagnie aérienne a besoin d’estimer le nombre moyen de passagers sur un nouveau vol Par expérience, la compagnie sait que les données recueillies pendant le premier mois sont peu représentatives, mais qu'après un mois, le nombre de passagers se stabilise La moyenne du nombre de passagers est calculée pour les 20 premiers jours ouvrables à partir du deuxième mois d'existence de ce nouveau vol Si la moyenne de l'échantillon (x-barre) est 112 et que l'écart-type de la population (σ) est déjà connu à 25, calculez l'intervalle de confiance à 95% pour la vraie moyenne à long terme du nombre de passagers sur ce vol

IC pour la moyenne () avec écart-type de la population () connu (suite) Avec un échantillon aléatoire de taille n provenant d’une population distribuée selon la loi normale et avec un écart-type connu σ, il est possible de définir l’intervalle de confiance à 100(1-α)% d’inclure la moyenne de la population μ : Lorsque la distribution d’une population n’est pas normale tout en n’étant pas trop asymétrique, il suffit de prendre un échantillon d’au moins 30 observations pour calculer un intervalle de confiance représentatif de la moyenne de la population En s’appuyant sur le Théorème Central Limite

IC pour la moyenne () avec écart-type de la population () connu (suite) Solution de l’exemple 1 Nous émettons l'hypothèse que la distribution de la population des passagers par embarquement quotidien n'est pas trop asymétrique Par conséquent, la distribution de l'échantillon de x-barre est à peu près normale et les résultats des intervalles de confiance sont approximativement corrects, même pour une taille d'échantillon de seulement 20 jours ouvrables

IC pour la moyenne () avec écart-type de la population () connu (suite) Pour un intervalle de confiance à 95 %, z.025= 1.96 et : L’intervalle de confiance à 95 % du nombre moyen de passagers m au fil du temps est donc :

Considérations sur l’écart-type de la population () connu Il est rare de connaître la vraie valeur de l’écart-type de la population  Lorsque  est inconnu, il faut l’estimer à partir de l’écart-type (s) d’un échantillon provenant de cette population Si  est estimé par s, il faut plutôt utiliser la distribution de Student (t) pour calculer l’intervalle de confiance Toute chose étant égale par ailleurs, l’impact de ce changement est l’obtention d’un intervalle de confiance plus étendu Il en est ainsi pour tenir compte de l’incertitude additionnelle provenant de l’ignorance de 

Distribution de Student (t) Il s'agit plutôt d'une famille de distributions De par leur forme (cloche symétrique), elles sont similaires à la courbe normale, bien que plus larges et plus aplaties aux extrémités La taille d'échantillon détermine dans quelle mesure la distribution est plus large et plus aplatie Plus la taille d'échantillon est petite, plus la distribution est large et aplatie aux extrémités Plus la taille d'échantillon augmente, plus la distribution t se rapproche de la distribution normale (Z)

IC pour la moyenne () avec écart-type de la population () inconnu Avec un échantillon prélevé à partir d’une population distribuée selon la loi normale de moyenne μ inconnue et d’écart-type σ inconnu, il est possible de définir l’intervalle de confiance à 100(1-α)% d’inclure la moyenne de la population μ :

IC pour la moyenne () avec écart-type de la population () inconnu (suite) Exemple 2 Déterminer un IC à 95 % pour la moyenne μ, à partir des 10 observations suivantes récoltées dans le cadre d’un test de survie où Données de l’échantillon : 247.5, 250.8, 283.3, 276.9, 242.4, 271.5, 275.4, 247.5, 256.6, 249.7 Moyenne (X) = 260.16 Écart-type de l’échantillon (s) = 14.99 α = (1-0.95) = 0.05 = 5 % n = 10 tα/2; n-1 : valeur t de la table de Student où α / 2 (2,5 %) et avec n-1 (9) degrés de liberté

IC pour la moyenne () avec écart-type de la population () inconnu (suite) Exemple 3 Selon un contrat d’approvisionnement, les clients d'une raffinerie s'attendent à recevoir des barils qui contiennent 55 gallons d'huile Un échantillonnage aléatoire de 20 barils est sélectionné pour déterminer si le contrat est respecté La moyenne des 20 barils échantillonnés est égale à 54.860 gallons et l'écart-type (s) est égal à 1.008 gallon Les données au sujet des 20 barils sont les suivantes : 54.1, 53.3, 56.1, 55.7, 54.0, 54.1, 54.5, 57.1, 55.2, 53.8, 54.1, 54.1, 56.1, 55.0, 55.9, 56.0, 54.9, 54.3, 53.9, 55.0 Quel est l'intervalle de confiance à 95% de la quantité moyenne d'huile versée dans les barils qui devraient contenir 55 gallons ?

IC à 95% pour quantité moyenne d'huile x = 54.860 s = 1.008 n = 20 t.025,19 = 2.09 (si n = 20 barils) D’après l’échantillon de 20 barils, il y a 95 chances sur 100 que la quantité d'huile versée en moyenne dans un baril de 55 gallons soit entre 54.388 gallons et 55.332 gallons Heureusement, Minitab peut calculer les valeurs t de la distribution de Student

Intervalle de confiance avec Minitab Ouvrir le fichier OIL REFINERY.MTW

Intervalle de confiance avec Minitab (suite) Stat < Basic Statistics < Graphical Summary

Intervalle de confiance avec Minitab (suite) Il y a 95 chances sur 100 que cet intervalle contienne la moyenne de la quantité d’huile réellement versée dans un baril de 55 gallons

Intervalle de confiance pour l’écart-type σ Comme pour toute statistique, il est possible de calculer un intervalle de confiance à 100(1-α)% pour estimer l’écart-type σ d’une population distribuée selon la loi normale, de moyenne μ inconnue, et d’écart-type σ inconnu :

Intervalle de confiance pour l’écart-type σ (suite) Suite de l’exemple 3 n - 1 = 20 - 1 = 19 s = 1,008 α = 0,05 Ainsi, il y a 95 chances sur 100 que l’écart-type de la variation de la quantité d’huile versée dans un baril de 55 gallons soit comprise dans l’intervalle suivant : [0,767 ; 1,472] Ces valeurs proviennent de la distribution du Chi-deux et sont disponibles dans une table ou par l’entremise de Minitab

Intervalle de confiance avec Minitab (suite) Il y a 95 chances sur 100 que cet intervalle contienne l’écart-type de la quantité d’huile réellement versée dans un baril de 55 gallons

Intervalle de confiance pour une proportion L’intervalle de confiance à 100(1-α)% pour estimer la proportion p d’éléments (ou d’individus) qui possèdent un certain caractère qualitatif dans la population est : en autant que où n = taille de l’échantillon x = quantité de succès ou de défauts p = proportion réelle de succès ou de défauts dans la population Z = valeur provenant de la distribution normale, disponible dans une table Z ou par l’entremise de Minitab, en fonction du niveau de confiance désiré (= 1.96 lorsque le niveau de confiance est 95%)

Précision de l’intervalle de confiance Plus l’intervalle de confiance est étroit, plus l’information s’avère précise La largeur de l’intervalle est influencée par trois facteurs : Taille d’échantillon : n Niveau de confiance : (1 - α)% Détermine en partie la valeur de la constante Z ou t Écart-type σ de la variation présente dans la population Estimée très souvent par l’écart-type s de la variation présente dans l’échantillon

Précision de l’intervalle de confiance (suite) Plus la taille d’échantillon est grande, plus l’intervalle de confiance est étroit (précis) Plus l’écart-type de la variation est petit, plus l’intervalle de confiance est étroit (précis) Plus le niveau de confiance souhaité est grand, plus l’intervalle de confiance est grand (imprécis)

Intervalles de confiance : Résumé des formules Moyenne : Écart-type : Proportion :

Points à retenir Utiliser les intervalles de confiance permet d’identifier et de minimiser les risques dans la prise de décision La taille d’échantillon, l’écart-type estimé de la population et le niveau de confiance souhaité influence tous la largeur de l’intervalle de confiance et par le fait même sa précision

Politique de propriété intellectuelle Le présent document est la propriété unique et exclusive de Promaintech Novaxa. L’utilisation non autorisée, la divulgation ou la reproduction, sous quelque forme que ce soit, du matériel contenu dans ce document est expressément interdite. Toute utilisation non autorisée ou illégale par l’usager le rendra susceptible de faire l’objet de toute procédure légale et appropriée, à la disposition de Promaintech Novaxa. © Promaintech Novaxa 1996-2009 - Tous droits réservés