Formation Green Belt Lean Six Sigma Tests d’hypothèses

Slides:



Advertisements
Présentations similaires
Statistique II Chapitre 3: Tests d’hypothèses
Advertisements

D.Gile statscrit1 LUTILISATION DES STATISTIQUES INFERENTIELLES DANS LA RECHERCHE : REFLEXIONS CRITIQUES
STATISTIQUE INFERENTIELLE L ’ESTIMATION
But de la lecture critique
Les tests d’hypothèses (II)
Les tests d’hypothèses (I)
Collecte de données F. Kohler.
Inférence statistique
Comparaison de deux moyennes observées
Inférence statistique
Les TESTS STATISTIQUES
Tests de comparaison de pourcentages
Les TESTS STATISTIQUES
Les tests d’hypothèses
Statistiques et Probabilités au lycée
Tests de comparaison de moyennes
Méthodes de Biostatistique
Régression linéaire simple
Modeles Lineaires.
La corrélation et la régression
Le test t.
La corrélation et la régression
Université dOttawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :47 1 Concepts fondamentaux: statistiques et distributions.
Corrélation Principe fondamental d’une analyse de corrélation
ORGANIGRAMME-MÉTHODES STATISTIQUES-COMPARAISONS DE MOYENNES
ANALYSE DE DONNEES TESTS D’ASSOCIATION
Test d'hypothèse pour des proportions:
Intervalles de confiance pour des proportions L’inférence statistique
Concepts fondamentaux: statistiques et distributions
Probabilités et statistique Test d’hypothèse de deux moyennes
STATISTIQUE INFERENTIELLE LES TESTS STATISTIQUES
L’erreur standard et les principes fondamentaux du test de t
1.  On souhaite comparer deux traitements dans le cadre d’un essai randomisé sur les lombosciatiques :  corticoïdes par infiltrations  placebo  Critère.
Quelques commentaires sur les tests statistiques
Probabilités et statistique MQT-1102
Chapitre 4 Concepts fondamentaux Les composantes d’un test statistique Les hypothèses nulles en statistiques Le sens de p Inférence: comment traduire p.
1_Introduction Toute mesure est entachée d’erreur. Il est impossible d’effectuer des mesures rigoureusement exactes. Pour rendre compte du degré d’approximation.
Lectures Volume du cours: Sections 12.1 à 12.6 inclusivement.
ECHANTILLONAGE ET ESTIMATION
Tous droits réservés © Promaintech Novaxa Introduction à la phase Contrôler Formation Green Belt Lean Six Sigma.
© Promaintech Novaxa – Tous droits d’utilisation réservés D MAIC Cartes de contrôle pour petites séries Introduction à la statistique industrielle.
Tous droits réservés © Promaintech Novaxa Documentation du projet Formation Green Belt Lean Six Sigma.
Formation Black Belt Lean Six Sigma
Solutions Lean © Fujitsu Canada Formation Green Belt Lean Six Sigma Clôture du projet Septembre 2010.
Formation Green Belt Lean Six Sigma
© Fujitsu Canada Introduction à Minitab Version 14 - Anglais Formation Black Belt Lean Six Sigma.
Académie européenne des patients sur l'innovation thérapeutique Rôle et notions élémentaires des statistiques dans les essais cliniques.
Formation Green Belt Lean Six Sigma Atelier Statapulte
Formation Green Belt Lean Six Sigma Phase Innover / Implanter Atelier catapulte Septembre 2010.
© Promaintech Novaxa – Tous droits d’utilisation réservés Atelier Statapult Formation Green Belt Lean Six Sigma.
© Promaintech Novaxa – Tous droits d’utilisation réservés Atelier Statapult Formation Green Belt Lean Six Sigma.
© Fujitsu Canada Distributions de données discrètes et continues Formation Black Belt Lean Six Sigma.
© Promaintech Novaxa – Tous droits d’utilisation réservés D MAIC Analyse de capabilité Formation Black Belt Lean Six Sigma.
Formation Green Belt Lean Six Sigma
Tous droits réservés © Promaintech Novaxa Analyse des tailles de lots Formation Green Belt Lean Six Sigma.
© Promaintech Novaxa – Tous droits d’utilisation réservés Plans factoriels Introduction à la statistique industrielle.
© Fujitsu Canada D MAIC Analyse du rendement qualité Formation Black Belt Lean Six Sigma.
Formation Black Belt Lean Six Sigma
Formation Green Belt Lean Six Sigma Atelier Statapulte
Formation Black Belt Lean Six Sigma
Formation Green Belt Lean Six Sigma Analyse des tailles de lots
Formation Green Belt Lean Six Sigma Documentation du projet
© Promaintech Novaxa – Tous droits d’utilisation réservés Intervalles de confiance Introduction à la statistique industrielle.
© Promaintech Novaxa – Tous droits d’utilisation réservés Tests d’hypothèses Introduction à la statistique industrielle.
Introduction aux statistiques Intervalles de confiance
Formation Green Belt Lean Six Sigma
© Promaintech Novaxa – Tous droits d’utilisation réservés D MAIC Représentations graphiques Formation Black Belt Lean Six Sigma.
Chapitre 6 Les tests d ’ hypoth è se 1 – Comparer des moyennes ou des proportions.
23/05/2016 Déterminer la taille des échantillons notion sous-jacente : puissance d'un test Claire Chabanet fonction F4, étendre l'écran configurer le diaporama,
Transcription de la présentation:

Formation Green Belt Lean Six Sigma Tests d’hypothèses Septembre 2010

Objectifs Effectuer un test d’hypothèses sur une moyenne Effectuer un test d’hypothèses sur la comparaison de deux moyennes Effectuer un test d’hypothèses sur la comparaison de deux proportions Appliquer les différents tests d’hypothèses à la prise de décision Comprendre la relation entre un test d’hypothèses et l’intervalle de confiance Apprécier les limites des tests d’hypothèses Déterminer la taille d’échantillon nécessaire

Rappel Paramètres de la population Statistiques de l’échantillon Moyenne : m Écart-type : s Taille de la population : N Statistiques de l’échantillon Moyenne : x Taille de l’échantillon : n Des conclusions au sujet de la population sont établies à partir des échantillons Cependant, un niveau d’incertitude demeure

Population et échantillon (rappel) La population représente la région complète d’intérêt L’échantillon est un sous-ensemble de la population Quelle est la relation entre la population et l’échantillon? Population Échantillon Est-ce que cet échantillon est représentatif de la population?

Tests d’hypothèses Rôles Distinguer des différences significatives entre Différentes moyennes Différentes variances Différentes proportions Être un outil de décision impartiale Valider l’effet significatif des améliorations apportées à un processus Considérer l'incertitude de façon appropriée Être plus objectif Confirmer des suppositions au sujet d’une ou de deux populations

Considérations pratiques Trois facteurs influencent les conclusions tirées à partir d'un échantillon dans le contexte d’un test d’hypothèses: Taille d’échantillon (n) Variation de la population Niveau de confiance

Influence de la taille d'échantillon Si l’échantillon comporte une seule unité mesurée, la moyenne de la population sera-t-elle bien représentée par cet échantillon? Si l’échantillon comporte 900 unités mesurées, est-il plausible de croire que la moyenne de la population se rapproche davantage de la moyenne de cet échantillon sans risque de se tromper?

Influence de la taille d'échantillon (suite) Plus la taille d'échantillon est grande, plus x-barre a des chances d'être près de la vraie moyenne de la population Population Valeurs probables de x-barre avec un échantillon de plus petite taille Intervalles de confiance Valeurs probables de x-barre avec un échantillon de plus grande taille

Influence de la variation (écart-type) S’il y a beaucoup de variation dans les données, est-il plus difficile de tirer rapidement des conclusions au sujet de la moyenne de la population? Pourquoi ?

Influence de la variation (écart-type) (suite) Population avec beaucoup de variation Valeurs probables de x-barre avec un échantillon de taille = n Population avec peu de variation Intervalles de confiance Valeurs probables de x-barre avec un échantillon de taille = n

Influence du niveau de confiance Pour avoir davantage confiance ou augmenter la probabilité que la vraie moyenne se trouve dans cet intervalle, il faut élargir l'étendue de l’intervalle (un plus haut niveau de confiance = intervalle de confiance plus large) Population En resserrant l’estimation de la moyenne, les chances de se tromper augmente et la confiance diminue (un plus faible niveau de confiance = intervalle de confiance plus petit)

Mise en contexte Les histogrammes ci-dessous montrent la taille des individus de deux pays A et B L’unité de mesure est le pouce Les deux échantillons contiennent les tailles de 100 individus provenant des deux populations, A et B Est-ce que la taille moyenne de la population du pays A est égale à celle du pays B?

Choix des hypothèses L’hypothèse nulle: H0 L’hypothèse alternative: H1 Affirmation concernant un aspect de la population Toujours sous la forme d’une égalité Généralement facile à déterminer L’hypothèse alternative: H1 Toute hypothèse qui diffère de l’hypothèse nulle Oriente la prise de décision Détermine les zones de rejets et le type de test d’hypothèses à réaliser (bilatéral ou unilatéral) H0 = H1 < H1 > H1 

Erreurs alpha et bêta L’erreur alpha (α) est le risque de conclure à une différence alors qu’il n’y en a pas L’erreur bêta (β) est le risque de ne pas conclure à une différence alors qu’il en existe une b a H 1

Types d’erreurs I et II : Risques associés L’erreur de type I représente le rejet de l’hypothèse nulle lorsque celle-ci est vraie L’erreur de type II représente le rejet de l’hypothèse alternative lorsque celle-ci est vraie Le risque  est la probabilité de faire une erreur de type I Le risque  est la probabilité de faire une erreur de type II Généralement ce risque est de 5 % Généralement ce risque est de 10 % Il faut définir les niveaux de risque tolérés avant de procéder à des tests ou à des expériences

Exemple : Système judiciaire Une personne est innocente jusqu’à ce qu’elle soit reconnue coupable Il faut des preuves irréfutables pour reconnaître l’accusé coupable Cela correspond à l’acceptation de l’hypothèse alternative

Exemple : Système judiciaire (suite) H0 : L’individu est innocent H1 : L’individu est coupable Vérité Innocent (H0 vraie) Coupable (H0 faux) Rejet de H0 (Emprisonné) Jugement Non rejet de H0 (Libéré)

Six tests d’hypothèses classiques Hypothèses nulles: Tests sur la moyenne ou la variance d’une ou deux populations: valides si les données correspondent à une distribution normale Tests sur la proportion d’une ou deux populations: valides si les données correspondent à une distribution binomiale

Exemple : Test d’hypothèses sur 2 moyennes Objectif : comparer les moyennes de deux groupes (deux populations) Hypothèse nulle: les moyennes des deux groupes sont identiques H0 : moyenneA = moyenneB Hypothèse alternative: les moyennes des deux groupes sont différentes H1 : moyenneA  moyenneB

Critère de rejet de l’hypothèse nulle Les logiciels d’analyses statistiques calculent une valeur de référence appelée «valeur-p» (p-value) La valeur-p est utilisée au cours des tests d’hypothèses afin de déterminer si l’hypothèse nulle mérite d’être rejetée ou non La valeur-p constitue la probabilité de rejeter l’hypothèse nulle lorsqu’elle est vraie Une valeur alpha de 5% est souvent utilisée comme critère de rejet de l’hypothèse nulle lorsque comparée à la valeur-p du test : p   : Rejet de H0 p   : Non rejet de H0

Exemple Minitab : Comparer deux fournisseurs Un fabriquant de moteurs de voitures reçoit des arbres à cames de deux fournisseurs différents La longueur des arbres à cames est une caractéristique critique et il est essentiel que les arbres à cames des deux fournisseurs soient de la même longueur De plus, chaque fournisseur doit fournir des arbres à cames d’une longueur moyenne de 598.75 mm Le fabriquant de moteurs veut s’assurer que sa spécification sur la longueur moyenne des arbres à cames est respectée par les deux fournisseurs, à l'aide d'un échantillon de 100 pièces par fournisseur

Exemple Minitab (suite) File < Open Worksheet < CAMSHATF2.MTW

Données du Fournisseur 1 598.0 598.8 600.2 599.4 599.6 599.8 598.8 599.6 599.0 601.2 600.0 599.8 599.6 598.4 599.6 599.8 599.2 599.6 599.0 600.2 600.0 599.4 600.2 599.6 600.0 600.0 600.0 599.2 598.8 600.0 598.8 600.2 599.0 599.2 599.4 598.2 600.2 599.6 599.6 599.8 599.4 599.6 600.4 598.6 599.2 599.6 599.0 600.0 599.8 599.6 599.4 599.0 599.0 599.6 599.4 599.4 599.8 599.6 599.2 600.0 600.0 600.8 599.4 599.6 600.0 598.8 598.8 599.2 600.2 599.2 599.2 598.2 597.8 599.8 599.4 599.4 600.0 600.4 599.6 599.6 599.6 599.2 599.6 600.0 599.8 599.0 599.8 600.0 599.6 599.0 599.2 601.2 600.8 599.2 599.6 600.6 600.4 600.4 598.6 599.4

Données du Fournisseur 2 601.6 600.8 599.4 599.8 601.6 600.4 598.6 598.0 602.8 603.4 598.4 600.0 597.6 600.0 597.0 600.0 600.4 598.0 599.6 599.8 596.8 600.8 597.6 602.2 597.8 602.8 600.8 601.2 603.8 602.4 600.8 597.2 599.0 603.6 602.2 603.6 600.4 600.4 601.8 600.6 604.2 599.8 600.6 602.0 596.2 602.4 596.4 599.0 603.6 602.4 598.4 600.4 602.2 600.8 601.4 599.6 598.2 599.8 600.2 599.2 603.4 598.6 599.8 600.4 601.6 600.6 599.6 601.0 600.2 600.4 598.4 599.0 601.6 602.2 598.0 598.2 598.2 601.6 598.0 601.2 602.0 599.4 600.2 598.4 604.2 599.4 599.4 601.8 600.8 600.2 599.4 600.2 601.2 602.8 600.0 600.8 599.0 597.6 597.6 596.8

Statistiques descriptives – Fournisseur 1

Statistiques descriptives – Fournisseur 2

Exemple Minitab (suite) Longueurs moyennes Fournisseur 1 : 599.55 mm Fournisseur 2 : 600.23 mm Longueur cible : 598.75 mm De plus, chaque arbre à cames doit se retrouver à moins de 2 mm de cette cible

Exemple Minitab (suite) Le fabriquant aimerait valider Si le Fournisseur 2 a une moyenne différente de la valeur cible La moyenne de son échantillon, 600.23, semble trop élevée Si les arbres à cames reçus par les deux fournisseurs sont en moyenne de longueurs différentes Comment répondre à ces interrogations? Réaliser un test d’hypothèses sur une moyenne avec les échantillons du Fournisseur 2 Réaliser un test d’hypothèses sur l’égalité des moyennes des deux fournisseurs

Test sur une moyenne

Exemple Minitab – Test t-1 échantillon Hypothèses à vérifier H0 : la « vraie » moyenne du Fournisseur 2 = 598.75 H1 : la « vraie » moyenne du Fournisseur 2 ≠ 598.75 Puisque les données du Fournisseur 2 correspondent à une distribution normale et que l’écart-type de la population sous- jacente est inconnu, il faut utiliser le test-t de Student pour un échantillon Stat < Basic Statistics < 1-Sample t… Lorsque l’écart-type de la population sous-jacente est connu (rare), il faut utiliser le test-Z pour un échantillon Stat < Basic Statistics < 1-Sample Z…

Exemple Minitab – Test t-1 échantillon (suite) Choix de trois graphiques possibles Fournisseur 2 H0 : Moyenne du Fournisseur 2 = 598.75 H1 : Moyenne du Fournisseur 2 ≠ 598.75

Exemple Minitab – Test t-1 échantillon (suite) Résultats Minitab : n = 100 observations du Fournisseur 2 (Supp2) Moyenne = 600.23 Écart-type = 1.874 Il y a 95 chances sur 100 que la vraie moyenne soit comprise dans l’intervalle [599.858; 600.602] La valeur t de Student est de 7.90 à laquelle correspond une valeur-p de 0.000, ce qui signifie qu’il n’y a pratiquement aucun risque d’erreur à rejeter l’hypothèse nulle (moyenne = 598,75) Le fournisseur 2 ne produit pas d’arbres à cames dont la longueur moyenne est de 598.75

Test sur une moyenne et intervalle de confiance Il est possible d’utiliser l’intervalle de confiance pour comparer ou tester une moyenne à une valeur cible Similaire au test d’hypothèses lorsque la valeur alpha est utilisée comme critère de rejet Par contre, sans test d’hypothèses, l’information sur le risque réel de faire une erreur de type 1 (valeur-p) est perdue Si l’intervalle de confiance de la moyenne calculée à partir de l’échantillon n’inclut pas la valeur cible, alors la vraie moyenne diffère significativement de la valeur cible Cible Cible IC IC Moyenne Moyenne significativement différente de la cible Moyenne non significativement différente de la cible

Exemple Minitab (suite) Puisque la valeur cible de 598.75 n’est pas incluse dans l’intervalle de confiance à 95% de la moyenne réelle du Fournisseur 2 [599.858; 600.602], il est possible de conclure que : La moyenne réelle de la longueur des arbres à cames du Fournisseur 2 est significativement différente de 598.75 Il y a 95 chances sur 100 que la moyenne réelle de la longueur des arbres à cames du Fournisseur 2 se situe entre 599.858 et 600.602 mm

Exemple Minitab – Test t-1 échantillon (suite) Valeur cible de 598.75 Moyenne observée dans l’échantillon Intervalle de confiance à 95% Montre l’étalement des données

Exemple Minitab – Test t-1 échantillon (suite) Permet de valider visuellement si les données correspondent à une distribution normale

Exercice File < Open Worksheet < CAMSHATF2.MTW Vérifiez s’il y a évidence ou non que la moyenne réelle de la longueur des arbres à cames du Fournisseur 1 (Supp1) ne respecte pas la valeur cible de 598.75 mm Tirez les conclusions à partir de la valeur-p Tirez les conclusions à partir de l’intervalle de confiance

Test sur deux moyennes

Exemple Minitab – Test t-2 échantillons Hypothèses à vérifier H0 : moyenne du Fournisseur 1 = moyenne du Fournisseur 2 H1 : moyenne du Fournisseur 1 ≠ moyenne du Fournisseur 2 Grâce au test d’hypothèses, une valeur-p sera obtenue Si valeur-p ≤  (0,05 par défaut) : Rejet de H0 Si valeur-p >  (0,05 par défaut) : Non rejet de H0 Test avec Minitab Stat < Basic Statistics < 2-Sample t …

Comparaison de deux moyennes En général, le test d'hypothèses sur l’égalité des moyennes de deux populations peut être exprimé sous deux formes : Mathématiquement, afin de pouvoir calculer une valeur-p, c’est la seconde formulation qui est utilisée par Minitab ou

Comparaison de deux moyennes (suite) Pour vérifier si la vraie moyenne du groupe 1 est inférieure à la vraie moyenne du groupe 2: Pour vérifier si la vraie moyenne du groupe 1 est supérieure à la vraie moyenne du groupe 2: ou ou

Comparaison de deux moyennes (suite) Le test d'hypothèses sur la comparaison de deux moyennes est basé sur les conditions suivantes : Indépendance des deux échantillons Échantillons aléatoires distribués selon la loi normale Populations aux variances inconnues Selon que les variances des deux populations soient considérées égales ou non, la mathématique du test changera quelque peu

Exemple Minitab – Indépendance entre les échantillons Façon simple et rapide de vérifier l’indépendance des deux échantillons Visualiser le graphique de points entre le Fournisseur 1 (Supp1) et le Fournisseur 2 (Supp2) Tester l’hypothèse que le coefficient de corrélation entre les deux variables (Supp1 et Supp2) = 0 Y-a-t-il corrélation (dépendance) entre Supp1 et Supp2?

Exemple Minitab – Échantillons aléatoires et distribués selon la loi normale? Étant donné… Que les deux fournisseurs ont une grande taille d’échantillons N = 100 ( n > 30) Que leurs données individuelles respectives placées en histogrammes montrent des distributions plutôt symétriques … Il est possible de s’appuyer sur le Théorème Central Limite pour présumer que les distributions des moyennes en présence correspondent à une loi normale Il est alors pertinent d’utiliser le test t-2 échantillons

Valider si les variances inconnues des deux populations sont égales ou non Lorsque les variances sont inconnues (c’est fréquent), elles peuvent être supposées égales ou non Selon le cas, la mathématique du test d’hypothèses sur deux moyennes est quelque peu différente Dans le doute, le choix sécuritaire est de les considérer inégales L’option est disponible dans Minitab Minitab offre également un test d’hypothèses sur l’égalité des variances des deux populations

Test sur 2 moyennes si variances égales et Minitab utilise l’expression “Pooled variances”

Test sur 2 moyennes si variances inégales et sont respectivement la moyenne des échantillons 1 et 2 n1 et n2 représentent la taille des échantillons 1 et 2 s1 et s2 sont respectivement les écarts-type des échantillons 1 et 2 où

Exemple Minitab – Test t-2 échantillons (suite) Puisque les hypothèses de départ ont été vérifiées, il est possible d’effectuer le test t de Student pour deux échantillons Les deux échantillons sont considérés indépendants et aléatoires Les distributions des moyennes sont considérées correspondre à une loi normale Même si l’hypothèse d’égalité des variances n’est pas vérifiée, il est possible de réaliser le test t en supposant les variances inégales

Exemple Minitab – Test t-2 échantillons (suite) Stat < Basic Statistics < 2-Sample t …

Exemple Minitab – Test t-2 échantillons (suite) En moyenne, l’échantillon du Fournisseur 1 semble inférieur à celui du Fournisseur 2 Cependant, peut-on conclure la même chose au sujet de la production individuelle de chaque fournisseur ?

Exemple Minitab – Test t-2 échantillons (suite) Lequel des deux fournisseurs présente la plus faible variation dans sa production?

Exemple Minitab – Test t-2 échantillons (suite) Hypothèse nulle spécifiée au sujet des deux moyennes

Exemple Minitab – Test t-2 échantillons (suite) Intervalle de confiance à 95% pour la différence (notez que zéro n'y est pas inclus)

Exemple Minitab – Test t-2 échantillons (suite) Statistique calculée du test t

Exemple Minitab – Test t-2 échantillons (suite) Puisque la valeur-p < 0,05, il est pertinent de rejeter H0 (l’égalité des moyennes)

Test sur deux moyennes et intervalle de confiance Encore une fois, il est possible d’utiliser l’intervalle de confiance pour comparer l’égalité des deux moyennes Si l’intervalle de confiance sur la différence de deux moyennes ne contient pas la valeur 0, alors les deux moyennes sont significativement différentes (à un niveau de confiance de 95%) Si la valeur 0 est incluse dans l’intervalle de confiance sur la différence, alors les deux moyennes sont supposées égales par manque d’évidence du contraire Le tout est similaire au test d’hypothèses lorsque la valeur alpha est utilisée comme critère de rejet Par contre, sans test d’hypothèses, l’information sur le risque réel de faire une erreur de type 1 (valeur-p) est perdue

Intervalle de confiance sur la différence entre deux moyennes (1 et 2 inconnues) et sont respectivement la moyenne des échantillons 1 et 2 n1 et n2 représentent la taille des échantillons 1 et 2 s1 et s2 sont respectivement les écarts-type des échantillons 1 et 2 Note : Les formules de l’écart-type lorsque les variances sont considérées égales ou non ont déjà été présentées

Exemple Minitab – Conclusion Puisque la valeur 0 ne fait pas partie de l’intervalle de confiance, les moyennes des deux fournisseurs sont significativement différentes Questions À la vue de tous ces résultats, lequel des deux fournisseurs choisiriez- vous? Pourquoi? Quels sont les actions correctives que doivent viser chaque fournisseur pour mieux répondre aux exigences de leur client?

Test sur deux proportions

Comparaison de deux proportions Ce test d'hypothèses sur l’égalité des proportions de deux populations binomiales requiert des tailles d’échantillon respectives suffisamment élevées de sorte que : Peut être exprimé sous deux formes : ou

Comparaison de deux proportions (suite) Sous l’hypothèse H0 et en respectant les tailles d’échantillon suffisamment élevées, la différence standardisée suit une loi Normale de moyenne zéro et d’écart-type un Le test de comparaison de deux proportions se fait ensuite exactement comme un test de deux moyennes

Exemple Minitab Vous devez autoriser l’achat de 20 photocopieuses. Après avoir comparé différentes photocopieuses en terme de prix, qualité d’une photocopie et garantie, votre choix s’est arrêté sur deux marques : Choix X et Choix Y. Vous décidez que le facteur déterminant sera la fiabilité des marques qui est comptabilisée comme étant la proportion de services requis la première année d’utilisation Puisque la compagnie où vous travaillez utilise déjà ces deux marques, vous pouvez obtenir de l’information sur 50 photocopieuses choisies de façon aléatoire de chaque marque. Les données indiquent que six photocopieuses du Choix X et huit du Choix Y ont eu besoin de service Stat < Basic Statistics < 2 Proportions

Exemple Minitab (suite)

Exemple Minitab (suite) Que concluez-vous?

Exemple Minitab (suite) Puisque p-value = 0.564 > 0.05, l’hypothèse H0 ne peut être rejetée et donc les deux marques ne présentent pas de différence en terme de fiabilité Cependant, en regardant l’intervalle de confiance, vous trouvez que ce dernier ne vous donne pas une information très précise sur la différence entre les deux proportions et aimeriez obtenir un intervalle plus précis Que pouvez-vous faire pour obtenir une information plus précise ?

Taille d’échantillon

Facteurs qui influencent la taille d’échantillon La taille d’échantillon nécessaire est fonction de: Erreur de type I (α) : en général 5% ou 10% Puissance du test (1-) : en général 80% ou 90% Différence minimale à pouvoir détecter par le test Variation naturelle à l’intérieur des échantillons

Considérations pratiques La différence minimale à pouvoir détecter est une valeur habituellement propre à chaque processus et déjà connue L’écart-type du procédé n’est pas toujours connu et doit parfois être estimé par des données historiques qui démontrent idéalement un état de contrôle statistique Lorsqu’aucune donnée historique n’est disponible, il est alors parfois nécessaire de faire un essai pilote pour aller chercher cette information

Exemple Minitab : Calcul de la taille d’échantillon Stat < Power and Sample Size… Click to add comments. … Choisir en fonction du test à réaliser

Exemple Minitab : Calcul de la taille d’échantillon (suite) Les informations suivantes doivent être entrées afin que Minitab puisse calculer la taille d’échantillon correspondante Différence minimale à pouvoir détecter en pratique Écart-type connu du processus Puissance du test à détecter cette différence s’il y en a vraiment une (exemple : 90%)

Exemple Minitab : Calcul de la taille d’échantillon (suite) Minitab donne la taille d’échantillon requise pour chaque groupe testé afin de répondre aux exigences de puissance et de différence minimum à détecter, en considérant la variation naturelle du processus:

Influences de la taille d’échantillon sur le test Si la taille d’échantillon est trop petite, de fausses conclusions peuvent être tirées des tests d’hypothèses Si la taille d’échantillon est trop grande, toute différence aussi petite soit-elle sera détectée significativement par le test même si en pratique elle n’est peut-être pas importante Plus la taille d’échantillon est grande et plus les informations qu’on en retire sont précises En supposant que le système de mesure est adéquat !

Points à retenir Il est possible d’identifier et de minimiser les risques dans la prise de décision à l’aide des tests d’hypothèses La valeur-p permet de quantifier l’incertitude au sujet des conclusions émises lors d’un test d’hypothèses Plusieurs tests statistiques reposent sur la distribution normale Calculer la taille d’échantillon requise pour s’assurer de la puissance nécessaire à détecter une différence donnée ne devrait jamais être négligé

Politique de propriété intellectuelle Le présent document est la propriété unique et exclusive de Fujitsu Solutions Lean. L’utilisation non autorisée, la divulgation ou la reproduction, sous quelque forme que ce soit, du matériel contenu dans ce document est expressément interdite. Toute utilisation non autorisée ou illégale par l’usager le rendra susceptible de faire l’objet de toute procédure légale et appropriée, à la disposition de © Fujitsu Conseil (Canada) inc. 2009 - Tous droits réservés