La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Formation Green Belt Lean Six Sigma Tests d’hypothèses

Présentations similaires


Présentation au sujet: "Formation Green Belt Lean Six Sigma Tests d’hypothèses"— Transcription de la présentation:

1 Formation Green Belt Lean Six Sigma Tests d’hypothèses
Septembre 2010

2 Objectifs Effectuer un test d’hypothèses sur une moyenne
Effectuer un test d’hypothèses sur la comparaison de deux moyennes Effectuer un test d’hypothèses sur la comparaison de deux proportions Appliquer les différents tests d’hypothèses à la prise de décision Comprendre la relation entre un test d’hypothèses et l’intervalle de confiance Apprécier les limites des tests d’hypothèses Déterminer la taille d’échantillon nécessaire

3 Rappel Paramètres de la population Statistiques de l’échantillon
Moyenne : m Écart-type : s Taille de la population : N Statistiques de l’échantillon Moyenne : x Taille de l’échantillon : n Des conclusions au sujet de la population sont établies à partir des échantillons Cependant, un niveau d’incertitude demeure

4 Population et échantillon (rappel)
La population représente la région complète d’intérêt L’échantillon est un sous-ensemble de la population Quelle est la relation entre la population et l’échantillon? Population Échantillon Est-ce que cet échantillon est représentatif de la population?

5 Tests d’hypothèses Rôles
Distinguer des différences significatives entre Différentes moyennes Différentes variances Différentes proportions Être un outil de décision impartiale Valider l’effet significatif des améliorations apportées à un processus Considérer l'incertitude de façon appropriée Être plus objectif Confirmer des suppositions au sujet d’une ou de deux populations

6 Considérations pratiques
Trois facteurs influencent les conclusions tirées à partir d'un échantillon dans le contexte d’un test d’hypothèses: Taille d’échantillon (n) Variation de la population Niveau de confiance

7 Influence de la taille d'échantillon
Si l’échantillon comporte une seule unité mesurée, la moyenne de la population sera-t-elle bien représentée par cet échantillon? Si l’échantillon comporte 900 unités mesurées, est-il plausible de croire que la moyenne de la population se rapproche davantage de la moyenne de cet échantillon sans risque de se tromper?

8 Influence de la taille d'échantillon (suite)
Plus la taille d'échantillon est grande, plus x-barre a des chances d'être près de la vraie moyenne de la population Population Valeurs probables de x-barre avec un échantillon de plus petite taille Intervalles de confiance Valeurs probables de x-barre avec un échantillon de plus grande taille

9 Influence de la variation (écart-type)
S’il y a beaucoup de variation dans les données, est-il plus difficile de tirer rapidement des conclusions au sujet de la moyenne de la population? Pourquoi ?

10 Influence de la variation (écart-type) (suite)
Population avec beaucoup de variation Valeurs probables de x-barre avec un échantillon de taille = n Population avec peu de variation Intervalles de confiance Valeurs probables de x-barre avec un échantillon de taille = n

11 Influence du niveau de confiance
Pour avoir davantage confiance ou augmenter la probabilité que la vraie moyenne se trouve dans cet intervalle, il faut élargir l'étendue de l’intervalle (un plus haut niveau de confiance = intervalle de confiance plus large) Population En resserrant l’estimation de la moyenne, les chances de se tromper augmente et la confiance diminue (un plus faible niveau de confiance = intervalle de confiance plus petit)

12 Mise en contexte Les histogrammes ci-dessous montrent la taille des individus de deux pays A et B L’unité de mesure est le pouce Les deux échantillons contiennent les tailles de 100 individus provenant des deux populations, A et B Est-ce que la taille moyenne de la population du pays A est égale à celle du pays B?

13 Choix des hypothèses L’hypothèse nulle: H0 L’hypothèse alternative: H1
Affirmation concernant un aspect de la population Toujours sous la forme d’une égalité Généralement facile à déterminer L’hypothèse alternative: H1 Toute hypothèse qui diffère de l’hypothèse nulle Oriente la prise de décision Détermine les zones de rejets et le type de test d’hypothèses à réaliser (bilatéral ou unilatéral) H0 = H1 < H1 > H1 

14 Erreurs alpha et bêta L’erreur alpha (α) est le risque de conclure à une différence alors qu’il n’y en a pas L’erreur bêta (β) est le risque de ne pas conclure à une différence alors qu’il en existe une b a H 1

15 Types d’erreurs I et II : Risques associés
L’erreur de type I représente le rejet de l’hypothèse nulle lorsque celle-ci est vraie L’erreur de type II représente le rejet de l’hypothèse alternative lorsque celle-ci est vraie Le risque  est la probabilité de faire une erreur de type I Le risque  est la probabilité de faire une erreur de type II Généralement ce risque est de 5 % Généralement ce risque est de 10 % Il faut définir les niveaux de risque tolérés avant de procéder à des tests ou à des expériences

16 Exemple : Système judiciaire
Une personne est innocente jusqu’à ce qu’elle soit reconnue coupable Il faut des preuves irréfutables pour reconnaître l’accusé coupable Cela correspond à l’acceptation de l’hypothèse alternative

17 Exemple : Système judiciaire (suite)
H0 : L’individu est innocent H1 : L’individu est coupable Vérité Innocent (H0 vraie) Coupable (H0 faux) Rejet de H0 (Emprisonné) Jugement Non rejet de H0 (Libéré)

18 Six tests d’hypothèses classiques
Hypothèses nulles: Tests sur la moyenne ou la variance d’une ou deux populations: valides si les données correspondent à une distribution normale Tests sur la proportion d’une ou deux populations: valides si les données correspondent à une distribution binomiale

19 Exemple : Test d’hypothèses sur 2 moyennes
Objectif : comparer les moyennes de deux groupes (deux populations) Hypothèse nulle: les moyennes des deux groupes sont identiques H0 : moyenneA = moyenneB Hypothèse alternative: les moyennes des deux groupes sont différentes H1 : moyenneA  moyenneB

20 Critère de rejet de l’hypothèse nulle
Les logiciels d’analyses statistiques calculent une valeur de référence appelée «valeur-p» (p-value) La valeur-p est utilisée au cours des tests d’hypothèses afin de déterminer si l’hypothèse nulle mérite d’être rejetée ou non La valeur-p constitue la probabilité de rejeter l’hypothèse nulle lorsqu’elle est vraie Une valeur alpha de 5% est souvent utilisée comme critère de rejet de l’hypothèse nulle lorsque comparée à la valeur-p du test : p   : Rejet de H0 p   : Non rejet de H0

21 Exemple Minitab : Comparer deux fournisseurs
Un fabriquant de moteurs de voitures reçoit des arbres à cames de deux fournisseurs différents La longueur des arbres à cames est une caractéristique critique et il est essentiel que les arbres à cames des deux fournisseurs soient de la même longueur De plus, chaque fournisseur doit fournir des arbres à cames d’une longueur moyenne de mm Le fabriquant de moteurs veut s’assurer que sa spécification sur la longueur moyenne des arbres à cames est respectée par les deux fournisseurs, à l'aide d'un échantillon de 100 pièces par fournisseur

22 Exemple Minitab (suite)
File < Open Worksheet < CAMSHATF2.MTW

23 Données du Fournisseur 1

24 Données du Fournisseur 2

25 Statistiques descriptives – Fournisseur 1

26 Statistiques descriptives – Fournisseur 2

27 Exemple Minitab (suite)
Longueurs moyennes Fournisseur 1 : mm Fournisseur 2 : mm Longueur cible : mm De plus, chaque arbre à cames doit se retrouver à moins de 2 mm de cette cible

28 Exemple Minitab (suite)
Le fabriquant aimerait valider Si le Fournisseur 2 a une moyenne différente de la valeur cible La moyenne de son échantillon, , semble trop élevée Si les arbres à cames reçus par les deux fournisseurs sont en moyenne de longueurs différentes Comment répondre à ces interrogations? Réaliser un test d’hypothèses sur une moyenne avec les échantillons du Fournisseur 2 Réaliser un test d’hypothèses sur l’égalité des moyennes des deux fournisseurs

29 Test sur une moyenne

30 Exemple Minitab – Test t-1 échantillon
Hypothèses à vérifier H0 : la « vraie » moyenne du Fournisseur 2 = H1 : la « vraie » moyenne du Fournisseur 2 ≠ Puisque les données du Fournisseur 2 correspondent à une distribution normale et que l’écart-type de la population sous- jacente est inconnu, il faut utiliser le test-t de Student pour un échantillon Stat < Basic Statistics < 1-Sample t… Lorsque l’écart-type de la population sous-jacente est connu (rare), il faut utiliser le test-Z pour un échantillon Stat < Basic Statistics < 1-Sample Z…

31 Exemple Minitab – Test t-1 échantillon (suite)
Choix de trois graphiques possibles Fournisseur 2 H0 : Moyenne du Fournisseur 2 = H1 : Moyenne du Fournisseur 2 ≠

32 Exemple Minitab – Test t-1 échantillon (suite)
Résultats Minitab : n = 100 observations du Fournisseur 2 (Supp2) Moyenne = Écart-type = 1.874 Il y a 95 chances sur 100 que la vraie moyenne soit comprise dans l’intervalle [ ; ] La valeur t de Student est de 7.90 à laquelle correspond une valeur-p de 0.000, ce qui signifie qu’il n’y a pratiquement aucun risque d’erreur à rejeter l’hypothèse nulle (moyenne = 598,75) Le fournisseur 2 ne produit pas d’arbres à cames dont la longueur moyenne est de

33 Test sur une moyenne et intervalle de confiance
Il est possible d’utiliser l’intervalle de confiance pour comparer ou tester une moyenne à une valeur cible Similaire au test d’hypothèses lorsque la valeur alpha est utilisée comme critère de rejet Par contre, sans test d’hypothèses, l’information sur le risque réel de faire une erreur de type 1 (valeur-p) est perdue Si l’intervalle de confiance de la moyenne calculée à partir de l’échantillon n’inclut pas la valeur cible, alors la vraie moyenne diffère significativement de la valeur cible Cible Cible IC IC Moyenne Moyenne significativement différente de la cible Moyenne non significativement différente de la cible

34 Exemple Minitab (suite)
Puisque la valeur cible de n’est pas incluse dans l’intervalle de confiance à 95% de la moyenne réelle du Fournisseur 2 [ ; ], il est possible de conclure que : La moyenne réelle de la longueur des arbres à cames du Fournisseur 2 est significativement différente de Il y a 95 chances sur 100 que la moyenne réelle de la longueur des arbres à cames du Fournisseur 2 se situe entre et mm

35 Exemple Minitab – Test t-1 échantillon (suite)
Valeur cible de Moyenne observée dans l’échantillon Intervalle de confiance à 95% Montre l’étalement des données

36 Exemple Minitab – Test t-1 échantillon (suite)
Permet de valider visuellement si les données correspondent à une distribution normale

37 Exercice File < Open Worksheet < CAMSHATF2.MTW
Vérifiez s’il y a évidence ou non que la moyenne réelle de la longueur des arbres à cames du Fournisseur 1 (Supp1) ne respecte pas la valeur cible de mm Tirez les conclusions à partir de la valeur-p Tirez les conclusions à partir de l’intervalle de confiance

38 Test sur deux moyennes

39 Exemple Minitab – Test t-2 échantillons
Hypothèses à vérifier H0 : moyenne du Fournisseur 1 = moyenne du Fournisseur 2 H1 : moyenne du Fournisseur 1 ≠ moyenne du Fournisseur 2 Grâce au test d’hypothèses, une valeur-p sera obtenue Si valeur-p ≤  (0,05 par défaut) : Rejet de H0 Si valeur-p >  (0,05 par défaut) : Non rejet de H0 Test avec Minitab Stat < Basic Statistics < 2-Sample t …

40 Comparaison de deux moyennes
En général, le test d'hypothèses sur l’égalité des moyennes de deux populations peut être exprimé sous deux formes : Mathématiquement, afin de pouvoir calculer une valeur-p, c’est la seconde formulation qui est utilisée par Minitab ou

41 Comparaison de deux moyennes (suite)
Pour vérifier si la vraie moyenne du groupe 1 est inférieure à la vraie moyenne du groupe 2: Pour vérifier si la vraie moyenne du groupe 1 est supérieure à la vraie moyenne du groupe 2: ou ou

42 Comparaison de deux moyennes (suite)
Le test d'hypothèses sur la comparaison de deux moyennes est basé sur les conditions suivantes : Indépendance des deux échantillons Échantillons aléatoires distribués selon la loi normale Populations aux variances inconnues Selon que les variances des deux populations soient considérées égales ou non, la mathématique du test changera quelque peu

43 Exemple Minitab – Indépendance entre les échantillons
Façon simple et rapide de vérifier l’indépendance des deux échantillons Visualiser le graphique de points entre le Fournisseur 1 (Supp1) et le Fournisseur 2 (Supp2) Tester l’hypothèse que le coefficient de corrélation entre les deux variables (Supp1 et Supp2) = 0 Y-a-t-il corrélation (dépendance) entre Supp1 et Supp2?

44 Exemple Minitab – Échantillons aléatoires et distribués selon la loi normale?
Étant donné… Que les deux fournisseurs ont une grande taille d’échantillons N = 100 ( n > 30) Que leurs données individuelles respectives placées en histogrammes montrent des distributions plutôt symétriques … Il est possible de s’appuyer sur le Théorème Central Limite pour présumer que les distributions des moyennes en présence correspondent à une loi normale Il est alors pertinent d’utiliser le test t-2 échantillons

45 Valider si les variances inconnues des deux populations sont égales ou non
Lorsque les variances sont inconnues (c’est fréquent), elles peuvent être supposées égales ou non Selon le cas, la mathématique du test d’hypothèses sur deux moyennes est quelque peu différente Dans le doute, le choix sécuritaire est de les considérer inégales L’option est disponible dans Minitab Minitab offre également un test d’hypothèses sur l’égalité des variances des deux populations

46 Test sur 2 moyennes si variances égales
et Minitab utilise l’expression “Pooled variances”

47 Test sur 2 moyennes si variances inégales
et sont respectivement la moyenne des échantillons 1 et 2 n1 et n2 représentent la taille des échantillons 1 et 2 s1 et s2 sont respectivement les écarts-type des échantillons 1 et 2

48 Exemple Minitab – Test t-2 échantillons (suite)
Puisque les hypothèses de départ ont été vérifiées, il est possible d’effectuer le test t de Student pour deux échantillons Les deux échantillons sont considérés indépendants et aléatoires Les distributions des moyennes sont considérées correspondre à une loi normale Même si l’hypothèse d’égalité des variances n’est pas vérifiée, il est possible de réaliser le test t en supposant les variances inégales

49 Exemple Minitab – Test t-2 échantillons (suite)
Stat < Basic Statistics < 2-Sample t …

50 Exemple Minitab – Test t-2 échantillons (suite)
En moyenne, l’échantillon du Fournisseur 1 semble inférieur à celui du Fournisseur 2 Cependant, peut-on conclure la même chose au sujet de la production individuelle de chaque fournisseur ?

51 Exemple Minitab – Test t-2 échantillons (suite)
Lequel des deux fournisseurs présente la plus faible variation dans sa production?

52 Exemple Minitab – Test t-2 échantillons (suite)
Hypothèse nulle spécifiée au sujet des deux moyennes

53 Exemple Minitab – Test t-2 échantillons (suite)
Intervalle de confiance à 95% pour la différence (notez que zéro n'y est pas inclus)

54 Exemple Minitab – Test t-2 échantillons (suite)
Statistique calculée du test t

55 Exemple Minitab – Test t-2 échantillons (suite)
Puisque la valeur-p < 0,05, il est pertinent de rejeter H0 (l’égalité des moyennes)

56 Test sur deux moyennes et intervalle de confiance
Encore une fois, il est possible d’utiliser l’intervalle de confiance pour comparer l’égalité des deux moyennes Si l’intervalle de confiance sur la différence de deux moyennes ne contient pas la valeur 0, alors les deux moyennes sont significativement différentes (à un niveau de confiance de 95%) Si la valeur 0 est incluse dans l’intervalle de confiance sur la différence, alors les deux moyennes sont supposées égales par manque d’évidence du contraire Le tout est similaire au test d’hypothèses lorsque la valeur alpha est utilisée comme critère de rejet Par contre, sans test d’hypothèses, l’information sur le risque réel de faire une erreur de type 1 (valeur-p) est perdue

57 Intervalle de confiance sur la différence entre deux moyennes (1 et 2 inconnues)
et sont respectivement la moyenne des échantillons 1 et 2 n1 et n2 représentent la taille des échantillons 1 et 2 s1 et s2 sont respectivement les écarts-type des échantillons 1 et 2 Note : Les formules de l’écart-type lorsque les variances sont considérées égales ou non ont déjà été présentées

58 Exemple Minitab – Conclusion
Puisque la valeur 0 ne fait pas partie de l’intervalle de confiance, les moyennes des deux fournisseurs sont significativement différentes Questions À la vue de tous ces résultats, lequel des deux fournisseurs choisiriez- vous? Pourquoi? Quels sont les actions correctives que doivent viser chaque fournisseur pour mieux répondre aux exigences de leur client?

59 Test sur deux proportions

60 Comparaison de deux proportions
Ce test d'hypothèses sur l’égalité des proportions de deux populations binomiales requiert des tailles d’échantillon respectives suffisamment élevées de sorte que : Peut être exprimé sous deux formes : ou

61 Comparaison de deux proportions (suite)
Sous l’hypothèse H0 et en respectant les tailles d’échantillon suffisamment élevées, la différence standardisée suit une loi Normale de moyenne zéro et d’écart-type un Le test de comparaison de deux proportions se fait ensuite exactement comme un test de deux moyennes

62 Exemple Minitab Vous devez autoriser l’achat de 20 photocopieuses. Après avoir comparé différentes photocopieuses en terme de prix, qualité d’une photocopie et garantie, votre choix s’est arrêté sur deux marques : Choix X et Choix Y. Vous décidez que le facteur déterminant sera la fiabilité des marques qui est comptabilisée comme étant la proportion de services requis la première année d’utilisation Puisque la compagnie où vous travaillez utilise déjà ces deux marques, vous pouvez obtenir de l’information sur 50 photocopieuses choisies de façon aléatoire de chaque marque. Les données indiquent que six photocopieuses du Choix X et huit du Choix Y ont eu besoin de service Stat < Basic Statistics < 2 Proportions

63 Exemple Minitab (suite)

64 Exemple Minitab (suite)
Que concluez-vous?

65 Exemple Minitab (suite)
Puisque p-value = > 0.05, l’hypothèse H0 ne peut être rejetée et donc les deux marques ne présentent pas de différence en terme de fiabilité Cependant, en regardant l’intervalle de confiance, vous trouvez que ce dernier ne vous donne pas une information très précise sur la différence entre les deux proportions et aimeriez obtenir un intervalle plus précis Que pouvez-vous faire pour obtenir une information plus précise ?

66 Taille d’échantillon

67 Facteurs qui influencent la taille d’échantillon
La taille d’échantillon nécessaire est fonction de: Erreur de type I (α) : en général 5% ou 10% Puissance du test (1-) : en général 80% ou 90% Différence minimale à pouvoir détecter par le test Variation naturelle à l’intérieur des échantillons

68 Considérations pratiques
La différence minimale à pouvoir détecter est une valeur habituellement propre à chaque processus et déjà connue L’écart-type du procédé n’est pas toujours connu et doit parfois être estimé par des données historiques qui démontrent idéalement un état de contrôle statistique Lorsqu’aucune donnée historique n’est disponible, il est alors parfois nécessaire de faire un essai pilote pour aller chercher cette information

69 Exemple Minitab : Calcul de la taille d’échantillon
Stat < Power and Sample Size… Click to add comments. … Choisir en fonction du test à réaliser

70 Exemple Minitab : Calcul de la taille d’échantillon (suite)
Les informations suivantes doivent être entrées afin que Minitab puisse calculer la taille d’échantillon correspondante Différence minimale à pouvoir détecter en pratique Écart-type connu du processus Puissance du test à détecter cette différence s’il y en a vraiment une (exemple : 90%)

71 Exemple Minitab : Calcul de la taille d’échantillon (suite)
Minitab donne la taille d’échantillon requise pour chaque groupe testé afin de répondre aux exigences de puissance et de différence minimum à détecter, en considérant la variation naturelle du processus:

72 Influences de la taille d’échantillon sur le test
Si la taille d’échantillon est trop petite, de fausses conclusions peuvent être tirées des tests d’hypothèses Si la taille d’échantillon est trop grande, toute différence aussi petite soit-elle sera détectée significativement par le test même si en pratique elle n’est peut-être pas importante Plus la taille d’échantillon est grande et plus les informations qu’on en retire sont précises En supposant que le système de mesure est adéquat !

73 Points à retenir Il est possible d’identifier et de minimiser les risques dans la prise de décision à l’aide des tests d’hypothèses La valeur-p permet de quantifier l’incertitude au sujet des conclusions émises lors d’un test d’hypothèses Plusieurs tests statistiques reposent sur la distribution normale Calculer la taille d’échantillon requise pour s’assurer de la puissance nécessaire à détecter une différence donnée ne devrait jamais être négligé

74 Politique de propriété intellectuelle
Le présent document est la propriété unique et exclusive de Fujitsu Solutions Lean. L’utilisation non autorisée, la divulgation ou la reproduction, sous quelque forme que ce soit, du matériel contenu dans ce document est expressément interdite. Toute utilisation non autorisée ou illégale par l’usager le rendra susceptible de faire l’objet de toute procédure légale et appropriée, à la disposition de © Fujitsu Conseil (Canada) inc Tous droits réservés


Télécharger ppt "Formation Green Belt Lean Six Sigma Tests d’hypothèses"

Présentations similaires


Annonces Google