La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Plan d’échantillonnage : Rappels statistiques

Présentations similaires


Présentation au sujet: "Plan d’échantillonnage : Rappels statistiques"— Transcription de la présentation:

1 Plan d’échantillonnage : Rappels statistiques

2 Plan Estimer l’émission du danger Représenter et explorer les données
Estimer les caractéristiques d’une population Variabilité et incertitude

3 Plan Estimer l’émission du danger Représenter et explorer les données
Estimer les caractéristiques d’une population Variabilité et incertitude

4 L’émission du danger : ses paramètres
L'émission du danger se décrit par deux types de paramètres : Premier paramètre : la proportion d'individus non conformes présents dans la population (l'ensemble des produits considérés) : contrôle par attributs Deuxième paramètre : le niveau de contamination de ces non conformes (quantité de germes par gramme de produit non conforme) : contrôle par mesurage Apprécier l’émission d’un danger : déterminer ou estimer Dans notre travail d’inspecteur, lorsque nous cherchons à apprécier l’émission d’un danger par un processus de fabrication, nous disposons de deux types de paramètres (voir TPS) Ces documents peuvent aussi s'appliquer aux risques chimiques

5 Déterminer ou estimer Déterminer la proportion de non conformes dans une population = connaître cette proportion Cela impose le contrôle de tous les individus de cette population C'est dans la plupart des cas techniquement et économiquement impossible.

6 Déterminer ou estimer Estimer la proportion de non conformes dans une population = rechercher la valeur numérique ou la distribution représentant cette proportion Cela impose de collecter des données d'observations sur un échantillon. Le résultat obtenu est toujours une approximation de la valeur réelle de cette proportion

7 Définition d'une variable statistique
Le caractère sur lequel porte une étude statistique est appelé variable statistique. Cette dernière peut être : Qualitative et comporter plusieurs modalités (couleur des yeux, conforme ou non conforme). Quantitative si elle peut être déterminée numériquement (c'est le cas du nombre de germes par gramme d’un produit). La particularité des résultats d’autocontrôles que nous avons à analyser et donc à interpréter set d’être présentés à la fois sous forme quantitative (niveau de contamination) et qualitative ( conformité ou non-conformité par rapport à un critère prédéfini). Exemple : Faire le schéma d’interprétation des résultats d’autocontrôles bactériologiques pour monter l’importance de l’analyse des niveaux de contamination pour les mettre en corrélation avec l’analyse des risques.

8 Définition d'une variable statistique
Une variable quantitative peut être qualifiée de : de discontinue (ou discrète), elle ne peut alors prendre que certaines valeurs (généralement entières) et suppose un comptage, de continue, elle peut prendre toutes les valeurs d’un intervalle donné, ces valeurs provenant le plus souvent d’un mesurage. La particularité des résultats d’autocontrôles que nous avons à analyser et donc à interpréter set d’être présentés à la fois sous forme quantitative (niveau de contamination) et qualitative ( conformité ou non-conformité par rapport à un critère prédéfini). Exemple : Faire le schéma d’interprétation des résultats d’autocontrôles bactériologiques pour monter l’importance de l’analyse des niveaux de contamination pour les mettre en corrélation avec l’analyse des risques.

9 Représenter l’émission du danger
On désigne par observations l’ensemble des valeurs des différents caractères observés sur chaque individu. A la suite d’une étude statistique on obtient habituellement un grand nombre d’observations. Pour donner une valeur informative à cette masse de données, il est nécessaire de les résumer, les décrire et les présenter.

10 Représenter l’émission du danger
On appelle effectif le nombre d’individus d’une population ou d’un sous ensemble de cette population (un échantillon, une classe, une modalité…) On appelle fréquence le rapport de l'effectif d'une modalité, d'une classe, d'une valeur … à l'effectif total observé.

11 Un procédé de fabrication est soumis à variabilité
Variabilité du processus Variabilité de la main d’œuvre Variabilité de la méthode Variabilité de la matière Variabilité du milieu Variabilité des moyens ou du matériel En conclusion de cette présentation il est important de signaler que la caractérisation des lots de fabrication doit être systématiquement précédée d’une analyse des risques en s’appuyant sur : la démarche HACCP de l’entreprise (elle permet de déterminer ce qui fait que deux lots de fabrication ne sont pas fabriqués dans les mêmes conditions), sur les procédures de traçabilité mises en œuvre (elles permettent de prouver que toutes les informations liées au lot ne sont pas perdues tout au long de la chaîne de production et jusqu’au consommateur. 11

12 Prise en compte de cette variabilité
Il faut être capable : De décrire la variabilité D’explorer la variabilité Pour cela, il faut collecter les données Collecter les données Bien les représenter

13 Plan Estimer l’émission du danger Représenter et explorer les données
Estimer les caractéristiques d’une population Variabilité et incertitude

14 Collecter les données Toutes les données doivent être collectées de la même manière Autant que possible, il faut bien décrire les conditions dans lesquelles les données ont été collectées. Individus Variable QT Variable QL Ind 1 - Ind k Eff 1 Eff k Modalités

15 Représenter des données qualitatives
Les représentations les plus courantes consistent à faire correspondre aux effectifs (ou fréquences) des diverses modalités du caractère étudié des surfaces qui leur sont proportionnelles. diagrammes en bâtons diagrammes en secteurs 

16 Représenter des données quantitatives
Lorsque l'effectif des observations individuelles est important, on effectue le plus souvent un regroupement des valeurs en classes. Les classes sont des intervalles jointifs constituant une partition de l’intervalle total de variation permettant de répartir de façon univoque toutes les observations. Nb de NC Effectifs Fréquences 1 2 3 4 5 95 15 9 0,73 0,11 0,04 0,02 0,03 0,07 Total 130 Dans le cas d'un caractère quantitatif il vaut mieux commencer par une courbe de fréquence cumulée pour un classement des données

17 Représenter des données quantitatives
Les professionnels utilisent régulièrement trois types de diagrammes pour représenter la distribution d'une variable quantitative : Des diagrammes représentant les effectifs ou les fréquences, Des diagrammes représentant les effectifs cumulés ou les fréquences cumulées, Des diagrammes d'enregistrements de séries d’observations selon l'ordre ou la chronologie de leurs relevés.

18 Exemple (1) du nombre de germes par gramme dans des plats cuisinés.
Représenter des données quantitatives Exemple (1) du nombre de germes par gramme dans des plats cuisinés. Capacité de détecter Capacité de réaction Capacité de tracer la détection et la réaction

19 Proportion de non conformes dans le lot
Représenter des données quantitatives Exemple de la proportion de non conformes dans des lots de fabrication de fromages Prévision: S. Aureus >m Graphe de fréquences ,068 681 ,051 510,7 ,034 340,5 ,017 170,2 moyenne : 0,17 ,000 0,00 0,25 0,50 0,75 1,00 Proportion de non conformes dans le lot

20 Exemple du nombre de non conformes dans des lots de steaks hachés
Représenter des données quantitatives Exemple du nombre de non conformes dans des lots de steaks hachés (pseudo histogramme) Ce type de diagramme est intéressant pour effectuer une analyse chronologique du risque dans une entreprise : Repérer un problème dans le temps Nettoyage désinfection Changement d’équipe d’opérateurs Changement de matières premières ou d’ingrédients

21 Plan Estimer l’émission du danger Représenter et explorer les données
Estimer les caractéristiques d’une population Variabilité et incertitude

22 Décrire des données Afin de décrire les séries de données, on utilise : Des caractéristiques de tendance centrale : la moyenne, la médiane et le mode, Des paramètres de dispersion : la variance, l'écart type et l'étendue, A tout graphique (donc à toute série d’observations, il est possible d’associer une loi mathématique que l’on désigne par le terme de loi statistique ou « distribution » suivie du nom de la loi statistique.

23 Les caractéristiques de tendance centrale
le mode : c’est la valeur de la variable qui a l’effectif le plus élevé. Le mode peut ne pas exister et s’il existe, il peut ne pas être unique (on parle de série monomodale et de série plurimodale) la médiane : c’est la valeur de la variable partageant en deux moitiés la série ordonnée des observations. - si n = 2k M = xk - si n = 2k M = 1/2 (xk + xk+1) par convention Les caractéristiques que l’on ressent : Le mode : c’est ce que l’on appelle la valeur la plus probable ou à tort la “moyenne” L’écart type : il a la particularité d’avoir la même unité que celle de la valeur mesurée Le risque d’erreur lié à l’utilisation de la moyenne comme indicateur fiable: Elle ne permet pas d’identifier les extrêmes Elles masque l’importance des produits à forte contamination

24 Les caractéristiques de tendance centrale
la moyenne arithmétique : elle est définie pour une série de valeurs x1,x2,…xi d'une même grandeur x par la relation mathématique : où xi représente une valeur de x et N le nombre de valeurs de x Les caractéristiques que l’on ressent : Le mode : c’est ce que l’on appelle la valeur la plus probable ou à tort la “moyenne” L’écart type : il a la particularité d’avoir la même unité que celle de la valeur mesurée Le risque d’erreur lié à l’utilisation de la moyenne comme indicateur fiable: Elle ne permet pas d’identifier les extrêmes Elles masque l’importance des produits à forte contamination

25 Les caractéristiques de dispersion
L’étendue : c’est la différence entre la plus grande et la plus petite valeur d’une variable statistique. La variance : c’est la moyenne arithmétique des carrés des écarts par rapport à la moyenne des valeurs d'une variable statistique. où N est l'effectif de la population (le lot de fabrication), xi est un résultat individuel et la moyenne de la population (le lot de fabrication) L’écart type : c’est la racine carrée de la variance. Remarque sur l’écart-type Evalue l'écart type d'une population en se basant sur un échantillon de cette population. L'écart type est une mesure de la dispersion des valeurs par rapport à la moyenne (valeur moyenne). La fonction ECARTYPE utilise la formule suivante : Calcule l'écart type d'une population à partir de la population entière telle que la déterminent les arguments. L'écart type est une mesure de la dispersion des valeurs par rapport à la moyenne (valeur moyenne). La fonction ECARTYPEP utilise la formule suivante :

26 Estimer les caractéristiques d’une population
Une population P est un ensemble d'individus (animaux, produits alimentaires,…) auquel on s'intéresse. Soit un caractère donné présent dans la population P. Il est évident que, vu la taille de la population, on ne peut pas étudier ce caractère sur la population entière. On extrait donc de cette population un échantillon de taille n censé représenter aussi fidèlement que possible cette population.

27 Estimer les caractéristiques d’une population
L'échantillonnage, ou le sondage, est l'ensemble des opérations qui ont pour objectif de prélever dans une population les individus devant constituer un échantillon. Cet échantillon est le plus souvent aléatoire et simple, il est prélevé à partir d’un lot (la population) d’une manière aléatoire. Tout élément du lot doit avoir une probabilité égale d’être choisi.

28 Précision et exactitude d’un plan d’échantillonnage
L'image de la population obtenue grâce aux techniques d'échantillonnage doit être précise et exacte Exact Biaisé Précis Imprécis

29 Estimer les caractéristiques d’une population
Après avoir constitué l’échantillon, on mesure certaines caractères de chaque unité prélevée de manière à estimer: des caractéristiques de tendance centrale : généralement la moyenne des caractéristiques de dispersion : généralement l’écart type De manière à extrapoler ces résultats à la population. Cette estimation est entachée d’erreurs.

30 Moyenne et écart type Estimation ponctuelle d'une caractéristique d'une population Ces valeurs estimées sont des valeurs approximatives des valeurs réelles de la population : la moyenne de l'échantillon est un estimateur de la moyenne de la population, il est possible d'estimer l'écart type de la population à partir des valeurs mesurées sur les individus de l'échantillon en utilisant la formule suivante : où n est l'effectif de l'échantillon, xi un résultat individuel et la moyenne de l'échantillon Estimateur sans biais Un estimateur est dit sans biais lorsque son espérance mathématique est égale à la valeur vraie du paramètre. Robustesse Le terme ``robuste'' a été pour la première fois introduit en statistique par G.E.P. Box en Un estimateur est dit robuste si il est insensible à des petits écarts sur les hypothèses pour lesquelles il a été optimisé. Il y a deux sens au terme ``petit'': de petites variations sur toutes les données, ou des écarts importants sur un petit nombre de données. C'est le deuxième aspect qui est le plus mal pris en compte par les estimateurs classiques. Ainsi, la robustesse traduit le plus souvent la résistance de l'estimation aux données abérentes. On la définit mathématiquement par le plus petit nombre de données extrèmes qui modifie la valeur de l'estimation ramené à la taille de l'échantillon. Considérons un échantillon constitué de valeurs identiques , auquel on ajoutera une perturbation sous la forme de valeurs extrèmes . Pour estimer l'espérance mathématique, on peut utiliser la moyenne arithmétique qui donne bien sûr sur l'échantillon. Cependant, cette estimation est modifiée dès l'introduction d'une nouvelle valeur, , sa robustesse est donc de . Par contre, la médiane de cet échantillon n'est pas modifiée si l'on ajoute une valeur extrème. En fait, la médiane ne sera modifiée que si le nombre de valeurs extrèmes est supérieur au nombre de valeurs initiales. On en déduit que la robustesse de l'estimateur médiane est égale à dont la valeur asymptotique est . si σe est l'écart type observé sur l'échantillon

31 Intervalle de confiance
Estimation d'une caractéristique d'une population par intervalle de confiance Il s'agit, en pratique, de déterminer : des intervalles de valeurs dans lesquels se situe la vraie valeur moyenne ou la vraie proportion du caractère étudié dans la population mais avec un certain risque d'erreur (risque de se tromper). Pour un risque d’erreur α (ou un seuil de confiance 1 - α ) , l’intervalle de confiance est délimitées par deux valeurs D1 et D2 telles que : Proba (D1<estimateur<D2) = 1 - α

32 Intervalle de confiance
Exemple : Etape de cuisson d’un plat en sauce Temps de cuisson (minutes): 108 [75,126] 108 : valeur moyenne [75,126] : intervalle de confiance à 95 % Quantité de poivre (g) : 95 [56,132] Contamination du poivre (log10cfu.g-1 de C. perfringens): 2.6[1.8,3.2]

33 Estimation de la moyenne
On cherche à estimer la moyenne de la population à partir de la moyenne de l'échantillon et à la décrire par intervalle de confiance Mp la moyenne de la population : elle est inconnue mais c'est la vraie valeur me la moyenne de l'échantillon : elle est connue mais c'est une valeur estimée, L'intervalle de confiance de la moyenne de la population avec une probabilité d'erreur de 5 % est donné par la formule : 1,96 est le coefficient qui correspond à 5% d'erreur (loi normale réduite)

34 Estimation de la moyenne
Remarque n° 1 : La performance du plan d'échantillonnage ne dépend que de l'effectif de l'échantillon et non du rapport de cet effectif à celui de la population dans laquelle cet échantillon a été prélevé. Certains plans prévoient de prélever des échantillons dont la taille est proportionnelle à celle du lot : Grands échantillons dans les lots de grande taille → estimation précise Petits échantillons dans les lots de petite taille → estimation moins précise

35 Estimation de la moyenne
Étendue de l'intervalle de confiance du résultat en fonction de l'effectif de l'échantillon

36 Estimation de la moyenne
Remarque n° 2 : Il y a corrélation directe entre l’écart type de l'échantillon et celle de la population dans laquelle il est prélevé . Si le tirage de l'échantillon est bien réalisé au hasard, une population hétérogène (écart type élevé) produira des échantillons hétérogènes. Pour avoir une estimation précise à partir d’une population hétérogène, il faut un échantillon très grand. Monter un exemple avec tirage aléatoire d’un échantillon sur une population EC intralot travail sur les paramètres des CCP EC Interlot travail sur la maîtrise du procédé

37 Estimation de la moyenne
Remarque n° 3 : la moyenne arithmétique me de ne observations indépendantes converge vers la moyenne de la population d'où l'échantillon a été tiré (c'est le théorème central limite) : quand L’évidence de la journée ou comment les mathématiciens formalisent les banalités

38 Estimation de la moyenne
Remarque n° 4 : Attention ! si la distribution n'est pas unimodale, la moyenne et l'écart type ne veulent plus rien dire. → Toujours représenter les données avant d’estimer une moyenne Mp sp

39 Plan Estimer l’émission du danger Représenter et explorer les données
Estimer les caractéristiques d’une population Variabilité et incertitude

40 Variabilité et incertitude
Variabilité : hétérogénéité naturelle des composantes d’un système Inhérente au système Prise en compte obligatoire Incertitude : manque de connaissance sur le système Dépend de la qualité des connaissances Prise en compte recommandée

41 Variabilité Température ambiante, contamination du milieu….
Contamination, caractéristiques physico-chimiques…. Performances du matériel…. Processus Main d’œuvre Méthode Matière Milieu Moyens ou Matériel Contamination du produit final Contamination, respect des BPHF…. En conclusion de cette présentation il est important de signaler que la caractérisation des lots de fabrication doit être systématiquement précédée d’une analyse des risques en s’appuyant sur : la démarche HACCP de l’entreprise (elle permet de déterminer ce qui fait que deux lots de fabrication ne sont pas fabriqués dans les mêmes conditions), sur les procédures de traçabilité mises en œuvre (elles permettent de prouver que toutes les informations liées au lot ne sont pas perdues tout au long de la chaîne de production et jusqu’au consommateur. Temps, températures…. 41

42 Variabilité Variabilité résumée par des estimations (moyenne, écart-type) Analyse de sensibilité pour déterminer les sources de variabilité (en entrée) qui ont le plus fort impact sur la variabilité en sortie Notion de lot Homogénéité des conditions de fabrication Traçabilité

43 Incertitude Manque de connaissance :
Incertitude de mesure Incertitude d’échantillonnage Incertitude de modèle Se traduit sur une incertitude sur l’estimation d’une contamination

44 A vous de jouer


Télécharger ppt "Plan d’échantillonnage : Rappels statistiques"

Présentations similaires


Annonces Google