4°) Intervalle de fluctuation : Notre étude a montré que lorsque la taille augmente, la fluctuation diminue. taille 20 fréquence 65,0 % taille 500 fréquence 53,2 % taille 16000 fréquence 49,8 %
4°) Intervalle de fluctuation : Notre étude a montré que lorsque la taille augmente, la fluctuation diminue. Il semble que la valeur centrale soit de ≈ 50% d’après le 3ème diagramme. taille 20 fréquence 65,0 % variation 15% taille 500 fréquence 53,2 % variation 3,2% taille 16000 fréquence 49,8 % variation 0,2%
Pourrait-on avoir des exemples où obtenir f = 0 ou 1 Pourrait-on avoir des exemples où obtenir f = 0 ou 1 ? Combien d’exemples ? pour n = 1 ?
Pourrait-on avoir des exemples où obtenir f = 0 ou 1 Pourrait-on avoir des exemples où obtenir f = 0 ou 1 ? Combien d’exemples ? pour n = 1 ? On les a déjà obtenus
Pourrait-on avoir des exemples où obtenir f = 0 ou 1 Pourrait-on avoir des exemples où obtenir f = 0 ou 1 ? Combien d’exemples ? pour n = 1 ? On les a déjà obtenus ( tous les exemples ).
Pourrait-on avoir des exemples où obtenir f = 0 ou 1 Pourrait-on avoir des exemples où obtenir f = 0 ou 1 ? Combien d’exemples ? pour n = 1 ? On les a déjà obtenus ( tous les exemples ). pour n = 2 ?
Pourrait-on avoir des exemples où obtenir f = 0 ou 1 Pourrait-on avoir des exemples où obtenir f = 0 ou 1 ? Combien d’exemples ? pour n = 1 ? On les a déjà obtenus ( tous les exemples ). pour n = 2 ? On en déjà obtenu
Pourrait-on avoir des exemples où obtenir f = 0 ou 1 Pourrait-on avoir des exemples où obtenir f = 0 ou 1 ? Combien d’exemples ? pour n = 1 ? On les a déjà obtenus ( tous les exemples ). pour n = 2 ? On en déjà obtenu ( quelques exemples ).
Pourrait-on avoir des exemples où obtenir f = 0 ou 1 Pourrait-on avoir des exemples où obtenir f = 0 ou 1 ? Combien d’exemples ? pour n = 1 ? On les a déjà obtenus ( tous les exemples ). pour n = 2 ? On en a déjà obtenu ( quelques exemples ). pour n = 10 ? On n’en a pas obtenu ( aucun exemple,
Pourrait-on avoir des exemples où obtenir f = 0 ou 1 Pourrait-on avoir des exemples où obtenir f = 0 ou 1 ? Combien d’exemples ? pour n = 1 ? On les a déjà obtenus ( tous les exemples ). pour n = 2 ? On en déjà obtenu ( quelques exemples ). pour n = 10 ? On n’en a pas obtenu ( aucun exemple, mais on pourrait en obtenir quelques rares exemples ). Conclusion : le nombre d’exemples où f = 0 ou 1 …
Pourrait-on avoir des exemples où obtenir f = 0 ou 1 Pourrait-on avoir des exemples où obtenir f = 0 ou 1 ? Combien d’exemples ? pour n = 1 ? On les a déjà obtenus ( tous les exemples ). pour n = 2 ? On en déjà obtenu ( quelques exemples ). pour n = 10 ? On n’en a pas obtenu ( aucun exemple, mais on pourrait en obtenir quelques rares exemples ). Conclusion : le nombre d’exemples où f = 0 ou 1 diminue avec l’augmentation de la taille.
Conclusion : le nombre d’exemples où f = 0 ou 1 diminue avec l’augmentation de la taille. Pour une taille importante, ces exemples où f = 0 ou 1 sont des exemples …
Conclusion : le nombre d’exemples où f = 0 ou 1 diminue avec l’augmentation de la taille. Pour une taille importante, ces exemples où f = 0 ou 1 sont des exemples peu probables. On va donc ranger les échantillons en deux catégories :
Conclusion : le nombre d’exemples où f = 0 ou 1 diminue avec l’augmentation de la taille. Pour une taille importante, ces exemples où f = 0 ou 1 sont des exemples peu probables. On va donc ranger les échantillons en deux catégories : les échantillons probables, et les échantillons peu probables. Ces derniers peuvent être séparés dans deux sous-catégories : les peu probables …
Conclusion : le nombre d’exemples où f = 0 ou 1 diminue avec l’augmentation de la taille. Pour une taille importante, ces exemples où f = 0 ou 1 sont des exemples peu probables. On va donc ranger les échantillons en deux catégories : les échantillons probables, et les échantillons peu probables. Ces derniers peuvent être séparés dans deux sous-catégories : les peu probables trop bons ( fréquences proches de 1 ), et les peu probables trop mauvais ( fréquences proches de 0 ).
Exemples de fréquences possibles selon la taille : f 1 n 0 1 2 4 6 8 10
Exemples de fréquences possibles selon la taille : quelle est la taille minimale ? f 1 n 0 1 2 4 6 8 10
Exemples de fréquences possibles selon la taille : f 1 n 0 1 2 4 6 8 10
Exemples de fréquences possibles selon la taille : f 1 n 0 1 2 4 6 8 10
Exemples de fréquences possibles selon la taille : f 1 n 0 1 2 4 6 8 10
Exemples de fréquences possibles selon la taille : f 1 n 0 1 2 4 6 8 10
Exemples de fréquences possibles selon la taille : f 1 n 0 1 2 4 6 8 10
Exemples de fréquences possibles selon la taille : f 1 n 0 1 2 4 6 8 10
Exemples de fréquences possibles selon la taille : f 1 n 0 1 2 4 6 8 10
Exemples de fréquences possibles selon la taille : f 1 n 0 1 2 4 6 8 10
Exemples de fréquences possibles selon la taille : f 1 n 0 1 2 4 6 8 10
Quels exemples peuvent être considérés comme peu probables ? : f 1 n 0 1 2 4 6 8 10
Quels exemples peuvent être considérés comme peu probables ? : f 1 n 0 1 2 4 6 8 10
On peut séparer les exemples par une frontière : f 1 n 0 1 2 4 6 8 10
On peut séparer les exemples par une frontière : f 1 n 0 1 10 100 1000
On peut séparer les exemples par une frontière qui sépare les zones en échantillons … : f 1 n 0 1 10 100 1000
On peut séparer les exemples par une frontière : f 1 peu probables et trop bons probables peu probables et trop mauvais n 0 1 10 100 1000
Vers quelle valeur tend la fréquence ? f 1 peu probables et trop bons probables peu probables et trop mauvais n 0 1 10 100 1000
La fréquence tend vers la probabilité : f 1 peu probables et trop bons probables p peu probables et trop mauvais n 0 1 10 100 1000
Pour notre exemple de familles à 2 enfants : si on augmente la taille des échantillons, la fréquence semble tendre vers … n 1 2 10 20 40 100 1000 10000 … f ≈ 0,4 0,2 0,18 0,26 0,23 0,24 … ?
Pour notre exemple de familles à 2 enfants : si on augmente la taille des échantillons, la fréquence semble tendre vers … n 1 2 10 20 40 100 1000 10000 + ∞ f ≈ 0,4 0,2 0,18 0,26 0,23 0,24 1/4
Comment déterminer la probabilité ? f 1 peu probables et trop bons probables p peu probables et trop mauvais n 0 1 10 100 1000
Comment déterminer la probabilité Comment déterminer la probabilité ? En faisant un échantillon de taille infinie, ou ... f 1 peu probables et trop bons probables p peu probables et trop mauvais n 0 1 1000 100000 1000000000
Comment déterminer la probabilité Comment déterminer la probabilité ? En faisant un échantillon de taille infinie, ou en utilisant la science des probabilités ( voir chapitre des Probabilités ). f 1 peu probables et trop bons probables p peu probables et trop mauvais n 0 1 1000 100000 1000000000
Quel critère de choix d’un échantillon va-t-on prendre pour le garder ou l’éliminer ? f 1 peu probables et trop bons probables p peu probables et trop mauvais n 0 1 10 100 1000
Critère de choix d’un échantillon : Fait-il partie des probables ? f 1 peu probables et trop bons probables p peu probables et trop mauvais n 0 1 10 100 1000
La frontière entre les échantillons probables et peu probables sera le seuil de confiance à 95 % f 1 peu probables et trop bons probables p peu probables et trop mauvais n 0 1 10 100 1000
La frontière entre les échantillons probables et peu probables sera le seuil de confiance à 95 % Il signifie que 95% des échantillons sont probables, et 5% peu probables ( à partir de n = 20 et p entre 0,2 et 0,8, sinon par absence de critères on adopte quand même celui-là ). f 1 0,8 2,5% peu probables et trop bons p 95% probables 0,2 2,5% peu probables et trop mauvais 0 20 n
Exemple : échantillon de taille n = 50 et de fréquence f = 0,4 f 1 Si la fréquence d’un échantillon est entre les frontières, l’échantillon sera considéré fiable, car représentatif d’un phénomène aléatoire de probabilité p. Exemple : échantillon de taille n = 50 et de fréquence f = 0,4 f 1 2,5% peu probables et trop bons p 95% probables 2,5% peu probables et trop mauvais 0 n
Exemple : échantillon de taille n = 50 et de fréquence f = 0,4 f 1 Si la fréquence d’un échantillon est entre les frontières, l’échantillon sera considéré fiable, car représentatif d’un phénomène aléatoire de probabilité p. Exemple : échantillon de taille n = 50 et de fréquence f = 0,4 f 1 2,5% peu probables et trop bons p 0,4 95% probables 2,5% peu probables et trop mauvais 0 50 n
Exemple : échantillon de taille n = 50 et de fréquence f = 0,4 Si la fréquence d’un échantillon est entre les frontières, l’échantillon sera considéré fiable, car représentatif d’un phénomène aléatoire de probabilité p. Exemple : échantillon de taille n = 50 et de fréquence f = 0,4 l’échantillon est donc accepté. f 1 2,5% peu probables et trop bons p 0,4 95% probables 2,5% peu probables et trop mauvais 0 50 n
Valeurs numériques des frontières du seuil de confiance à 95 % : 1 2,5% peu probables et trop bons p 95% probables 2,5% peu probables et trop mauvais 0 n
Valeurs numériques des frontières du seuil de confiance à 95 % : La fluctuation diminue avec la taille : f 1 2,5% peu probables et trop bons p 95% probables 2,5% peu probables et trop mauvais 0 n
Valeurs numériques des frontières du seuil de confiance à 95 % : La fluctuation diminue avec la taille : Les fréquences ont pour valeur centrale la probabilité p. f 1 2,5% peu probables et trop bons p 95% probables 2,5% peu probables et trop mauvais 0 n
Pour la frontière supérieure, on peut adopter une fonction du type : fonction affine décroissante ? f 1 2,5% peu probables et trop bons p 95% probables 2,5% peu probables et trop mauvais 0 n
Pour la frontière supérieure, on peut adopter une fonction du type : fonction affine décroissante ? Non car à partir d’un certain n elle passera sous la valeur de p. f 1 2,5% peu probables et trop bons p 95% probables 2,5% peu probables et trop mauvais 0 n
Pour la frontière supérieure, on adopte une fonction du type : 1 fluctuation lorsque n on a bien ∆f f n 2,5% peu probables et trop bons p 95% probables 2,5% peu probables et trop mauvais 0 n
On a donc : pour la frontière supérieure f = p + 1/√n fonction 1/√n f 1 2,5% peu probables et trop bons p 95% probables 2,5% peu probables et trop mauvais 0 n
On a donc : pour la frontière supérieure f = p + 1/√n pour la frontière inférieure f = p - 1/√n fonction 1/√n f 1 2,5% peu probables et trop bons p 95% probables 2,5% peu probables et trop mauvais 0 n
Selon le critère de confiance au seuil de 95% l’échantillon est fiable si sa fréquence 1 1 f est dans [ p - ; p + ]. √n √n f 1 2,5% peu probables et trop bons p 95% probables 2,5% peu probables et trop mauvais 0 n
Selon le critère de confiance au seuil de 95% l’échantillon est fiable si sa fréquence 1 1 f est dans [ p - ; p + ]. √n √n Il n’y a que 3 caractéristiques qui sont liées par le phénomène de fluctuation d’échantillonnage : proportion p dans le grand ensemble proportion f dans l’échantillon taille n de l’échantillon
On aura 3 types d’exercices : On connait f et p et on veut savoir si l’échantillon est acceptable. p f On connait p et on veut connaître f. p On connait f et on veut connaître p. f
On aura 3 types d’exercices : On connait f et p et on veut savoir si l’échantillon est acceptable. p f ( f est-elle dans l’intervalle de confiance ? ) On connait p et on veut connaître f. ( en utilisant l’intervalle de confiance ) p On connait f et on veut connaître p. ( en utilisant le 2ème critère voir exo 2 ) f
Exemple : 30% des habitants d’une ville portent un chapeau. Un article dans un journal montre une photographie prise au hasard où 23 des 54 personnes portent un chapeau. La mairie a-t-elle raison de se plaindre de la photographie, qu’elle estime non représentative de sa population ?
Un collégien répondrait : 23 f = ≈ 0,4259… ≠ p = 0,3 54 f ≠ p donc l’échantillon n’est pas représentatif.
Un collégien répondrait : 23 f = ≈ 0,4259… ≠ p = 0,3 54 f ≠ p donc l’échantillon n’est pas représentatif. Mais il a tort car il suppose …
Un collégien répondrait : 23 f = ≈ 0,4259… ≠ p = 0,3 54 f ≠ p donc l’échantillon n’est pas représentatif. Mais il a tort car il suppose qu’il y a un phénomène de proportionnalité, ce qui est faux car les proportions de chapeaux dans la ville ne sont pas constantes.
Mais un lycéen connaît le phénomène de la fluctuation d’échantillonnage : Il sait que les 30 % ne sont pas ….
Mais un lycéen connaît le phénomène de la fluctuation d’échantillonnage : Il sait que les 30 % ne sont pas équitablement répartis dans la ville, donc que toutes les photographies n’auront pas la même proportion : ville mélange … photo : 30%
Mais un lycéen connaît le phénomène de la fluctuation d’échantillonnage : Il sait que les 30 % ne sont pas équitablement répartis dans la ville, donc que toutes les photographies n’auront pas la même proportion : ville mélange homogène photo : 30%
Mais un lycéen connaît le phénomène de la fluctuation d’échantillonnage : Il sait que les 30 % ne sont pas équitablement répartis dans la ville, donc que toutes les photographies n’auront pas la même proportion : ville mélange homogène photo : 30%
Mais un lycéen connaît le phénomène de la fluctuation d’échantillonnage : Il sait que les 30 % ne sont pas équitablement répartis dans la ville, donc que toutes les photographies n’auront pas la même proportion : ville mélange homogène photo : 30%
Mais un lycéen connaît le phénomène de la fluctuation d’échantillonnage : Il sait que les 30 % ne sont pas équitablement répartis dans la ville, donc que toutes les photographies n’auront pas la même proportion : ville mélange hétérogène photo : 50%
Mais un lycéen connaît le phénomène de la fluctuation d’échantillonnage : Il sait que les 30 % ne sont pas équitablement répartis dans la ville, donc que toutes les photographies n’auront pas la même proportion : ville mélange hétérogène photo : 15%
Mais un lycéen connaît le phénomène de la fluctuation d’échantillonnage : Il sait que les 30 % ne sont pas équitablement répartis dans la ville, donc que toutes les photographies n’auront pas la même proportion : ville mélange hétérogène photo : 30%
Selon le critère de confiance au seuil de 95%, f = 23/54 ≈ 0,4259… Les échantillons fiables sont ceux dont la fréquence est dans l’intervalle de confiance suivant : 1 1 1 1 p – ; p + = 0,3 – ; 0,3 + ≈ [ 0,1639 ; 0,4361 ] n n 54 54 0,1639 < 0,4259 < 0,4361 f est dans l’intervalle de confiance, donc l’échantillon est représentatif du phénomène aléatoire, donc la mairie ne peut se plaindre du journal.
qui correspond à : f 1 2,5% peu probables et trop bons ≈ 0,44 0,42 p = 0,3 95% probables ≈ 0,16 2,5% peu probables et trop mauvais 0 54 n