4°) Intervalle de fluctuation :

Slides:



Advertisements
Présentations similaires
Atelier 1 Le problème du surpoids sur géogébra. Etude de la prévalence du surpoids: (document Ressources pour la classe de terminale) Situation: On souhaite.
Advertisements

Dr. Tarek Barhoumi statistiques descriptives Statistiques descriptives Dr. Tarek Barhoumi.
A. Objectifs de la séquence: à l'issue de la séquence, il faut être capable de: Identifier l’ordre et la nature d’un filtre Tracer les diagrammes asymptotiques.
Chapitre 8 : Fluctuation d’échantillonnage.
Calcul de probabilités
Colloque francophone sur les sondages 2016
  Exercice 4 : Vous êtes employé au contrôle qualité d’un fabricant de 10 millions de CD. En temps habituel on a 20% de CD impropres à la vente. Aujourd’hui.
Valeurs de toutes les différences observables sous H0
METHODE REALISER UNE ETUDE DES FLUX CLIENTS
Besoin d’une volontaire pour lancer un volant de Badminton !
4°) Intervalle de fluctuation :
1 - Construction d'un abaque Exemple
Chapitre 3: Esquisser le graphique d’une fonction
Sondage Ifop pour le Rassemblement des Opticiens de France
8. Mettre les paramètres du test final
Contrôle de production
Algorithme de Dichotomie
Chapitre 13 : Echantillonnage
Exercice 6 :   En novembre 76 au Texas qui compte 25 millions d’habitants, l’avocat d’un inculpé a contesté la sélection des jurés : il y avait 79,1%
Algorithme de Dichotomie
Hasard et Probabilités, P. Thompson
Reprise du cours ( ) Au menu du jour :
Organisation des Données et Représentations Graphiques
Utiliser des caractéristiques de position et de dispersion
Le choix optimal.
4.3 Estimation d’une proportion
Approximation de Pi par la méthode de Monte Carlo
Troisième Chapitre 3: Statistiques
4.2 Estimation d’une moyenne
Méthode d’échantillonnage
Introduction aux statistiques Intervalles de confiance
Exercice 12 : On possède les relevés mensuels de la température à Madrid et Mexico. 1°) Quels calculs statistiques permettent de répondre à la question.
Lois de probabilités Intervalle de fluctuation
Exercice 10.
Prénom (Nom) FAMILLE A LAQUELLE APPARTIENT LE PERSONA
Réseaux de neurones appliqués à la reconnaissance de caractères
Pourquoi étudier la statistique ?
POL1803: Analyse des techniques quantitatives
Techniques du Data Mining
LOG770 Annexe A Éléments de probabilité
Chapitre 8 : Fluctuation d’échantillonnage.
Chapitre 3 : Caractéristiques de tendance centrale
Décomposer et encadrer les fractions
Les changements d’état de l’eau
Généralités sur les fonctions
Lois de Probabilité Discrètes
Lois de Probabilité Discrètes
Question flash TSTI2D.
Un bref historique* Automne 1977 – Implantation de la Cote Z (sans IFG) Automne 1996 – Implantation de la CRC (avec IFG) Hiver 2005 – Pondération des échecs.
Chapitre 4: Caractéristiques de dispersion
Programme d’appui à la gestion publique et aux statistiques
2.4 La loi de vitesse d’une réaction chimique
03- Evaluation Access 2003 Cette évaluation comporte des QCM (1 seule réponse) et des Zones à déterminer dans des copies d’écran.
Etude de la pharmacocinétique modélisation
Le code de Huffman: est une méthode de compression statistique de données qui permet de réduire la longueur du codage d'un alphabet. Le code de Huffman.
Analyse des pratiques spatiales dans le secteur rural
Présentation 4 : Sondage stratifié
Présentation 9 : Calcul de précision des estimateurs complexes
Résumé Dans un mélange ….
Caractéristiques des ondes
chapitre 3 Les Statistiques
Jean-Sébastien Provençal
Exercice 6 :   En novembre 76 au Texas qui compte 25 millions d’habitants, l’avocat d’un inculpé a contesté la sélection des jurés : il y avait 79,1%
Présentation 6 : Sondage à plusieurs degrés
5. les rendements d’echelle:
Exercice 1 : On admet qu’il naît automatiquement 49% de filles parmi les naissances annuelles en France. Le directeur d’une maternité qui a 200.
Exercice 3 : On prend deux groupes A et B de 105 et 95 malades, et on leur administre respectivement des médicaments C et D. Dans le groupe A, 76 personnes.
μ = N 3) Moyenne d’une série discrète : ∑ ni xi que l’on peut noter
Automatismes 1ere Technologique
  Exercice 4 : Vous êtes employé au contrôle qualité d’un fabricant de 10 millions de CD. En temps habituel on a 20% de CD impropres à la vente. Aujourd’hui.
Transcription de la présentation:

4°) Intervalle de fluctuation : Notre étude a montré que lorsque la taille augmente, la fluctuation diminue. taille 20 fréquence 65,0 % taille 500 fréquence 53,2 % taille 16000 fréquence 49,8 %

4°) Intervalle de fluctuation : Notre étude a montré que lorsque la taille augmente, la fluctuation diminue. Il semble que la valeur centrale soit de ≈ 50% d’après le 3ème diagramme. taille 20 fréquence 65,0 % variation 15% taille 500 fréquence 53,2 % variation 3,2% taille 16000 fréquence 49,8 % variation 0,2%

Pourrait-on avoir des exemples où obtenir f = 0 ou 1 Pourrait-on avoir des exemples où obtenir f = 0 ou 1 ? Combien d’exemples ? pour n = 1 ?

Pourrait-on avoir des exemples où obtenir f = 0 ou 1 Pourrait-on avoir des exemples où obtenir f = 0 ou 1 ? Combien d’exemples ? pour n = 1 ? On les a déjà obtenus

Pourrait-on avoir des exemples où obtenir f = 0 ou 1 Pourrait-on avoir des exemples où obtenir f = 0 ou 1 ? Combien d’exemples ? pour n = 1 ? On les a déjà obtenus ( tous les exemples ).

Pourrait-on avoir des exemples où obtenir f = 0 ou 1 Pourrait-on avoir des exemples où obtenir f = 0 ou 1 ? Combien d’exemples ? pour n = 1 ? On les a déjà obtenus ( tous les exemples ). pour n = 2 ?

Pourrait-on avoir des exemples où obtenir f = 0 ou 1 Pourrait-on avoir des exemples où obtenir f = 0 ou 1 ? Combien d’exemples ? pour n = 1 ? On les a déjà obtenus ( tous les exemples ). pour n = 2 ? On en déjà obtenu

Pourrait-on avoir des exemples où obtenir f = 0 ou 1 Pourrait-on avoir des exemples où obtenir f = 0 ou 1 ? Combien d’exemples ? pour n = 1 ? On les a déjà obtenus ( tous les exemples ). pour n = 2 ? On en déjà obtenu ( quelques exemples ).

Pourrait-on avoir des exemples où obtenir f = 0 ou 1 Pourrait-on avoir des exemples où obtenir f = 0 ou 1 ? Combien d’exemples ? pour n = 1 ? On les a déjà obtenus ( tous les exemples ). pour n = 2 ? On en a déjà obtenu ( quelques exemples ). pour n = 10 ? On n’en a pas obtenu ( aucun exemple,

Pourrait-on avoir des exemples où obtenir f = 0 ou 1 Pourrait-on avoir des exemples où obtenir f = 0 ou 1 ? Combien d’exemples ? pour n = 1 ? On les a déjà obtenus ( tous les exemples ). pour n = 2 ? On en déjà obtenu ( quelques exemples ). pour n = 10 ? On n’en a pas obtenu ( aucun exemple, mais on pourrait en obtenir quelques rares exemples ). Conclusion : le nombre d’exemples où f = 0 ou 1 …

Pourrait-on avoir des exemples où obtenir f = 0 ou 1 Pourrait-on avoir des exemples où obtenir f = 0 ou 1 ? Combien d’exemples ? pour n = 1 ? On les a déjà obtenus ( tous les exemples ). pour n = 2 ? On en déjà obtenu ( quelques exemples ). pour n = 10 ? On n’en a pas obtenu ( aucun exemple, mais on pourrait en obtenir quelques rares exemples ). Conclusion : le nombre d’exemples où f = 0 ou 1 diminue avec l’augmentation de la taille.

Conclusion : le nombre d’exemples où f = 0 ou 1 diminue avec l’augmentation de la taille. Pour une taille importante, ces exemples où f = 0 ou 1 sont des exemples …

Conclusion : le nombre d’exemples où f = 0 ou 1 diminue avec l’augmentation de la taille. Pour une taille importante, ces exemples où f = 0 ou 1 sont des exemples peu probables. On va donc ranger les échantillons en deux catégories :

Conclusion : le nombre d’exemples où f = 0 ou 1 diminue avec l’augmentation de la taille. Pour une taille importante, ces exemples où f = 0 ou 1 sont des exemples peu probables. On va donc ranger les échantillons en deux catégories : les échantillons probables, et les échantillons peu probables. Ces derniers peuvent être séparés dans deux sous-catégories : les peu probables …

Conclusion : le nombre d’exemples où f = 0 ou 1 diminue avec l’augmentation de la taille. Pour une taille importante, ces exemples où f = 0 ou 1 sont des exemples peu probables. On va donc ranger les échantillons en deux catégories : les échantillons probables, et les échantillons peu probables. Ces derniers peuvent être séparés dans deux sous-catégories : les peu probables trop bons ( fréquences proches de 1 ), et les peu probables trop mauvais ( fréquences proches de 0 ).

Exemples de fréquences possibles selon la taille : f 1 n 0 1 2 4 6 8 10

Exemples de fréquences possibles selon la taille : quelle est la taille minimale ? f 1 n 0 1 2 4 6 8 10

Exemples de fréquences possibles selon la taille : f 1 n 0 1 2 4 6 8 10

Exemples de fréquences possibles selon la taille : f 1 n 0 1 2 4 6 8 10

Exemples de fréquences possibles selon la taille : f 1 n 0 1 2 4 6 8 10

Exemples de fréquences possibles selon la taille : f 1 n 0 1 2 4 6 8 10

Exemples de fréquences possibles selon la taille : f 1 n 0 1 2 4 6 8 10

Exemples de fréquences possibles selon la taille : f 1 n 0 1 2 4 6 8 10

Exemples de fréquences possibles selon la taille : f 1 n 0 1 2 4 6 8 10

Exemples de fréquences possibles selon la taille : f 1 n 0 1 2 4 6 8 10

Exemples de fréquences possibles selon la taille : f 1 n 0 1 2 4 6 8 10

Quels exemples peuvent être considérés comme peu probables ? : f 1 n 0 1 2 4 6 8 10

Quels exemples peuvent être considérés comme peu probables ? : f 1 n 0 1 2 4 6 8 10

On peut séparer les exemples par une frontière : f 1 n 0 1 2 4 6 8 10

On peut séparer les exemples par une frontière : f 1 n 0 1 10 100 1000

On peut séparer les exemples par une frontière qui sépare les zones en échantillons … : f 1 n 0 1 10 100 1000

On peut séparer les exemples par une frontière : f 1 peu probables et trop bons probables peu probables et trop mauvais n 0 1 10 100 1000

Vers quelle valeur tend la fréquence ? f 1 peu probables et trop bons probables peu probables et trop mauvais n 0 1 10 100 1000

La fréquence tend vers la probabilité : f 1 peu probables et trop bons probables p peu probables et trop mauvais n 0 1 10 100 1000

Pour notre exemple de familles à 2 enfants : si on augmente la taille des échantillons, la fréquence semble tendre vers … n 1 2 10 20 40 100 1000 10000 … f ≈ 0,4 0,2 0,18 0,26 0,23 0,24 … ?

Pour notre exemple de familles à 2 enfants : si on augmente la taille des échantillons, la fréquence semble tendre vers … n 1 2 10 20 40 100 1000 10000 + ∞ f ≈ 0,4 0,2 0,18 0,26 0,23 0,24 1/4

Comment déterminer la probabilité ? f 1 peu probables et trop bons probables p peu probables et trop mauvais n 0 1 10 100 1000

Comment déterminer la probabilité Comment déterminer la probabilité ? En faisant un échantillon de taille infinie, ou ... f 1 peu probables et trop bons probables p peu probables et trop mauvais n 0 1 1000 100000 1000000000

Comment déterminer la probabilité Comment déterminer la probabilité ? En faisant un échantillon de taille infinie, ou en utilisant la science des probabilités ( voir chapitre des Probabilités ). f 1 peu probables et trop bons probables p peu probables et trop mauvais n 0 1 1000 100000 1000000000

Quel critère de choix d’un échantillon va-t-on prendre pour le garder ou l’éliminer ? f 1 peu probables et trop bons probables p peu probables et trop mauvais n 0 1 10 100 1000

Critère de choix d’un échantillon : Fait-il partie des probables ? f 1 peu probables et trop bons probables p peu probables et trop mauvais n 0 1 10 100 1000

La frontière entre les échantillons probables et peu probables sera le seuil de confiance à 95 % f 1 peu probables et trop bons probables p peu probables et trop mauvais n 0 1 10 100 1000

La frontière entre les échantillons probables et peu probables sera le seuil de confiance à 95 % Il signifie que 95% des échantillons sont probables, et 5% peu probables ( à partir de n = 20 et p entre 0,2 et 0,8, sinon par absence de critères on adopte quand même celui-là ). f 1 0,8 2,5% peu probables et trop bons p 95% probables 0,2 2,5% peu probables et trop mauvais 0 20 n

Exemple : échantillon de taille n = 50 et de fréquence f = 0,4 f 1 Si la fréquence d’un échantillon est entre les frontières, l’échantillon sera considéré fiable, car représentatif d’un phénomène aléatoire de probabilité p. Exemple : échantillon de taille n = 50 et de fréquence f = 0,4 f 1 2,5% peu probables et trop bons p 95% probables 2,5% peu probables et trop mauvais 0 n

Exemple : échantillon de taille n = 50 et de fréquence f = 0,4 f 1 Si la fréquence d’un échantillon est entre les frontières, l’échantillon sera considéré fiable, car représentatif d’un phénomène aléatoire de probabilité p. Exemple : échantillon de taille n = 50 et de fréquence f = 0,4 f 1 2,5% peu probables et trop bons p 0,4 95% probables 2,5% peu probables et trop mauvais 0 50 n

Exemple : échantillon de taille n = 50 et de fréquence f = 0,4 Si la fréquence d’un échantillon est entre les frontières, l’échantillon sera considéré fiable, car représentatif d’un phénomène aléatoire de probabilité p. Exemple : échantillon de taille n = 50 et de fréquence f = 0,4 l’échantillon est donc accepté. f 1 2,5% peu probables et trop bons p 0,4 95% probables 2,5% peu probables et trop mauvais 0 50 n

Valeurs numériques des frontières du seuil de confiance à 95 % : 1 2,5% peu probables et trop bons p 95% probables 2,5% peu probables et trop mauvais 0 n

Valeurs numériques des frontières du seuil de confiance à 95 % : La fluctuation diminue avec la taille : f 1 2,5% peu probables et trop bons p 95% probables 2,5% peu probables et trop mauvais 0 n

Valeurs numériques des frontières du seuil de confiance à 95 % : La fluctuation diminue avec la taille : Les fréquences ont pour valeur centrale la probabilité p. f 1 2,5% peu probables et trop bons p 95% probables 2,5% peu probables et trop mauvais 0 n

Pour la frontière supérieure, on peut adopter une fonction du type : fonction affine décroissante ? f 1 2,5% peu probables et trop bons p 95% probables 2,5% peu probables et trop mauvais 0 n

Pour la frontière supérieure, on peut adopter une fonction du type : fonction affine décroissante ? Non car à partir d’un certain n elle passera sous la valeur de p. f 1 2,5% peu probables et trop bons p 95% probables 2,5% peu probables et trop mauvais 0 n

Pour la frontière supérieure, on adopte une fonction du type : 1 fluctuation lorsque n on a bien ∆f f n 2,5% peu probables et trop bons p 95% probables 2,5% peu probables et trop mauvais 0 n

On a donc : pour la frontière supérieure f = p + 1/√n fonction 1/√n f 1 2,5% peu probables et trop bons p 95% probables 2,5% peu probables et trop mauvais 0 n

On a donc : pour la frontière supérieure f = p + 1/√n pour la frontière inférieure f = p - 1/√n fonction 1/√n f 1 2,5% peu probables et trop bons p 95% probables 2,5% peu probables et trop mauvais 0 n

Selon le critère de confiance au seuil de 95% l’échantillon est fiable si sa fréquence 1 1 f est dans [ p - ; p + ]. √n √n f 1 2,5% peu probables et trop bons p 95% probables 2,5% peu probables et trop mauvais 0 n

Selon le critère de confiance au seuil de 95% l’échantillon est fiable si sa fréquence 1 1 f est dans [ p - ; p + ]. √n √n Il n’y a que 3 caractéristiques qui sont liées par le phénomène de fluctuation d’échantillonnage : proportion p dans le grand ensemble proportion f dans l’échantillon taille n de l’échantillon

On aura 3 types d’exercices : On connait f et p et on veut savoir si l’échantillon est acceptable. p f On connait p et on veut connaître f. p On connait f et on veut connaître p. f

On aura 3 types d’exercices : On connait f et p et on veut savoir si l’échantillon est acceptable. p f ( f est-elle dans l’intervalle de confiance ? ) On connait p et on veut connaître f. ( en utilisant l’intervalle de confiance ) p On connait f et on veut connaître p. ( en utilisant le 2ème critère voir exo 2 ) f

Exemple : 30% des habitants d’une ville portent un chapeau. Un article dans un journal montre une photographie prise au hasard où 23 des 54 personnes portent un chapeau. La mairie a-t-elle raison de se plaindre de la photographie, qu’elle estime non représentative de sa population ?

Un collégien répondrait : 23 f = ≈ 0,4259… ≠ p = 0,3 54 f ≠ p donc l’échantillon n’est pas représentatif.

Un collégien répondrait : 23 f = ≈ 0,4259… ≠ p = 0,3 54 f ≠ p donc l’échantillon n’est pas représentatif. Mais il a tort car il suppose …

Un collégien répondrait : 23 f = ≈ 0,4259… ≠ p = 0,3 54 f ≠ p donc l’échantillon n’est pas représentatif. Mais il a tort car il suppose qu’il y a un phénomène de proportionnalité, ce qui est faux car les proportions de chapeaux dans la ville ne sont pas constantes.

Mais un lycéen connaît le phénomène de la fluctuation d’échantillonnage : Il sait que les 30 % ne sont pas ….

Mais un lycéen connaît le phénomène de la fluctuation d’échantillonnage : Il sait que les 30 % ne sont pas équitablement répartis dans la ville, donc que toutes les photographies n’auront pas la même proportion : ville mélange … photo : 30%

Mais un lycéen connaît le phénomène de la fluctuation d’échantillonnage : Il sait que les 30 % ne sont pas équitablement répartis dans la ville, donc que toutes les photographies n’auront pas la même proportion : ville mélange homogène photo : 30%

Mais un lycéen connaît le phénomène de la fluctuation d’échantillonnage : Il sait que les 30 % ne sont pas équitablement répartis dans la ville, donc que toutes les photographies n’auront pas la même proportion : ville mélange homogène photo : 30%

Mais un lycéen connaît le phénomène de la fluctuation d’échantillonnage : Il sait que les 30 % ne sont pas équitablement répartis dans la ville, donc que toutes les photographies n’auront pas la même proportion : ville mélange homogène photo : 30%

Mais un lycéen connaît le phénomène de la fluctuation d’échantillonnage : Il sait que les 30 % ne sont pas équitablement répartis dans la ville, donc que toutes les photographies n’auront pas la même proportion : ville mélange hétérogène photo : 50%

Mais un lycéen connaît le phénomène de la fluctuation d’échantillonnage : Il sait que les 30 % ne sont pas équitablement répartis dans la ville, donc que toutes les photographies n’auront pas la même proportion : ville mélange hétérogène photo : 15%

Mais un lycéen connaît le phénomène de la fluctuation d’échantillonnage : Il sait que les 30 % ne sont pas équitablement répartis dans la ville, donc que toutes les photographies n’auront pas la même proportion : ville mélange hétérogène photo : 30%

Selon le critère de confiance au seuil de 95%, f = 23/54 ≈ 0,4259… Les échantillons fiables sont ceux dont la fréquence est dans l’intervalle de confiance suivant : 1 1 1 1 p – ; p + = 0,3 – ; 0,3 + ≈ [ 0,1639 ; 0,4361 ] n n 54 54 0,1639 < 0,4259 < 0,4361 f est dans l’intervalle de confiance, donc l’échantillon est représentatif du phénomène aléatoire, donc la mairie ne peut se plaindre du journal.

qui correspond à : f 1 2,5% peu probables et trop bons ≈ 0,44 0,42 p = 0,3 95% probables ≈ 0,16 2,5% peu probables et trop mauvais 0 54 n