Atelier 1 Le problème du surpoids sur géogébra. Etude de la prévalence du surpoids: (document Ressources pour la classe de terminale) Situation: On souhaite.

Slides:



Advertisements
Présentations similaires
AUTOUR DE LA LOI NORMALE
Advertisements

Introduction aux statistiques Intervalles de confiance
L’ESPRIT DU NOUVEAU PROGRAMME. SERIE SCIENCES ET TECHNOLOGIES DU MANAGEMENT ET DE LA GESTION 1 Document élaboré dans le cadre du cercle de réflexion académique.
Auteur : Patrice LEPISSIER Les probabilités  Notions de base Notions de base  Variable aléatoire Variable aléatoire  La loi Normale La loi Normale.
Un problème :. Pour embaucher un graphologue, le chef du personnel d'une grosse entreprise envisage un test. Il propose 12 paires d'écritures constituées.
Généralisation de la comparaison de moyennes par Analyse de la variance (ANOVA)
Chapitre 6. Introduction à l’échantillonnage Les sondages Notions fondamentales Fluctuations d’échantillonnage d’une moyenne Théorème central limite C6-1.
Chapitre 5 Interprétation des données d’enquête
Notions de statistiques et d’analyse de données
Calcul de probabilités
Thème 8 : Stratégie d’échantillonage
Suites ordonnées ou mettre de l’ordre
Epidémiologie.
Corrélation et régression linéaire simple
Statistiques descriptives univariées
Interprétation des indicateurs?
Loi Normale (Laplace-Gauss)
Portfolio thématique Profil démographique et socioéconomique de la population et des familles d’Ormstown Marie-Eve Simoneau Mai 2017.
4°) Intervalle de fluctuation :
1 - Construction d'un abaque Exemple
Contrôle de production
Chapitre 13 : Echantillonnage
Portfolio thématique Profil démographique et socioéconomique de la population et des familles de Sainte-Christine Marie-Eve Simoneau Juin 2017.
De la loi binomiale à la loi normale
Échantillonnage non-aléatoire
Les lois des probabilités
Introduction aux Statistiques Variables aléatoires
Technologies de l’intelligence d’affaires Séance 12
Scénario Quatre hipsters entrent en collision un dans l'autre dans un ascenseur plein de personnes. En conséquence ils laissent tomber leurs téléphones.
4.3 Estimation d’une proportion
3.4 Lois discrète 2 cours 15.
4.5 Tests D’hypothèses sur une proportion
Approximation de Pi par la méthode de Monte Carlo
Chapitre 8 : Fluctuation d’échantillonnage.
2.2 Probabilité conditionnelle
4.4 Tests D’hypothèses sur une moyenne
3.3 loi discrète 1 cours 14.
3.6 Loi continue 3 cours 18.
4.2 Estimation d’une moyenne
Introduction aux statistiques Intervalles de confiance
Lois de probabilités Intervalle de fluctuation
Statistiques. Moyenne, Moyenne pondérée, Tableur et graphiques.
Calculs des incertitudes Lundi 30 Avril 2018 Master de Management de la Qualité, de la Sécurité et de l’Environnement.
 1____Probabilité  2______variables aléatoires discrètes et continues  3______loi de probabilités d’une v a  4_______les moyens et les moyens centraux.
Fluctuations d’une fréquence selon les échantillons, Probabilités
Calcul de probabilités
4°) Intervalle de fluctuation :
Lois de Probabilité Discrètes
Lois de Probabilité Discrètes
Enquête tabac 2018 Un rapport pour la Fondation contre le Cancer, menée par GfK Belgium Rapport 1.
2.4 La loi de vitesse d’une réaction chimique
Présentation 3 : Sondage aléatoire simple
Présentation 5 : Sondage à probabilités inégales
Présentation 8 : Redressement des estimateurs
On lance 100 fois de suite une pièce de monnaie.
Activités mentales rapides
Présentation 9 : Calcul de précision des estimateurs complexes
L’ANALYSE DES DONNEES Samuel MAYOL S. Mayol - L’analyse des données.
Méthodes de collecte des données : Les enquêtes par sondage
Les erreurs de mesure Projet d’Appui au renforcement des capacités
Présentation 6 : Sondage à plusieurs degrés
Programme d’appui à la gestion publique et aux statistiques
Exercice 1 : On admet qu’il naît automatiquement 49% de filles parmi les naissances annuelles en France. Le directeur d’une maternité qui a 200.
Les méthodes quantitatives en éducation
Statistiques et probabilités
Tests d’hypothèses paramétriques 1 Cours Statistiques Chapitre 9.
Impact Evaluation 4 Peace March 2014, Lisbon, Portugal 1 Echantillonage pour une Evaluation d’Impact Latin America and the Caribbean’s Citizen Security.
STATISTIQUE INFERENTIELLE LES TESTS STATISTIQUES.
Transcription de la présentation:

Atelier 1 Le problème du surpoids sur géogébra

Etude de la prévalence du surpoids: (document Ressources pour la classe de terminale) Situation: On souhaite estimer la prévalence du surpoids dans une ville V, c'est-à-dire la proportion de personnes ayant une masse trop importante par rapport à leur taille. Pour cela 400 personnes ont été sélectionnées de manière aléatoire à partir de la liste des logements connue par la municipalité, c'est-à-dire que le fait d’avoir été sélectionné pour participer à l’étude est uniquement dû au hasard. 22

Partie 1: On donne ci-dessous les résultats du sondage sur les 400 personnes interrogées réparties selon deux critères : le sexe et l’âge. On sait que, dans la population, il y a 46% d’hommes et 18% de personnes de plus de 60 ans. Question 1 : Cet échantillon est-il représentatif ? 33

Comme l’effectif de la population est important par rapport aux 400 personnes sondées, on peut modéliser la réalisation de l’échantillon par un tirage aléatoire avec remise. (condition pour faire intervenir les probabilités) 4 Pour une étude, mettant en jeu le lien avec certaines caractéristiques connues de la population on considère qu’un échantillon est représentatif, si la fréquence f observée de ces caractéristiques est dans l’intervalle de fluctuation au seuil de confiance de 95%. Au travail ! 4

Classe de Seconde : On utilise l’intervalle de fluctuation à condition que p soit compris entre 0,2 et 0,8 et que la taille de l’échantillon soit supérieure à 25 Premier critère : Le sexe. Proportion d’hommes. 0,46  [0,2 ; 0,8] et 400 >25 donc avec 5% d’erreur, la proportion observée doit être comprise entre 0,41 et 0,51. C’est le cas puisque 195/400≈0,4875. Deuxième critère : L’âge. Proportion de plus de 60 ans. 0,18  [0,2 ; 0,8] on ne peut pas utiliser l'intervalle de fluctuation de seconde et conclure. 55

Classe de Première : …Le sondage des 400 personnes peut s’apparenter à une répétition (400 expériences identiques et indépendantes) d’une expérience aléatoire à deux issues. La personne est un homme ou ne l’est pas et la personne a plus de 60 ans ou moins de 60 ans. Si X est la variable aléatoire qui compte le nombre d’individus de l’échantillon qui sont des hommes, alors X suit la loi binomiale B(400;0,46). Si Y est la variable aléatoire qui compte le nombre d’individus de l’échantillon qui ont moins de 60 ans alors Y suit la loi binomiale B(400;0,18). 66

Avec la calculatrice,Géogébra ou excel, on obtient les résultats ci-dessus d’où l’on peut extraire les deux intervalles de fluctuation au seuil de 95% pour les fréquences des valeurs de X et Y sont : Le plus petit entier a tel que P(X≤a)>0,025 et le plus petit entier b tel que P(X≤b)≥0,975 Pour X : IF = [165;204] Pour Y : IF = [58;87] Premier critère : Le sexe. Proportion d’hommes. La proportion observée doit être comprise entre 165/400 et 204/400. C’est le cas puisque elle est de 198/400. Deuxième critère : L’âge. Proportion de plus de 60 ans. La proportion observée doit être comprise entre 57/400 et 87/400. C’est le cas puisque 87/400. Réponse : L’échantillon convient avec ces deux critères. Il est donc représentatif pour ce sondage. 77

Situation problème : Et si la taille de l’échantillon est très grande ……. par exemple 1200, peut-on simplifier les calculs des probabilités ? 88

Partie 2 : On donne ci-dessous les résultats du sondage sur les 1200 personnes interrogées réparties selon deux critères : le sexe et l’âge. On sait que, dans la population, il y a 46% d’hommes et 18% de personnes de plus de 60 ans. Question 1 : Cet échantillon est-il représentatif ? 99

Classe de Terminale : La calculatrice ne permet plus de faire les calculs ! On poursuit le travail de première mais pour éviter des calculs laborieux, on va approcher la loi binomiale par une loi normale. B(n,p) est approchée par N(np,np(1-p)) et l’intervalle de fluctuation au seuil de confiance de 95% donné par la loi normale est majorée par celui de seconde. 10

11 Les calculs des probabilités des valeurs de la variable aléatoire qui suit une grande binomiale sont compliqués. Observons les diagrammes en bâtons des grandes binomiales : Les sommets des bâtons font apparaître la courbe en cloche caractéristique d’une loi normale. 11 B(100;0,3) B(200;0,6) B(60;0,7) Résumons la procédure …

La différence avec les filières ES et S. 12 X n suit B(n;p) On centre et on réduit On obtient Z n Z qui suit N(0 ; 1) converge Y qui suit N (np; npq) n tend vers l’infini 12 approximation Dépend de n Théorème de Moivre-Laplace ES-S ES-S STMG

Premier critère : Le sexe. Proportion d’hommes. X suit la loi binomiale B(1200;0,46) ; 1200>30. Au seuil de 95%, on obtient l’intervalle de fluctuation suivant : On note que 562/1200  [0,43;0,49]. Avec la règle de décision choisie, on peut affirmer que l’échantillon est représentatif pour ce critère.

Deuxième critère : L’âge. Proportion de plus de 60 ans Même raisonnement pour la variable Y qui suit la loi binomiale B(1200;0,18) ; 1200>30. Au seuil de 95%, on obtient l’intervalle de fluctuation : On note que 249/1200=0,2075 est dans cet intervalle Avec la règle de décision choisie, on peut affirmer que l’échantillon est représentatif pour ce critère.

Après les tests, l’estimation : Partie 3: L’étude a montré que l’échantillon des 400 personnes était représentatif pour les deux critères, le sexe et l’âge. On observe que 29% des personnes de l’échantillon sont en surpoids. Question : Estimer la proportion de personnes en surpoids dans la population. 15

Quelle estimation peut-on donner de la proportion d’une population en observant un échantillon ? On a 95% de chances que la proportion observée f appartienne à Si on inverse les rôles, on, peut encore dire qu’en choisissant au hasard un des intervalles centrées en f, on a 95% de chances d’en obtenir un qui contienne p mais en fixant f, on perd l’aléatoire puisque p ne varie pas et on ne peut donc pas donner une mesure de probabilité. Alors on parle de niveau de confiance à 0,95 que l’affirmation soit vraie.

Classe de Seconde et terminale : Avec l’échantillon de 400 personnes : f observée = 29% Réponse : On peut donc estimer, après l’observation de cet échantillon, avec un niveau de confiance de 0,95, que la proportion d’individus en surpoids dans la population est comprise entre 24% et 34%.