Variabilité et hasard, réflexions pour le citoyen et le professionnel

Slides:



Advertisements
Présentations similaires
L’introduction de la notion de probabilités en collège et en seconde
Advertisements

Introduction aux statistiques Intervalles de confiance
L’échantillonnage & Ses Fluctuations
Algorithmique et simulation
Probabilités et statistiques au lycée
Le programme de troisième (2008) partie probabilités extrait d’une présentation de Michel HENRY, président de l’IREM de Besançon.
Source : Fluctuation d’échantillonnage en pratique dans les programmes de mathématiques de la voie professionnelle Source.
STATISTIQUE INFERENTIELLE L ’ESTIMATION
Notion de probabilité.
Organisation et gestion de données, fonctions
LES STATISTIQUES- PROBABILITES EN CLASSE DE SECONDE
TESTS RELATIFS AUX CARACTERES QUANTITATIFS
Collecte de données F. Kohler.
Inférence statistique
Nombre de sujets nécessaires en recherche clinique
PROBABILITÉS en 3ème  .
Échantillonnage-Estimation
Autour d’une expérience aléatoire simple:
Les tests d’hypothèses
Remy JOST IG mathématiques
Mathématiques classe de seconde professionnelle
STATISTIQUE INFERENTIELLE
PROBABILITÉS en 3ème  .
Probabilités au collège
Statistiques et probabilités en première
Statistique descriptive
Expérimenter pour faire des mathématiques vivantes et formatrices tout en préparant les élèves aux épreuves du bac Pro.
variable aléatoire Discrète
Statistiques et probabilité :
AUTOUR DE LA LOI NORMALE
Enseigner les Probabilités en Bac Pro 3 ans
Fluctuations d’une fréquence selon les échantillons, Probabilités
2. Expériences aléatoires et modélisation
1 LE BAROMÈTRE DE LA CITOYENNETÉ - CIDEM Principaux résultats - Vague 5 - Avril
Statistiques et Probabilités au lycée
Interacadémiques lycées professionnels PARIS – 2 avril 2009
Probabilités et statistiques
Atelier Probabilités et statistiques
« 90% de nos trains arrivent à lheure! ». énoncé exercice : « Le retard sur un trajet train de 6h15 Marseille-Paris est en moyenne: 10mn avec écart type.
Fluctuation d’échantillonnage
1 - Construction d'un abaque Exemple
Objectif général Les compétences à développer : mettre en œuvre une recherche de façon autonome ; mener des raisonnements ; avoir une attitude critique.
Nombre de sujets nécessaires en recherche clinique
Mathématiques Les statistiques et probabilités en STI2d/STL
Des situations familières concernant les instruments produisant du hasard Présentation.
Introduction aux probabilités
Comprendre la variation dans les données: Notions de base
STATISTIQUES – PROBABILITÉS
Baccalauréat professionnel trois ans
Université dOttawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :47 1 Concepts fondamentaux: statistiques et distributions.
Théorie… Inférence statistique: étude du comportement d’une population ou d’un caractère X des membres d’une population à partir d’un échantillon aléatoire.
Échantillonnage (STT-2000) Section 2 Tirage aléatoire simple (plan SI). Version: 22 août 2003.
ÉCHANTILLONNAGE AU FIL DES PROGRAMMES Stage : nouveaux programmes de première Novembre 2011.
Échantillonnage (STT-2000) Section 2 Tirage de Bernoulli (plan BE). Version: 4 septembre 2003.
1 - Programme de Seconde (juin 2009) Statistique et probabilités
On cherche des renseignements sur p.
Valoriser les ressources externes pour développer des compétences transversales Excel pour la réalisation des graphiques Activité CDS 38 Liège.
ESTIMATION 1. Principe 2. Estimateur 3. Distribution d’échantillonnage
TD4 : « Lois usuelles de statistiques »
STATISTIQUES – PROBABILITÉS
Intervalles de confiance pour des proportions L’inférence statistique
Atelier Probabilités et statistiques
Thème: statistiques et probabilités Séquence 6: Probabilités (Partie 1) Capacités : Déterminer la probabilité d’événements dans des situations d’équiprobabilité.
Intervalles de fluctuation et de confiance. Dans une population, la proportion d’individus ayant un caractère donné est notée p Population.
La Maîtrise Statistique des Procédés
ECHANTILLONAGE ET ESTIMATION
Famille A La famille A a cinq enfants – Patricia – Mary – Susan – Helen – Kathleen – Quelle est la probabilité que le prochain enfant soit un garçon ?
Scénario Quatre hipsters entrent en collision un dans l'autre dans un ascenseur plein de personnes. En conséquence ils laissent tomber leurs téléphones.
Introduction aux statistiques Intervalles de confiance
Transcription de la présentation:

Variabilité et hasard, réflexions pour le citoyen et le professionnel Philippe Dutarte Groupe d’experts des programmes de mathématiques pour le baccalauréat professionnel

Émile Borel (1871- 1956) Vers 1910 : « Si la notion de vérité statistique devenait familière à tous ceux qui parlent ou écrivent au sujet de questions où la vérité statistique est la seule vérité, bien des sophismes et bien des paradoxes seraient évités. »

Dans le projet de programme… « La notion de fluctuation d'échantillonnage, essentielle en statistique, est abordée en étudiant la variabilité d’observation d’une fréquence. Elle favorise une expérimentation de l’aléatoire. L’objectif est de faire comprendre que le « hasard » suit des lois et de préciser l’approche par les fréquences de la notion de chance ou probabilité initiée en classe de troisième. »

Des questions… Des naissances… Est-ce le fruit du hasard ? En 2000 à Xicun (Chine) 4 filles 16 garçons En 2001 à Louvres (Val d’Oise) 70 filles 82 garçons Entre 1999 et 2003 à Aamjiwnaag (Canada) 86 filles 46 garçons

Des questions… Risque ? Le magazine Le Point du 13/09/2002 écrit : « Une crue de la Seine comparable à celle de 1910 se produit en moyenne tous les cent ans et la probabilité d’une telle catastrophe augmente d’année en année ». Que faut-il en penser ?

Des questions… Une petite ville des États-Unis a connu 9 cas de leucémies chez de jeunes garçons en l’espace de 10 années. Doit-on en « accuser le hasard » ?

Des questions… Dans une usine automobile, on contrôle les défauts de peinture de type « grains ponctuels sur le capot ». Lorsque le processus est sous contrôle, on a 20 % de ce type de défauts. Lors du contrôle aléatoire de 50 véhicules, on observe 26 % de défauts. Faut-il s’inquiéter ?

Des questions… Comment aux États-Unis, la statistique a-t-elle permis de mettre en évidence une discrimination conduisant à casser un jugement ?

Des questions… Le dernier sondage de 2002 ne prévoyait pas la présence de Jean-Marie Le Pen au second tour. Peut-on croire un sondage ?

Des questions… Comment la loi des grands nombres permet-elle d’estimer une probabilité ?

– Partie 1 – Fluctuations à taille d’échantillon fixée : étude de la « variabilité naturelle »

L’urne de Bernoulli Parmi les expériences aléatoires « réelles » que l’on peut mener dès la 3ème, celles de l’échantillonnage dans une urne de Bernoulli ont le privilège de pouvoir correspondre à de nombreuses situations de la vie courante.

Expérimentation physique L’expérimentation physique « valide » les simulations virtuelles mais surtout laissent des « images mentales » essentielles. Dans le projet de programme… « Expérimenter, d’abord à l’aide de pièces, de dés ou d’urnes, [...] la prise d’échantillons aléatoires de taille n fixée, extraits d’une population où la fréquence p relative à un caractère est connue. »

Expérimentation physique : jouer à pile ou face

Expérimentation physique : prise d’échantillons avec la boîte à billes

Une autre version : la bouteille à perles

Dans le projet de programme… « Expérimenter, d’abord à l’aide de pièces, de dés ou d’urnes, puis à l’aide d’une simulation informatique prête à l’emploi, la prise d’échantillons aléatoires de taille n fixée, extraits d’une population où la fréquence p relative à un caractère est connue. »

Simulation avec les TICE 1 rand (générateur de nombres aléatoires entre 0 et 1) rand + 0.3 int(rand + 0.3) donne 0 ou 1 dans des proportions 70 % et 30 %.

Avec une calculatrice : tirage aléatoire d’une boule dans une urne comportant 30 % de «1» et 70 % de « 0 »

Avec un tableur : on entre la formule en cellule A1 puis on recopie vers le bas (pointeur en forme de croix noire), la touche F9 recalcule tout.

Des naissances à pile ou face Xicun 4 filles 16 garçons Louvres 70 filles 82 garçons Aamjiwnaag 86 filles 46 garçons

Dans un premier temps : brainstorming des élèves Xicun Louvres Aamjiwnaag Nombre de naissances 22 152 132 Pourcentage de garçons 80% 53,9% 34,8%

Du jeu de pile ou face à la simulation Énoncé élève  1. Lancer 20 fois une pièce de monnaie et noter le nombre de « pile ». 2. Recommencer l’expérience une dizaine de fois ou regrouper les résultats obtenus dans la classe. 3. Comment peut-on utiliser ces expériences pour commenter les statistiques de Xicun ? 4. Pourquoi l’expérimentation avec des pièces ne permet-elle pas de répondre complètement au problème posé ? naissances pile ou face.xls

Quelles « réponses » ? Ce ne sont que des réponses « statistiques ». Les résultats observés sur les naissances à Xicun et Aamjiwnaag sont « bizarres » (et préoccupants). On a établi une « preuve statistique », rationnelle, qu’il se passe sans doute quelque chose d’inhabituel. Pour le cas de Xicun, la cause probable est l’acquisition dans ce village (en 1999) d’une machine à ultras-sons bon marché permettant aux médecins de déterminer le sexe du fœtus. (Source : Washington Post du 29 mai 2001.) Dans le cas d’Aamjiwnaag, une enquête sanitaire est menée. On connaît en effet, depuis Seveso, le rôle de certains polluants sur les déséquilibres du sex-ratio. (Sources : Science et Vie fév 2006 – Environmenthal Health Perspectives oct 2005.)

Crues centennales Le magazine Le Point du 13/09/2002 écrit : « Une crue de la Seine comparable à celle de 1910 se produit en moyenne tous les cent ans et la probabilité d’une telle catastrophe augmente d’année en année ». Que faut-il en penser ?

Crues centenales.xls « Informer les citoyens sur les risques d’inondation par des messages clairs et compréhensibles est un enjeu social et économique fort mais complexe. »

Leucémies à Woburn Une petite ville des États-Unis a connu 9 cas de leucémies chez de jeunes garçons en l’espace de 10 années. Doit-on en accuser le hasard ?

Effectifs garcons Woburn.xls Enfants entre 0 et 14 ans Population de Woburn selon le recencement de 1970 n Nombre de cas de leucémie infantile observés à Woburn entre 1969 et 1979 Fréquence des leucémies à Woburn f Fréquence des leucémies aux États-Unis p Garçons 5969 9 0,151% 0,052% Effectifs garcons Woburn.xls

Un peu de « théorie » n tirages avec remise. X nombre de boules rouges

X suit la loi binomiale de moyenne E(X) = np et d’écart type correspondant à la fréquence des boules rouges a pour moyenne et pour écart type

Pour n « assez grand » la loi binomiale est proche d’une loi normale et F suit approximativement la loi normale de moyenne p et d’écart type Pour une loi normale, environ 95 % des observations se font dans un intervalle de rayon 2 écarts types autour de la moyenne.

Intervalle de fluctuation de 95 % des observations : [ p – 2 ; p + 2 ] On peut majorer cet intervalle : d’où Intervalle de fluctuation de plus de 95 % des observations : [ p – ; p + ]

Dans le projet de programme… « Déterminer l’étendue des fréquences de la série d’échantillons de taille n obtenus par expérience ou simulation. Rechercher graphiquement un intervalle centré sur p contenant la « grande majorité » des fréquences relative à un caractère, sur des échantillons de taille n. Calculer le pourcentage des échantillons de taille n simulés, pour lesquels la fréquence relative au caractère étudié appartient à l’intervalle . »

Dans le projet de programme… En commentaire : « Les situations étudiées correspondent aux cas où les nombres n et p vérifient n ≥ 30, np ≥ 5 et n(1– p) ≥ 5. La connaissance de ces conditions n’est pas exigible. La formule de l’intervalle est donnée.  La connaissance de cette « variabilité naturelle » (environ 95 % des échantillons fournissent une fréquence dans l’intervalle ) permet d’exercer un regard critique sur les données statistiques. »

Contrôle en cours de fabrication Dans une usine automobile, on contrôle les défauts de peinture de type « grains ponctuels sur le capot ». Lorsque le processus est sous contrôle, on a 20 % de ce type de défauts. Lors du contrôle aléatoire de 50 véhicules, on observe 26 % de défauts. Faut-il s’inquiéter ?

carte de controle.xls

Jurys et discrimination Comment aux États-Unis, la statistique a-t-elle permis de mettre en évidence une discrimination conduisant à casser un jugement ?

Énoncé distribué aux élèves L’affaire Castaneda contre Partida. En Novembre 1976 dans un comté du sud du Texas, Rodrigo Partida était condamné à huit ans de prison. Il attaqua ce jugement au motif que la désignation des jurés de ce comté était discriminante à l’égard des Américains d’origine mexicaine. Alors que 79,1% de la population du comté était d’origine mexicaine, sur les 870 personnes convoqués pour être jurés lors des 11 années précédentes, il n’y eût que 339 personnes d’origine mexicaine.

Produisez votre expertise statistique. Devant la Cour Suprême, un expert statisticien produisit des arguments pour convaincre du bien fondé de la requête de l’accusé. En vous situant dans le rôle de cet expert, produisez à votre tour des calculs, des raisonnements, des graphiques... pour montrer que le hasard ne peut pas « raisonnablement » expliquer à lui seul la sous-représentation des américains d’origine mexicaine dans les jurys de ce comté. · Vous commencez ce travail en binômes en utilisant les documents disponibles, la calculatrice, le tableur. · Vous terminez la rédaction (arguments en français, calculs, graphiques...) en devoir individuel, à la maison.

Population du comté Jurys Autres Mexicains 21% 39% Autres 61% 79% Autres 21% Jurys Mexicains 39% Autres 61%

Simulation Plus de 95 % des simulations fournissent une fréquence de personnes d’origine mexicaine comprise dans l’intervalle [76 % , 82 %]. Castaneda.xls

– Partie 2 – Estimation d’une fréquence

Situation du problème p = ? échantillon f connu

Peut-on croire un sondage ? Le dernier sondage de 2002 ne prévoyait pas la présence de Jean-Marie Le Pen au second tour. Peut-on croire un sondage ?

Résultats du premier tour 21/04/02 Dernier sondage B.V.A. , effectué sur 1000 électeurs le vendredi 19/04/02 Jacques Chirac 19 % Lionel Jospin 18 % Jean-Marie Le Pen 14 % Résultats du premier tour 21/04/02 Jacques Chirac 19,88 % Lionel Jospin 16,18 % Jean-Marie Le Pen 16,86 %

Échantillonnage le jour de l’élection

Fourchettes de sondage p

Simulation Election 2002.xls

– Partie 3 – Augmentation de la taille de l’échantillon : approche d’une probabilité inconnue Comment la loi des grands nombres permet-elle d’estimer une probabilité ?

Dans le projet de programme… « Stabilisation relative des fréquences quand la taille n augmente. Notion de probabilité. Cette propriété, de stabilisation vers la probabilité, est mise en évidence graphiquement à l’aide d’un outil de simulation. »

Le segment aléatoire Segment aleatoire.xls

7 piles consécutifs On lance 7 fois une pièce de monnaie équilibrée, quelle est la probabilité d’avoir 7 fois pile ? Application au contrôle de qualité : Si l’on constate une série de sept points consécutifs du même côté de la moyenne, surveiller le processus. 7 piles consecutifs.xls

Merci de votre attention !        Merci de votre attention !