Statistiques et Probabilités en Seconde Trois thèmes de réflexion Robert FERACHOGLOU Académie de DIJON Journées interacadémiques de Nancy 1er décembre 2009 « Le loto, c’est un impôt sur les gens qui ne comprennent pas les statistiques. » (Anonyme)
Trois axes de réflexion Questions de modélisation Utiliser des modèles de référence Comment décider ? « Beaucoup de réflexion et non beaucoup de connaissances, voilà à quoi il faut tendre » (Démocrite)
Questions de modélisation 1. De quoi s’agit-il ? 2. La question de l’objectivité 3. Qu’est-ce qu’un modèle satisfaisant ?
I.1. De quoi s’agit-il ? Le modèle Décrire les « issues » finies : x1 , x2 , …, xn (univers ) Leur associer des nombres positifs : p1 , p2 , …, pn avec p1 + p2 + …+ pn = 1 Définir un événement et sa probabilité Quatre questions sur le modèle Est-il mathématiquement juste ? Est-il unique ? L’expérience aléatoire induit-elle un modèle objectif ? Comment un modèle peut-il être satisfaisant ?
I.2. L’objectivité : le paradoxe de Bertrand Description du protocole objectivité
En seconde : les neuf cases Protocole 1 : on choisit au hasard une case jaune parmi les cinq. Protocole 2 : on choisit au hasard une colonne parmi les trois, puis une case jaune dans la colonne choisie. Protocole 3 : on choisit au hasard une ligne parmi les trois, puis une case jaune dans la ligne choisie 1 2 3 4 5
En seconde : le problème des bancs Dans un jardin se trouvent trois bancs publics de deux places chacun. Deux amoureux entrent et s’assoient au hasard. Quelle est la probabilité qu’ils s’assoient côte à côte ? Protocole 1 : on place dans une urne trois boules marquées A, B, C correspondant aux trois bancs. Le premier amoureux choisit une boule au hasard, la remet dans l’urne, et va s’asseoir au hasard sur l’une des deux places du banc indiqué. Le deuxième procède de même. Protocole 2 : on place dans une urne six boules marquées 1, 2, 3, 4, 5, 6, correspondant aux six places. La première personne tire une boule au hasard et va s’asseoir à la place indiquée ; la deuxième personne procède de même avec les cinq boules restantes.
Le carré parfait au hasard Problème On choisit au hasard le carré d’un entier compris entre 1 et 9. Donner la loi de probabilité des différentes issues : 1, 4, 9, 16, 25, 36, 49, 64, 81. Protocole 1 : on place dans une urne neuf boules numérotées de 1 à 9, on tire une boule au hasard et le carré choisi est le carré du numéro tiré. Protocole 2 : on place dans une urne 99 boules numérotées de 1 à 99, on tire une boule au hasard et le carré choisi est le plus grand carré inférieur ou égal au numéro tiré. Protocole 3 : on place dans une urne cinq boules numérotées 1, 4, 5, 6, 9, on tire une boule au hasard, puis on choisit au hasard un carré ayant pour chiffre des unités le numéro tiré.
En seconde : la photo de groupe Problème Le photographe, place quatre amis Anne, Benoît, Corentin et Diane sur quatre chaises pour une photo. Quelle est la probabilité que les deux filles soient placées sur des chaises voisines ? Protocole 1 : on place les quatre chaises en ligne. Protocole 2 : on place les quatre chaises en carré. Protocole 3 : on place les quatre chaises « en rond ».
I.3. Approche fréquentiste et modèle satisfaisant L’approche fréquentiste Observer statistiquement la stabilisation des fréquences Définir la probabilité comme une « fréquence idéale » (ou valeur limite) La loi des grands nombres Bernoulli (1713), Borel (1905), Kolmogorov (1933) n expériences, Cohérence a posteriori : si le modèle est bon, on doit avoir dans « presque » tous les cas.
II. Utiliser des modèles de référence 1. Expériences aléatoires de référence 2. Analyse de quelques problèmes 3. Quelques retours d’une expérimentation en classe
II. 1. Expériences aléatoires de références Modélisations standards avec listes, tableaux, arbres Lancers de 2, 3, … dés (tableau, arbre des issues) Lancers de pièces : 2, 3, …, n Tirages dans une urne avec remise Questions Jusqu’où aller dans l’étude des modèles ? Faut-il envisager des épreuves répétées non identiques ? Faut-il envisager des tirages sans remise ? Doit-on présenter des arbres de probabilité ?
II. 2. Analyse de quelques problèmes
MONTCEAU LES MINES (ZEP) II. 3. Quelques retours d’une expérimentation en classe Classe de 2nde de 31 élèves dont 20 en difficulté – Lycée Henri Parriat – MONTCEAU LES MINES (ZEP) Le recours aux modèles est laborieux au début, réussi et apprécié à la fin de l’étude Les problèmes se ramenant à des lancers de pièces sont bien réussis Problèmes du joueur de fléchettes, de la galette des rois, des pains aux raisins : réussis par 25 élèves sur 31 Problème des huîtres : l’idée est trouvée, certains élèves se lassent par la longueur de la recherche Le retour aux modèles a été vécu comme « rassurant » par l’ensemble des élèves
III. Comment décider ? 1. Enjeu et difficultés 2. Quelques propositions 3. Quelques situations
III 1. Enjeux et difficultés Objectif : initier les élèves à la notion de preuve statistique : prise de décision à partir d’un échantillon Le programme : observer que pour n 25 et 0,2 p 0,8, la fréquence observée sur des échantillons statistiques de taille n est située dans l’intervalle pour 95% de ces échantillons. Réfuter (au seuil de 95%) le caractère aléatoire d’un échantillon donné si la fréquence observée n’est pas située dans cet intervalle Les mathématiques sous-jacentes : la théorie des tests Elaboration du test (relatif à une fréquence) : définition d’une hypothèse nulle H0 (hasard), repérage d’une loi de probabilité, détermination d’un intervalle critique K avec un seuil donné, règle de décision énoncée. Application : si la fréquence observée sur un échantillon donné appartient à K, on accepte H0 (l’échantillon est bien aléatoire).
III 1. Enjeux et difficultés Remarques La notion de seuil ne sera bien comprise que si l’on en change La notion d’intervalle de fluctuation n’est pas simple en soi, l’intervalle donné résulte soit de la théorie (théorème de la limite centrée + connaissance de la loi normale) soit d’une simulation Assujettir la prise de décision à cette seule situation est à la fois compliqué et réducteur
III 2. Quelques propositions 1. Sensibiliser à la problématique de la décision de façon plus simple : d’abord avec des lois exactes ; ensuite avec des lois simulées ; enfin en utilisant l’intervalle de fluctuation de la loi normale au seuil de 95%. 2. Sans aborder la notion de test qui est très calibrée : préciser que l’on base les calculs sur l’hypothèse du hasard ; sensibiliser à la notion d’intervalle critique à un seuil donné ; cela impose que l’on fasse parfois varier ce seuil dans des problèmes ; énoncer clairement la règle de décision, qui ne relève pas des mathématiques mais d’un jugement sur la situation ; dissocier cette règle de son application ; éventuellement, ne pas se limiter à une fréquence.
Exemple : le problème de l’œnologue (à consommer avec modération) III. 3. Quelques situations Exemple : le problème de l’œnologue (à consommer avec modération) Pour recruter un postulant à un emploi d’œnologue, une chambre d’agriculture lui fait subir un test de reconnaissance de deux vins qu’un béotien distingue très difficilement : un monthélie (M) et un auxey-duresses (A). Les vins sont goûtés sans être absorbés, mais pour éviter que la quantité n’altère le goût, on s’en tient à 8 verres. a) On lui présente 4 paires de verres, chaque paire comprenant un vin M et un vin A. À partir de combien de verres identifiés peut-on le recruter ? Ai : « au hasard, le candidat a identifié les vins dans au moins i paires » i 1 2 3 4 P(Ai) 0,9375 0,6875 0,3125 0,0625 Au seuil de 5% : aucune prise de décision Au seuil de 10% : on recrute si les 4 vins sont reconnus
Exemple : le problème de l’œnologue (à consommer avec modération) III. 3. Quelques situations Exemple : le problème de l’œnologue (à consommer avec modération) b) On lui présente 8 verres alignés dont chacun est rempli au hasard soit avec du vin M soit du vin A. À partir de combien de verres identifiés peut-on le recruter ? Ai : « au hasard, le candidat a identifié au moins i vins » i 1 2 3 4 5 6 7 8 P(Ai) … 0,145 0,0352 0,0039 Au seuil de 5% : l’intervalle critique est [0 ; 6] On recrute le candidat s’il a identifié 7 ou 8 vins
Avez-vous le sens de l’aléatoire ? Série 1 Série 2 Série 3 Série 4 1 nombre de 0 : 18 51 48 42 nombre de 1 : 82 49 52 58 nombre de blocs 25 62 66 53 (Nombre moyen de blocs = 50,5)