De la troisième à la seconde dans le champ du programme probabilités et statistiques Année scolaire
Programme de troisième [BO du 28 Août 2008]Programme de seconde [BO du 23 Juillet 2009] Statistiques – Probabilités Pour les séries statistiques, l’étude des paramètres de position est poursuivie : médiane et quartiles. Une première approche de la dispersion est envisagée. L’éducation mathématique rejoint ici l’éducation du citoyen : prendre l’habitude de s’interroger sur la signification des nombres utilisés, sur l’information apportée par un résumé statistique. De même, c’est pour permettre au citoyen d’aborder l’incertitude et le hasard dans une perspective rationnelle que sont introduits les premiers éléments relatifs à la notion de probabilité. Statistiques et probabilités Pour des questions de présentation du programme, les cadres relatifs à l’enseignement des statistiques et des probabilités sont présentés séparément à la suite l’un de l’autre. Pour autant, ces enseignements sont en relation étroite l’un avec l’autre et doivent faire l’objet d’allers et retours. Objectifs visés par l’enseignement des statistiques et probabilités à l’occasion de résolutions de problèmes dans le cadre de l’analyse de données, rendre les élèves capables: - de déterminer et interpréter des résumés d’une série statistique ; - de réaliser la comparaison de deux séries statistiques à l’aide d’indicateurs de position et de dispersion, ou de la courbe des fréquences cumulées ; dans le cadre de l’échantillonnage - faire réfléchir les élèves à la conception et la mise en œuvre d’une simulation ; - sensibiliser les élèves à la fluctuation d’échantillonnage, aux notions d’intervalle de fluctuation et d’intervalle de confiance et à l’utilisation qui peut en être faite. ConnaissancesCapacitésCommentairesContenusCapacités attenduesCommentaires 1.3. Statistique Caractéristiques de position. Approche de caractéristiques de dispersion. [Thèmes de convergence] - Une série statistique étant donnée (sous forme de liste ou de tableau ou par une représentation graphique) : • déterminer une valeur médiane de cette série et en donner la signification ; • déterminer des valeurs pour les premier et troisième quartiles et en donner la signification ; • déterminer son étendue. - Exprimer et exploiter les résultats de mesures d’une grandeur. Le travail est conduit aussi souvent que possible en liaison avec les autres disciplines dans des situations où les données sont exploitables par les élèves. L’utilisation d’un tableur permet d’avoir accès à des situations plus riches que celles qui peuvent être traitées « à la main ». La notion de dispersion est à relier, sur des exemples, au problème posé par la disparité des mesures d’une grandeur, lors d’une activité expérimentale, en particulier en physique et chimie. Statistique descriptive, analyse de données Caractéristiques de position et de dispersion - médiane, quartiles ; - moyenne. - Utiliser un logiciel (par exemple, un tableur) ou une calculatrice pour étudier une série statistique. - Passer des effectifs aux fréquences, calculer les caractéristiques d’une série définie par effectifs ou fréquences. - Calculer des effectifs cumulés, des fréquences cumulées. - Représenter une série statistique graphiquement (nuage de points, histogramme, courbe des fréquences cumulées). L’objectif est de faire réfléchir les élèves sur des données réelles, riches et variées (issues, par exemple, d’un fichier mis à disposition par l’INSEE), synthétiser l’information et proposer des représentations pertinentes. Échantillonnage Notion d’échantillon. Intervalle de fluctuation d’une fréquence au seuil de 95%*. Réalisation d’une simulation. - Concevoir, mettre en œuvre et exploiter des simulations de situations concrètes à l’aide du tableur ou d’une calculatrice - Exploiter et faire une analyse critique d’un résultat d’échantillonnage. Un échantillon de taille n est constitué des résultats de n répétitions indépendantes de la même expérience.
À l’occasion de la mise en place d’une simulation, on peut : - utiliser les fonctions logiques d’un tableur ou d’une calculatrice, - mettre en place des instructions conditionnelles dans un algorithme. L’objectif est d’amener les élèves à un questionnement lors des activités suivantes: - l’estimation d’une proportion inconnue à partir d’un échantillon ; - la prise de décision à partir d’un échantillon. * L’intervalle de fluctuation au seuil de 95%, relatif aux échantillons de taille n, est l’intervalle centré autour de p, proportion du caractère dans la population, où se situe, avec une probabilité égale à 0,95, la fréquence observée dans un échantillon de taille n. Cet intervalle peut être obtenu, de façon approchée, par simulation. Le professeur peut indiquer aux élèves le résultat suivant, utilisable dans la pratique pour des échantillons de taille n 25 et des proportions p du caractère comprises entre 0,2 et 0,8 : si f désigne la fréquence du caractère dans l’échantillon, f appartient à l’intervalle [p-1/rac(n);p+1/rac(n )] avec une probabilité d’au moins 0, 95. Le professeur peut faire percevoir expérimentalement la validité de cette propriété mais elle n’est pas exigible. Objectifs visés par l’enseignement des statistiques et probabilités à l’occasion de résolutions de problèmes dans le cadre des probabilités, rendre les élèves capables : - d’étudier et modéliser des expériences relevant de l’équiprobabilité (par exemple, lancers de pièces ou de dés, tirage de cartes) ; - de proposer un modèle probabiliste à partir de l’observation de fréquences dans des situations simples ; - d’interpréter des événements de manière ensembliste ; - de mener à bien des calculs de probabilité. Les situations étudiées concernent des expériences à une ou plusieurs épreuves. - La répétition d’expériences aléatoires peut donner lieu à l’écriture d’algorithmes (marches aléatoires). ConnaissancesCapacitésCommentairesContenusCapacités attenduesCommentaires 1.4. Notion de probabilité [Thèmes de convergence] - Comprendre et utiliser des notions élémentaires de probabilité. - Calculer des probabilités dans des contextes familiers. La notion de probabilité est abordée à partir d’expérimentations qui permettent d’observer les fréquences des issues dans des situations familières (pièces de monnaie, dés, roues de loteries, urnes, etc.). La notion de probabilité est utilisée pour modéliser des situations simples de la vie courante. Les situations étudiées concernent les expériences aléatoires à une ou à deux épreuves. Probabilité sur un ensemble fini Probabilité d’un événement. Réunion et intersection de deux événements, formule : p(A B) + p(A B) = p(A) + p(B). - Déterminer la probabilité d’événements dans des situations d’équiprobabilité. - Utiliser des modèles définis à partir de fréquences observées. - Connaître et exploiter cette formule. La probabilité d’un événement est définie comme la somme des probabilités des événements élémentaires qui le constituent. Pour les calculs de probabilités, on utilise des arbres, des diagrammes ou des tableaux.
Trois parties : Statistiques descriptives : études et calculs portant sur des données réelles, riches et variées Probabilités : démarche de modélisation de phénomènes réels, calculs dans le modèle Statistiques inférentielles: démarche permettant d’inférer des informations sur toute la population à partir de l’observation d’échantillons.
Les statistiques descriptives en collège organisation et gestion de données : choisir un mode de représentation adapté lecture, interprétation, élaboration de tableaux étude de quelques paramètres conduisant à l’élaboration d’un résumé statistique (moyenne, médiane, quartiles, étendue).
Les statistiques descriptives en lycée effectifs cumulés, fréquences cumulées travail sur des séries définies par fréquences représentations graphiques d’une série statistique comparaison de deux séries statistiques utilisation d’un logiciel ou d’une calculatrice pour étudier une série statistique
Les probabilités En troisième : appréhender les « certitudes du hasard » par observation des fréquences calculs de probabilités sans « formalisme » En seconde : construction de modèles probabilistes validés par une démarche statistique ou un raisonnement notion d’événement sous forme ensembliste calculs de probabilités
Statistiques inférentielles (en seconde) Échantillonnage Intervalle de fluctuation Intervalle de confiance Estimation d’une proportion Preuve statistique
Statistiques inférentielles (en seconde) Notion d’échantillon Un échantillon de taille n est la liste des n résultats obtenus par n répétitions indépendantes de la même expérience. En seconde, on se limite à une expérience n’ayant que 2 issues que l’on peut noter ici « succès » et « échec ».
Notion de fluctuation d’échantillonnage Soit une expérience de Bernoulli dont la probabilité de succès est p. On réalise plusieurs échantillons de taille n de cette expérience. On note F n la variable aléatoire donnant la fréquence du succès dans un échantillon. F n prend ses valeurs dans [0;1] et pour n suffisamment grand, F n suit approximativement une loi normale de moyenne p et d’écart type = rac(p(1-p)/n).
Notion de fluctuation d’échantillonnage On démontre ainsi que : P( F n [p-1/rac(n); p+1/rac(n)] ) 0,95 (pour n assez grand et p entre 0,2 et 0,8) Ainsi, l’intervalle de fluctuation au seuil de 95% est le plus petit intervalle, centré en p, où se situent les fréquences observées avec une probabilité au moins égale à 0,95. Dans la pratique, on utilise : [p-1/rac(n) ; p+1/rac(n)].
Notion de fluctuation d’échantillonnage On peut faire percevoir expérimentalement cette propriété en classe : On réalise 500 observations de la fréquence du succès dans un échantillon de taille 100 associé à un modèle de Bernoulli de paramètre p = 0,4.
Trouver, à partir de ce diagramme, l’intervalle de fluctuation au seuil de 95 %.
Simulation de 1000 échantillons de taille 100 d’un modèle de Bernoulli avec p=0,4
Statistiques inférentielles : étude de deux exemples Estimation d’une proportion On cherche à estimer une proportion p à partir de la connaissance d’un échantillon de taille n. Exemple : estimation du résultat d’un référendum
1) Observation du phénomène : On recueille la liste des n résultats obtenus par interrogation de n personnes : on obtient un échantillon de taille n (on dispose ainsi d’un échantillon parmi tous ceux qu’on aurait pu obtenir). On calcule p obs la proportion de ces personnes votant pour S. 2) Étude quantitative : On sait qu’environ 95 % des fréquences observées sont dans l’intervalle [p-1/rac(n) ; p+1/rac(n)].
3) Exploitation mathématique : On remarque que p obs [p-1/rac(n) ; p+1/rac(n)] équivaut à p J=[p obs -1/rac(n) ; p obs +1/rac(n)] ce qui permet de dire que, parmi tous les échantillons de taille n possibles, 95 % des intervalles associés contiennent le nombre p. J est un intervalle de confiance ou fourchette de sondage.
Fourchettes associées à 20 échantillons de taille 100 dans le cas p=0,5.
Estimation d’une proportion Ainsi, en faisant une observation, on décide que : p J=[p obs -1/rac(n) ; p obs +1/rac(n)] On a obtenu une estimation de p par intervalle de confiance. La probabilité que cette décision soit erronée est inférieure à 0,05.
Prise de décision à partir d’un échantillon Exemple : L’entreprise A compte 43 femmes sur 100 employés (soit 43%). L’entreprise B compte 1150 femmes sur 2500 employés (soit 46%). Quelle est l’entreprise qui respecte le mieux le principe de parité?
Prise de décision à partir d’un échantillon Observation du phénomène : Nous sommes en présence de 2 échantillons : l’un de taille 100, l’autre de taille Les fréquences observées sont respectivement de 0,43 et de 0,46. Étude quantitative : S’il y a parité, les échantillons sont assimilables à un échantillon de taille similaire du modèle de Bernoulli avec p=0,5. Les intervalles de fluctuation sont donc respectivement : I A = [0,4 ; 0,6] et I B = [0,48 ; 0,52]
Prise de décision à partir d’un échantillon Exploitation mathématique : On remarque p A =0,43 est dans l’intervalle de fluctuation I A mais p B =0,46 n’est pas dans l’intervalle de fluctuation I B. Dans un tel modèle, ce type d’observation ne s’observerait que dans 5 % des échantillons. Ainsi, on rejette l’hypothèse que l’entreprise B respecte la parité, ceci avec le risque de prendre la mauvaise décision dans 5 % des cas. On ne rejette pas l’hypothèse que l’entreprise A respecte la parité. Remarque : on ne parle pas d’accepter ou de ne pas accepter l’hypothèse, mais de non rejet de l’hypothèse formulée.
Document ressource •eduscol.education.fr/ D0015 Mathématiques Lycée Ressources pour la classe de seconde - Probabilités et Statistiques - Ce document peut être utilisé librement dans le cadre des enseignements et de la formation des enseignants. Toute reproduction, même partielle, à d'autres fins ou dans une nouvelle publication, est soumise à l'autorisation du directeur général de l'Enseignement scolaire. Juin 2009