Quand stat et probas se rencontrent Pierre Henrotay Maggy Schneider ULg, Ladimath
Stat/Probas dans les programmes actuels Au premier degré Représentation de données numériques par divers diagrammes Au deuxième degré Effectifs et fréquences Valeurs centrales et paramètres de dispersion Au troisième degré Statistiques à deux variables (6e) Calcul des probabilités (6e) Analyse combinatoire (6e)
Extraits choisis La statistique est la première des sciences inexactes (Edmond et Jules Goncourt) La statistique a démontré que la mortalité dans l'armée augmente sensiblement en temps de guerre (Alphonse Allais) Les statistiques c'est comme le bikini: ça donne des idées, mais ça cache l'essentiel ! (Coluche) Il y a trois sortes de mensonges : les mensonges, les sacrés mensonges et les statistiques (Mark Twain) Je ne crois aux statistiques que quand je les ai moi-même falsifiées (Winston Churchill)
Extraits choisis La statistique moderne paraît avoir enfin résolu le problème légendaire qui consistait, connaissant la longueur du navire et la durée de la traversée (du temps de la navigation à voile, on y ajoutait la hauteur du grand mât) à calculer l’âge du capitaine (André Weil, 1940) André Weil (1906-1998) est un des membres fondateurs du groupe Bourbaki A sa mort, sa biographie officielle indiquait « Membre de l’Académie des Sciences et des Lettres de Poldévie », … un pays imaginaire
Enseigner la statistique… (… conditions et contraintes, F. Wozniak, IUFM Lyon) 3 constats : Place minorée Réduction arithmétique Dénégation de la variabilité Temps didactiques : Chronogenèse : temps didactique qui « patine » Topogenèse : questions introuvables, réduction arithmétique Mésogenèse : absence de milieu pour faire exister de vraies études statistiques
Etymologie (Le Robert – Dictionnaire historique de la langue française) Statistique Emprunt au latin moderne statisticus « relatif à l’Etat » (1672) Formé à partir de l’italien statistica (1633), dérivé de statista « homme d’Etat » En anglais, Political Arithmetic (XVIIe) fut utilisé avant statistics (1798) Le mot a d’abord désigné l’étude méthodique des faits sociaux qui définissent un Etat
Deux acceptions du terme « Statistique » 1. Recueil de données d’observations Sens originel Données (pas toujours chiffrées) concernant les Etats La pratique du recensement est déjà présente dans l’une des plus anciennes civilisations (Sumer, 5e - 2e ACN) et se retrouve un peu partout (Chine, Japon, Hébreux, Incas, Grèce, Rome) 17e siècle : la statistique prend peu à peu le visage qui nous est aujourd’hui familier : aspect calculatoire 18e siècle : changement de perspective - base de prévisions (tables de mortalité, calcul de l’impôt par coefficient multiplicateur…) - inférence
Deux acceptions du terme « Statistique » 2. Ensemble des problèmes et méthodes liés au traitement des données recueillies Apparition du second sens du mot au 18e C’est dans un mouvement de plus large ampleur qu’il faut situer le dépassement du simple constat numérique, vers le calcul et la prévision : le siècle des Lumières On y reviendra (« Entre régularité et fluctuation ») …
Notion de probabilité Origine : jeux de hasard Naissance : XVIIe, Pascal et Fermat, le problème des partis (1654) Deux aspects émergent : Aspect plus théorique (Laplacienne) cas favorables / cas possibles, équiprobabilité, dénombrements cadre limité (jeux de hasard) Aspect plus pratique observation statistique des fréquences, expérience du passé, loi des grands nombres (Bernoulli) cadre de la vie réelle : mortalité, assurances, défauts
Notion de probabilité Malaise historique On ne peut guère donner une définition satisfaisante de la Probabilité H. Poincaré, 1856 (tautologie) Variables continues, ensembles non dénombrables =difficulté particulière Problèmes liés à l’intégration (1933) Kolmogorov : théorie axiomatique Basée sur la théorie de la mesure, la théorie des ensembles, l’intégrale de Lebesgue Réponse théorique rassurante pour la validité des calculs Ignore l’utilisation et l’interprétation des probabilités
Probabilités – Kolmogorov (1933) Grundbegriffe der Wahrscheinlichkeitsrechnung, +-70 p Deux premiers chapitres (sur 6) : Elementary theory of probabilities Nombre fini d’événements uniquement Référence à l’axiomatisation de la géométrie (Hilbert) 5 axiomes, mais aussi 2 pages consacrées à leur déduction empirique Infinite probability fields 1 axiome supplémentaire (dit « de continuité ») Cas fini : axiome redondant
Probabilités – Kolmogorov (1933) Quelques réflexions de l’auteur : « the new axiom is essential for infinite fields, it is almost impossible to elucidate its empirical meaning » « Infinite fields of probability occur only as idealized models of real random processes. We limit ourselves, arbitrarily, to only those models which satisfy axiom VI » « Grundbegriffe… » est considéré par beaucoup comme une contribution au problème 6 de Hilbert Axiomatiser la Physique (Paris, 1900, 2e Congrès des Mathématiciens)
Probabilités – transposition actuelle Transposition actuelle largement basée sur axiomatique de Kolmogorov, comme dispensée à l’Université, mais édulcorée (absents : tribu/σ-algèbre, infinité non dénombrable, variables continues, mesure de Lebesgue, intégrale impropre…) = praxéologie à trous Obstacles : « Comment oser parler des lois du hasard ? Le hasard n’est-il pas l’antithèse de toute loi ? » (J. Bertrand, 1889) « Tout est possible, car c’est le hasard – on ne peut rien dire » Tout est possible (individuellement)… mais pas n’importe comment (sur un grand nombre de données)
Secondaire vs Supérieur Secondaire – une certaine schizophrénie Université
Liens stat/probas au Secondaire Conseils méthodologiques CF : « L'examen de tableaux statistiques conduira à approcher empiriquement la probabilité » FESeC : « La notion de probabilité expérimentale [...] sera introduite à partir des fréquences et précisée en montrant la tendance qu’ont celles-ci à se stabiliser lorsque le nombre d’expériences est grand (des simulations avec logiciels sont très instructives et éclairantes) »
La variabilité unit statistique et probabilités Laplace (1795) « Quelquefois les phénomènes paraissent dépendre d'une cause régulière ; et cependant, ils ne sont que le résultat de ces causes irrégulières, variables et inconnues, auxquelles nous donnons le nom de hasard. C'est à l'analyse des probabilités à déterminer jusqu'à quel point une cause régulière est probable en vertu de ces phénomènes, et à l'indiquer aux philosophes, comme objet digne de leurs recherches. » L’étude de la variabilité permettra l’induction statistique, avec l’estimation et les tests (aide à la décision) La problématique générale de la statistique est celle de la recherche et de la constitution d’une dialectique à caractère scientifique entre régularité et fluctuations, dans l’analyse de phénomènes marqués par un caractère de variabilité
Entre régularité et fluctuation L’idée centrale, qui porte en elle implicitement l’idée d’inférence, c’est celle de la tendance moyenne, ou de régularité Voir les régularités derrière l’apparent désordre de la variabilité en travaillant sur des populations étendues, ou comme on dit, sur les « grands nombres » Importance de la moyenne – dès Tycho Brahé, et souvent dans le cadre de l’astronomie Intervention d’une théorie extérieure = calcul des probabilités et loi de Bernoulli, première approche de la loi des grands nombres
Entre régularité et fluctuation La théorie des erreurs permet de penser commodément les permanences du réel – dès Galilée (1632); Gauss propose une mesure des écarts proche de la variance (1805) Apport des méthodes d’ajustement (moindres carrés) Minimisation des carrés des écarts par rapport à une valeur centrale – la moyenne comme estimateur optimal (Legendre, Gauss) La distribution des erreurs selon une « loi universelle » (Laplace, Gauss) – loi « normale » (Pearson) Variance et écart-type : 19e seulement
Entre régularité et fluctuation Levée progressive d’un obstacle : les fluctuations ne pourront plus être pensées comme des « aberrations » par rapport à la tendance moyenne Prise en compte des fluctuations autour de cette tendance centrale : elles sont révélatrices Fin du 19e s et les débuts du 20e siècle surtout : représentativité d’un échantillon, problématique de l’estimation (Fischer), de l’intervalle de confiance (Neyman) et des tests d’hypothèse (Pearson+Neyman)
Une réflexion intéressante (Parnaudeau J-M., Lycée Poitiers) Dans ce que l’on appelle habituellement la vie courante, la plupart des individus, pour la plupart des problèmes, raisonnent par induction. Demandez à quelqu’un qui fait des « mots codés » comment il procède, demandez à un réparateur comment il procède pour trouver une panne. Si mettre en oeuvre un test statistique, c'est dérouler un algorithme ou appliquer une technique, comme lors de la résolution des équations du second degré par radicaux, pour ne prendre qu’un exemple, alors nul besoin de faire un effort didactique et dans ce cas il faut laisser l’enseignement des tests statistiques aux praticiens ou aux techniciens qui le font très bien. Si, par contre, on souhaite enseigner le raisonnement plausible, au même titre que le raisonnement déductif ou le raisonnement par récurrence, alors cet enseignement est du ressort du professeur de mathématiques.
Statistique inférentielle On l’enseigne à l’université Peut-on envisager de l’enseigner avant ? Quelle place lui donner ? Brousseau a testé l’enseignement du test d’hypothèse à l’école élémentaire (1974) Enseignement secondaire : ? Source d’inspiration possible: JM Parnaudeau (Lycée Poitiers) « Quelques hypothèses sur les risques que l’on prend lorsque l’on souhaite enseigner les tests d’hypothèses ! » (Atelier JN 2006 APMEP Clermont Ferrand) Ce ne sont pas le vocabulaire ou les formules qui apportent le sens Possibilités: ds croissance/décr, dans dérivée
Une approche possible dans le secondaire Parcours où stat et probas se rencontrent dès le début Mariage de raison pour répondre à des besoins précis – aspect incontournable, « fondamental » Statistique inférentielle (dite aussi « inductive » ou … « mathématique ») comme point de départ Nécessaire abandon de l’approche purement calculatoire Eviter « l’apprentissage inflationniste de vocabulaire » Formalisation définitive des probabilités par axiomes en finale
Un cas d’infrastructure manquante… … statistique et probabilités en classe de 3eme (Y. Chevallard + F. Wozniak) – atelier à l’école d’été de didactique des mathématiques Que pourrait être un scénario qui fait vivre les probabilités comme modélisant la variabilité statistique ? Inévitable question : en quoi et comment les probabilités modélisent-elles la variabilité statistique ?
Un cas d’infrastructure manquante… Elément-clé absent : la probabilité est regardée comme une approximation de la fréquence observable, plutôt que l’inverse; or La relation d’approximation est symétrique C’est le sens inverse qui est central dans la modélisation probabiliste de la variabilité statistique Autre manque essentiel : en stat/probas, on part d’un état de non-mathématisation préalable : la variabilité est extérieure aux maths (loi « expérimentale » des grands nombres) ; donc; en attente de mathématisation Poincaré : (loi normale) « Tout le monde y croit […] car les expérimentateurs s’imaginent qu’il s’agit d’un théorème de mathématiques et les mathématiciens que c’est un fait expérimental »
Un cas d’infrastructure manquante… Les règles de calcul : les axiomes de Kolmogorov naissent de la modélisation des fréquences empiriques – or : occultation de la « relation to experimental data » Processus d’oubli du fondement fréquentiste du calcul des probabilités, au profit de principes de symétrie et d’équiprobabilité, de la combinatoire Le calcul des probabilités devient une réalité en soi et pour soi : l’origine statistique semble perdue, refoulée; c’est même devenu une « fin en soi »
Un cas d’infrastructure manquante… Estimation contre pari Mis en avant : la problématique de l’estimation (proba inconnue, on l’estime par une fréquence observée sur une série de réalisations) La problématique statistique est le point de vue inverse : ayant estimé la probabilité, on veut prédire la fréquence qu’on s’attend à observer : c’est le pari qu’il faut privilégier plutôt que l’estimation
Stat/Probas - Quels liens ? La Statistique sans la théorie des Probabilités est aveugle et la théorie des Probabilités sans la Statistique est vide. (Hanss Schupp, in Studies in mathematics education. Vol 7. The teaching of statistics. Editions UNESCO, Paris, 1994)
Répartition des tâches (business model) Contexte: réalisation d’un test d’hypothèse en biostatistique
Obstacles majeurs identifiés Obstacles a priori à l’apprentissage de l’analyse statistique inférentielle (Calmant, Ducarme, Schneider, Statistique & Enseignement, 2011, Vol 2-1, « Expériences commentées ») 3 obstacles majeurs identifiés Non prise en compte de la variabilité Obstacle épistémologique Décodage d’ostensifs graphiques en termes X-Y Obstacle didactique Difficulté à concevoir des niveaux sémantiques plus abstraits Obstacle cognitif
Quelques suggestions de lecture Traité de didactique des mathématiques, pp118-131, pp182-188, pp230-233 Eléments de statistique (Dehon, Droesbeke, Vermandel) Que sais-je La statistique (Vessereau) Les probabilités (Jacquard) Histoire de la statistique (Droesbeke & Tassi) La probabilité, le hasard et la certitude (Deheuvels) L’induction statistique au Lycée (Dutarte)