Quand stat et probas se rencontrent Pierre Henrotay Maggy Schneider ULg, Ladimath 1.

Slides:



Advertisements
Présentations similaires
Les présentateurs doivent souvent transmettre des informations techniques à des auditeurs qui connaissent moins bien le sujet et le vocabulaire spécifique.
Advertisements

Corrélation Position du problème Définition covariance (X,Y) r =
Probabilités et statistiques au lycée
STATISTIQUE INFERENTIELLE L ’ESTIMATION
RECONNAISSANCE DE FORMES
Présentation des programmes de terminale STG Juin 2006.
Généralités sur la préparation et la conduite d’une séance
Collecte de données F. Kohler.
Inférence statistique
Les TESTS STATISTIQUES
Les TESTS STATISTIQUES
Les tests d’hypothèses
Enseigner la démarche expérimentale en sciences
PROBABILITÉS en 3ème  .
CYCLE TERMINAL DE LA SÉRIE LITTÉRAIRE Programmes de mathématiques.
Régression -corrélation
Modélisation des systèmes non linéaires par des SIFs
variable aléatoire Discrète
Enseigner les Probabilités en Bac Pro 3 ans
Fluctuations d’une fréquence selon les échantillons, Probabilités
Programmes du cycle terminal
LES TICE AU COLLEGE.
Statistiques et Probabilités au lycée
Organisation et gestion de données, fonctions
COURS 5 Les tableaux croisés, le chi-carré et la corrélation
Simulation multi-agent de phénomènes collectifs : quelques questions d’ordre épistémologique Frédéric AMBLARD Institut de Recherche en Informatique de.
Atelier Probabilités et statistiques
Méthodes de Biostatistique
Nouveau programme de spécialité en TS
Fonction puissance Montage préparé par : André Ross
Plan la séance 4 La problématique d’une recherche
Formation des moniteurs 2008 LA CONDUITE SOUS VOILE PREMIERE PARTIE Le cadre de pratique Le rôle du moniteur Les principes pédagogiques.
Régression linéaire simple
Groupe 1: Classes de même intervalle
Comprendre la variation dans les données: Notions de base
Les probabilités.
Quand stat et probas se rencontrent
La statistique Définitions et méthodes. La statistique est la branche des mathématiques qui collecte, classe, analyse et interprète des données afin den.
Mise en oeuvre des MMCs L'utilisation des MMCs en reconnaissance des formes s'effectue en trois étapes : définition de la topologie de la chaîne de Markov,
Probabilité ou indice de croyance?
Maggy Schneider Université de Liège
Aménagement des programmes en CPGE scientifiques
Vers un nouvel empirisme: l’ancien et le nouvel empirisme John Goldsmith Université de Chicago CNRS MoDyCo.
Méthodologie de recherche
7 mai André Revuz 1 Situations fondamentales et curriculums Guy Brousseau.
Micro-intro aux stats.
STATISTIQUES – PROBABILITÉS
Probabilités et Statistiques Année 2010/2011
Commission Inter IREM Collège Algèbre et mise en Train
Introduction à une analyse statistique de données
Chapitre 3: Variables aléatoires réelles continues
Atelier Probabilités et statistiques
Apports didactiques intervention Marc Baïeul
STATISTIQUE INFERENTIELLE LES TESTS STATISTIQUES
Méthode des moindres carrés (1)
La proportionnalité Au cycle 3.
dIDACTIQUE III UNITÉ II: L’évaluation en fle
Chapitre 4 Variables aléatoires discrètes
Présenté par Radhouane Rajhi 0508/ 2008 Dans le cadre du cours: L’informatique dans l’enseignement des mathématiques Université de Québec à Montréal RÉSUMÉ:
Initiation à des recherches dans le domaine de l’enseignement
But : avoir un regard réflexif sur le métier d’enseignant
Échantillonnage (STT-2000)
Michel BRETON IEN-ET Académie de LYON
1 L2 STE. Test du χ2 d’adéquation/conformité: Il s'agit de juger de l'adéquation entre une série de données statistiques et une loi de probabilité définie.
Lectures Volume du cours: Sections 12.1 à 12.6 inclusivement.
ECHANTILLONAGE ET ESTIMATION
Introduction aux statistiques Intervalles de confiance
Chapitre 6 Les tests d ’ hypoth è se 1 – Comparer des moyennes ou des proportions.
Bienvenue au cours MAT-350 Probabilités et statistiques.
Le programme 2016 Pour le bloc de la scolarité obligatoire.
Transcription de la présentation:

Quand stat et probas se rencontrent Pierre Henrotay Maggy Schneider ULg, Ladimath 1

Stat/Probas dans les programmes actuels  Au premier degré  Représentation de données numériques par divers diagrammes  Au deuxième degré  Effectifs et fréquences  Valeurs centrales et paramètres de dispersion  Au troisième degré  Statistiques à deux variables  Calcul des probabilités  Analyse combinatoire 2

Extraits choisis  La statistique est la première des sciences inexactes (Edmond et Jules Goncourt)  La statistique a démontré que la mortalité dans l'armée augmente sensiblement en temps de guerre (Alphonse Allais)  Les statistiques c'est comme le bikini: ça donne des idées, mais ça cache l'essentiel ! (Coluche)  Il y a trois sortes de mensonges : les mensonges, les sacrés mensonges et les statistiques (Mark Twain)  Je ne crois aux statistiques que quand je les ai moi- même falsifiées (Winston Churchill) 3

Extraits choisis La statistique moderne paraît avoir enfin résolu le problème légendaire qui consistait, connaissant la longueur du navire et la durée de la traversée (du temps de la navigation à voile, on y ajoutait la hauteur du grand mât) à calculer l’âge du capitaine (André Weil, 1940) André Weil ( ) est un des membres fondateurs du groupe Bourbaki A sa mort, sa biographie officielle indiquait « Membre de l’Académie des Sciences et des Lettres de Poldévie », … un pays imaginaire 4

Enseigner la statistique… (… conditions et contraintes, F. Wozniak, IUFM Lyon)  3 constats :  Place minorée  Réduction arithmétique  Dénégation de la variabilité  Temps didactiques :  Chronogenèse : temps didactique qui « patine »  Topogenèse : questions introuvables, réduction arithmétique  Mésogenèse : absence de milieu pour faire exister de vraies études statistiques 5

Etymologie (Le Robert – Dictionnaire historique de la langue française)  Statistique  Emprunt au latin moderne statisticus « relatif à l’Etat » (1672)  Formé à partir de l’italien statistica (1633), dérivé de statista « homme d’Etat »  En anglais, Political Arithmetic (XVIIe) fut utilisé avant statistics (1798)  Le mot a d’abord désigné l’étude méthodique des faits sociaux qui définissent un Etat 6

Deux acceptions du terme « Statistique » 1. Recueil de données d’observations  Sens originel  Données (pas toujours chiffrées) concernant les Etats  La pratique du recensement est déjà présente dans l’une des plus anciennes civilisations (Sumer, 5e - 2e ACN) et se retrouve un peu partout (Chine, Japon, Hébreux, Incas, Grèce, Rome)  17 e siècle : la statistique prend peu à peu le visage qui nous est aujourd’hui familier : aspect calculatoire  18 e siècle : changement de perspective - base de prévisions (tables de mortalité, calcul de l’impôt par coefficient multiplicateur…) - inférence 7

Deux acceptions du terme « Statistique » 2. Ensemble des problèmes et méthodes liés au traitement des données recueillies  Apparition du second sens du mot au 18e  C’est dans un mouvement de plus large ampleur qu’il faut situer le dépassement du simple constat numérique, vers le calcul et la prévision : le siècle des Lumières On y reviendra (« Entre régularité et fluctuation ») … 8

Notion de probabilité  Origine historique : jeux de hasard  Naissance : XVIIe, Pascal et Fermat, le problème des partis (1654)  Deux aspects émergent :  Aspect plus théorique (Laplacienne)  cas favorables / cas possibles, équiprobabilité, dénombrements  cadre limité (jeux de hasard)  Aspect plus pratique (fréquentiste)  observation statistique des fréquences, expérience du passé, loi des grands nombres (Bernoulli)  cadre de la vie réelle : mortalité, assurances, défauts 9

Notion de probabilité  Malaise historique  On ne peut guère donner une définition satisfaisante de la Probabilité H. Poincaré, 1893 (tautologie)  Variables continues, ensembles non dénombrables =difficulté particulière  Problèmes liés à l’intégration  (1933) Kolmogorov : théorie axiomatique  Basée sur la théorie de la mesure, la théorie des ensembles, l’intégrale de Lebesgue  Réponse théorique rassurante pour la validité des calculs  Ignore l’utilisation et l’interprétation des probabilités 10

Probabilités – Kolmogorov (1933)  Grundbegriffe der Wahrscheinlichkeitsrechnung, +-70 p  Deux premiers chapitres (sur 6) :  Elementary theory of probabilities  Nombre fini d’événements uniquement  Référence à l’axiomatisation de la géométrie (Hilbert)  5 axiomes, mais aussi 2 pages consacrées à leur déduction empirique  Infinite probability fields  1 axiome supplémentaire (dit « de continuité »)  Cas fini : axiome redondant 11

Probabilités – Kolmogorov (1933) Quelques réflexions de l’auteur :  « the new axiom is essential for infinite fields, it is almost impossible to elucidate its empirical meaning »  « Infinite fields of probability occur only as idealized models of real random processes. We limit ourselves, arbitrarily, to only those models which satisfy axiom VI » « Grundbegriffe… » est considéré par beaucoup comme une contribution au problème 6 de Hilbert Axiomatiser la Physique (Paris, 1900, 2 e Congrès des Mathématiciens) 12

Probabilités – transposition actuelle  Transposition actuelle largement basée sur axiomatique de Kolmogorov, comme dispensée à l’Université, mais édulcorée (absents : tribu/σ-algèbre, infinité non dénombrable, variables continues, mesure de Lebesgue, intégrale impropre…) = praxéologie à trous  Obstacles :  « Comment oser parler des lois du hasard ? Le hasard n’est-il pas l’antithèse de toute loi ? » (J. Bertrand, 1889)  « Tout est possible, car c’est le hasard – on ne peut rien dire »  Tout est possible (individuellement)… mais pas n’importe comment (sur un grand nombre de données) 13

Secondaire vs Supérieur  Secondaire – une certaine schizophrénie 14  Université

Liens stat/probas au Secondaire Conseils méthodologiques  CF : « L'examen de tableaux statistiques conduira à approcher empiriquement la probabilité »  FESeC : « La notion de probabilité expérimentale [...] sera introduite à partir des fréquences et précisée en montrant la tendance qu’ont celles-ci à se stabiliser lorsque le nombre d’expériences est grand (des simulations avec logiciels sont très instructives et éclairantes) » 15

La variabilité unit statistique et probabilités  Laplace (1795) « Quelquefois les phénomènes paraissent dépendre d'une cause régulière ; et cependant, ils ne sont que le résultat de ces causes irrégulières, variables et inconnues, auxquelles nous donnons le nom de hasard. C'est à l'analyse des probabilités à déterminer jusqu'à quel point une cause régulière est probable en vertu de ces phénomènes, et à l'indiquer aux philosophes, comme objet digne de leurs recherches. »  L’étude de la variabilité permettra l’induction statistique, avec l’estimation et les tests (aide à la décision)  La problématique générale de la statistique est celle de la recherche et de la constitution d’une dialectique à caractère scientifique entre régularité et fluctuations, dans l’analyse de phénomènes marqués par un caractère de variabilité 16

Entre régularité et fluctuation  L’idée centrale, qui porte en elle implicitement l’idée d’inférence, c’est celle de la tendance moyenne, ou de régularité  Voir les régularités derrière l’apparent désordre de la variabilité en travaillant sur des populations étendues, ou comme on dit, sur les « grands nombres »  Importance de la moyenne – dès Tycho Brahé, et souvent dans le cadre de l’astronomie  Intervention d’une théorie extérieure = calcul des probabilités et loi de Bernoulli, première approche de la loi des grands nombres 17

Entre régularité et fluctuation  La théorie des erreurs permet de penser commodément les permanences du réel – dès Galilée (1632); Gauss propose une mesure des écarts proche de la variance (1805)  Apport des méthodes d’ajustement (moindres carrés)  Minimisation des carrés des écarts par rapport à une valeur centrale – la moyenne comme estimateur optimal (Legendre, Gauss)  La distribution des erreurs selon une « loi universelle » (Laplace, Gauss) – loi « normale » (Pearson)  Variance et écart-type : 19 e seulement 18

Entre régularité et fluctuation  Levée progressive d’un obstacle : les fluctuations ne pourront plus être pensées comme des « aberrations » par rapport à la tendance moyenne  Prise en compte des fluctuations autour de cette tendance centrale : elles sont révélatrices  Fin du 19e s et les débuts du 20e siècle surtout : représentativité d’un échantillon, problématique de l’estimation (Fischer), de l’intervalle de confiance (Neyman) et des tests d’hypothèse (Pearson+Neyman) 19

Une réflexion intéressante (Parnaudeau J-M., Lycée Poitiers) Dans ce que l’on appelle habituellement la vie courante, la plupart des individus, pour la plupart des problèmes, raisonnent par induction. Demandez à quelqu’un qui fait des « mots codés » comment il procède, demandez à un réparateur comment il procède pour trouver une panne. Si mettre en oeuvre un test statistique, c'est dérouler un algorithme ou appliquer une technique, comme lors de la résolution des équations du second degré par radicaux, pour ne prendre qu’un exemple, alors nul besoin de faire un effort didactique et dans ce cas il faut laisser l’enseignement des tests statistiques aux praticiens ou aux techniciens qui le font très bien. Si, par contre, on souhaite enseigner le raisonnement plausible, au même titre que le raisonnement déductif ou le raisonnement par récurrence, alors cet enseignement est du ressort du professeur de mathématiques. 20

Statistique inférentielle  On l’enseigne à l’université  Peut-on envisager de l’enseigner avant ? Quelle place lui donner ?  Brousseau a testé l’enseignement du test d’hypothèse à l’école élémentaire (1974)  Enseignement secondaire : ? Source d’inspiration possible: JM Parnaudeau (Lycée Poitiers) « Quelques hypothèses sur les risques que l’on prend lorsque l’on souhaite enseigner les tests d’hypothèses ! » (Atelier JN 2006 APMEP Clermont Ferrand) Ce ne sont pas le vocabulaire ou les formules qui apportent le sens 21

Une approche possible dans le secondaire  Parcours où stat et probas se rencontrent dès le début  Mariage de raison pour répondre à des besoins précis – aspect incontournable, « fondamental »  Statistique inférentielle (dite aussi « inductive » ou … « mathématique ») comme point de départ  Nécessaire abandon de l’approche purement calculatoire  Eviter « l’apprentissage inflationniste de vocabulaire »  Formalisation définitive des probabilités par axiomes en finale 22

Un cas d’infrastructure manquante… … statistique et probabilités en classe de 3eme (Y. Chevallard + F. Wozniak) – atelier à l’école d’été de didactique des mathématiques  Que pourrait être un scénario qui fait vivre les probabilités comme modélisant la variabilité statistique ?  Inévitable question : en quoi et comment les probabilités modélisent-elles la variabilité statistique ? 23

Un cas d’infrastructure manquante…  Elément-clé absent : la probabilité est regardée comme une approximation de la fréquence observable, plutôt que l’inverse; or  La relation d’approximation est symétrique  C’est le sens inverse qui est central dans la modélisation probabiliste de la variabilité statistique  Autre manque essentiel : en stat/probas, on part d’un état de non-mathématisation préalable : la variabilité est extérieure aux maths (loi « expérimentale » des grands nombres) ; donc; en attente de mathématisation Poincaré : (loi normale) « Tout le monde y croit […] car les expérimentateurs s’imaginent qu’il s’agit d’un théorème de mathématiques et les mathématiciens que c’est un fait expérimental » 24

Un cas d’infrastructure manquante…  Les règles de calcul : les axiomes de Kolmogorov naissent de la modélisation des fréquences empiriques – or : occultation de la « relation to experimental data »  Processus d’oubli du fondement fréquentiste du calcul des probabilités, au profit de principes de symétrie et d’équiprobabilité, de la combinatoire  Le calcul des probabilités devient une réalité en soi et pour soi : l’origine statistique semble perdue, refoulée; c’est même devenu une « fin en soi » 25

Un cas d’infrastructure manquante… Estimation contre pari  Mis en avant : la problématique de l’estimation (proba inconnue, on l’estime par une fréquence observée sur une série de réalisations)  La problématique statistique est le point de vue inverse : ayant estimé la probabilité, on veut prédire la fréquence qu’on s’attend à observer : c’est le pari qu’il faut privilégier plutôt que l’estimation 26

Stat/Probas - Quels liens ? La Statistique sans la théorie des Probabilités est aveugle et la théorie des Probabilités sans la Statistique est vide. (Hanss Schupp, in Studies in mathematics education. Vol 7. The teaching of statistics. Editions UNESCO, Paris, 1994) 27

Répartition des tâches (business model) 28 Contexte: réalisation d’un test d’hypothèse en biostatistique

Obstacles majeurs identifiés Obstacles a priori à l’apprentissage de l’analyse statistique inférentielle (Calmant, Ducarme, Schneider, Statistique & Enseignement, 2011, Vol 2-1, « Expériences commentées »)  3 obstacles majeurs identifiés  Non prise en compte de la variabilité  Obstacle épistémologique  Décodage d’ostensifs graphiques en termes X-Y  Obstacle didactique  Difficulté à concevoir des niveaux sémantiques plus abstraits  Obstacle cognitif 29

Quelques suggestions de lecture  Traité de didactique des mathématiques, pp , pp , pp  Eléments de statistique (Dehon, Droesbeke, Vermandel)  Que sais-je  La statistique (Vessereau)  Les probabilités (Jacquard)  Histoire de la statistique (Droesbeke & Tassi)  La probabilité, le hasard et la certitude (Deheuvels)  L’induction statistique au Lycée (Dutarte) 30