Quand stat et probas se rencontrent

Slides:

Advertisements

Présentations similaires

Les présentateurs doivent souvent transmettre des informations techniques à des auditeurs qui connaissent moins bien le sujet et le vocabulaire spécifique.

Advertisements

DECOUVERTE ET MISE EN OEUVRE

Probabilités et statistiques au lycée

STATISTIQUE INFERENTIELLE L ’ESTIMATION

Résolution de problèmes et logiciel de calcul symbolique

Fonctions & procédures

Calcul géométrique avec des données incertaines

RECONNAISSANCE DE FORMES

Calculs de complexité d'algorithmes

Présentation des programmes de terminale STG Juin 2006.

Test statistique : principe

Généralités sur la préparation et la conduite d’une séance

LE CALCUL LITTÉRAL AU COLLÈGE

Inférence statistique

Les TESTS STATISTIQUES

1. Les caractéristiques de dispersion. 11. Utilité.

Les TESTS STATISTIQUES

Logique et Raisonnement Scientifique

1 Intégration numérique garantie de systèmes décrits par des équations différentielles non-linéaires Application à l'estimation garantie d'état et de paramètres.

Les tests d’hypothèses

Rénovation STMG : programme de Management

PROBABILITÉS en 3ème .

et évaluation des compétences

variable aléatoire Discrète

Fluctuations d’une fréquence selon les échantillons, Probabilités

Programmes du cycle terminal

Maple, modélisation et résolution de problèmes

Vuibert Systèmes dinformation et management des organisations 6 e édition R. Reix – B. Fallery – M. Kalika – F. Rowe Chapitre 1 : La notion de système.

Atelier Probabilités et statistiques

Méthodes de Biostatistique

Pourquoi les réseaux de neurones de type « perceptron multicouche » conviennent-ils à l’apprentissage Stéphane Canu, INSA de Rouen , PSI André Elisseeff,

Plan la séance 4 La problématique d’une recherche

Cours Corporate finance Eléments de théorie du portefeuille Le Medaf

Méthode des k plus proches voisins

INITIATION AU RAISONNEMENT ALGEBRIQUE AU DEBUT DU COLLEGE

Régression linéaire simple

Tableaux de distributions

Tableaux de distributions

Comprendre la variation dans les données: Notions de base

TECHNIQUES QUANTITATIVES APPLIQUEES A LA FINANCE

Introduction à la Théorie géométrique de la diffraction

Corrélation Principe fondamental d’une analyse de corrélation

1.1 LES VECTEURS GÉOMÉTRIQUES

La statistique Définitions et méthodes. La statistique est la branche des mathématiques qui collecte, classe, analyse et interprète des données afin den.

Probabilité ou indice de croyance?

Atelier de formation : MAT optimisation II (les graphes).

Maggy Schneider Université de Liège

Filtrage de Kalman et aperçu probabiliste

Aménagement des programmes en CPGE scientifiques

Présentation de la méthode des Eléments Finis

1 - Programme de Seconde (juin 2009) Statistique et probabilités

Probabilités et Statistiques

Master 1 – Sciences du Langage –

ESTIMATION 1. Principe 2. Estimateur 3. Distribution d’échantillonnage

Méthodologie de recherche

7 mai André Revuz 1 Situations fondamentales et curriculums Guy Brousseau.

Probabilités et Statistiques Année 2010/2011

Commission Inter IREM Collège Algèbre et mise en Train

Atelier Probabilités et statistiques

Apports didactiques intervention Marc Baïeul

Quand stat et probas se rencontrent Pierre Henrotay Maggy Schneider ULg, Ladimath 1.

Chapitre 4 Variables aléatoires discrètes

Initiation à des recherches dans le domaine de l’enseignement

But : avoir un regard réflexif sur le métier d’enseignant

Michel BRETON IEN-ET Académie de LYON

Lectures Volume du cours: Sections 12.1 à 12.6 inclusivement.

ECHANTILLONAGE ET ESTIMATION

Introduction aux statistiques Intervalles de confiance

Chapitre 6 Les tests d ’ hypoth è se 1 – Comparer des moyennes ou des proportions.

Bienvenue au cours MAT-350 Probabilités et statistiques.

Transcription de la présentation:

Quand stat et probas se rencontrent Pierre Henrotay Maggy Schneider ULg, Ladimath

Stat/Probas dans les programmes actuels Au premier degré Représentation de données numériques par divers diagrammes Au deuxième degré Effectifs et fréquences Valeurs centrales et paramètres de dispersion Au troisième degré Statistiques à deux variables (6e) Calcul des probabilités (6e) Analyse combinatoire (6e)

Extraits choisis La statistique est la première des sciences inexactes (Edmond et Jules Goncourt) La statistique a démontré que la mortalité dans l'armée augmente sensiblement en temps de guerre (Alphonse Allais) Les statistiques c'est comme le bikini: ça donne des idées, mais ça cache l'essentiel ! (Coluche) Il y a trois sortes de mensonges : les mensonges, les sacrés mensonges et les statistiques (Mark Twain) Je ne crois aux statistiques que quand je les ai moi-même falsifiées (Winston Churchill)

Extraits choisis La statistique moderne paraît avoir enfin résolu le problème légendaire qui consistait, connaissant la longueur du navire et la durée de la traversée (du temps de la navigation à voile, on y ajoutait la hauteur du grand mât) à calculer l’âge du capitaine (André Weil, 1940) André Weil (1906-1998) est un des membres fondateurs du groupe Bourbaki A sa mort, sa biographie officielle indiquait « Membre de l’Académie des Sciences et des Lettres de Poldévie », … un pays imaginaire

Enseigner la statistique… (… conditions et contraintes, F. Wozniak, IUFM Lyon) 3 constats : Place minorée Réduction arithmétique Dénégation de la variabilité Temps didactiques : Chronogenèse : temps didactique qui « patine » Topogenèse : questions introuvables, réduction arithmétique Mésogenèse : absence de milieu pour faire exister de vraies études statistiques

Etymologie (Le Robert – Dictionnaire historique de la langue française) Statistique Emprunt au latin moderne statisticus « relatif à l’Etat » (1672) Formé à partir de l’italien statistica (1633), dérivé de statista « homme d’Etat » En anglais, Political Arithmetic (XVIIe) fut utilisé avant statistics (1798) Le mot a d’abord désigné l’étude méthodique des faits sociaux qui définissent un Etat

Deux acceptions du terme « Statistique » 1. Recueil de données d’observations Sens originel Données (pas toujours chiffrées) concernant les Etats La pratique du recensement est déjà présente dans l’une des plus anciennes civilisations (Sumer, 5e - 2e ACN) et se retrouve un peu partout (Chine, Japon, Hébreux, Incas, Grèce, Rome) 17e siècle : la statistique prend peu à peu le visage qui nous est aujourd’hui familier : aspect calculatoire 18e siècle : changement de perspective - base de prévisions (tables de mortalité, calcul de l’impôt par coefficient multiplicateur…) - inférence

Deux acceptions du terme « Statistique » 2. Ensemble des problèmes et méthodes liés au traitement des données recueillies Apparition du second sens du mot au 18e C’est dans un mouvement de plus large ampleur qu’il faut situer le dépassement du simple constat numérique, vers le calcul et la prévision : le siècle des Lumières On y reviendra (« Entre régularité et fluctuation ») …

Notion de probabilité Origine : jeux de hasard Naissance : XVIIe, Pascal et Fermat, le problème des partis (1654) Deux aspects émergent : Aspect plus théorique (Laplacienne) cas favorables / cas possibles, équiprobabilité, dénombrements cadre limité (jeux de hasard) Aspect plus pratique observation statistique des fréquences, expérience du passé, loi des grands nombres (Bernoulli) cadre de la vie réelle : mortalité, assurances, défauts

Notion de probabilité Malaise historique On ne peut guère donner une définition satisfaisante de la Probabilité H. Poincaré, 1856 (tautologie) Variables continues, ensembles non dénombrables =difficulté particulière Problèmes liés à l’intégration (1933) Kolmogorov : théorie axiomatique Basée sur la théorie de la mesure, la théorie des ensembles, l’intégrale de Lebesgue Réponse théorique rassurante pour la validité des calculs Ignore l’utilisation et l’interprétation des probabilités

Probabilités – Kolmogorov (1933) Grundbegriffe der Wahrscheinlichkeitsrechnung, +-70 p Deux premiers chapitres (sur 6) : Elementary theory of probabilities Nombre fini d’événements uniquement Référence à l’axiomatisation de la géométrie (Hilbert) 5 axiomes, mais aussi 2 pages consacrées à leur déduction empirique Infinite probability fields 1 axiome supplémentaire (dit « de continuité ») Cas fini : axiome redondant

Probabilités – Kolmogorov (1933) Quelques réflexions de l’auteur : « the new axiom is essential for infinite fields, it is almost impossible to elucidate its empirical meaning » « Infinite fields of probability occur only as idealized models of real random processes. We limit ourselves, arbitrarily, to only those models which satisfy axiom VI » « Grundbegriffe… » est considéré par beaucoup comme une contribution au problème 6 de Hilbert Axiomatiser la Physique (Paris, 1900, 2e Congrès des Mathématiciens)

Probabilités – transposition actuelle Transposition actuelle largement basée sur axiomatique de Kolmogorov, comme dispensée à l’Université, mais édulcorée (absents : tribu/σ-algèbre, infinité non dénombrable, variables continues, mesure de Lebesgue, intégrale impropre…) = praxéologie à trous Obstacles : « Comment oser parler des lois du hasard ? Le hasard n’est-il pas l’antithèse de toute loi ? » (J. Bertrand, 1889) « Tout est possible, car c’est le hasard – on ne peut rien dire » Tout est possible (individuellement)… mais pas n’importe comment (sur un grand nombre de données)

Secondaire vs Supérieur Secondaire – une certaine schizophrénie Université

Liens stat/probas au Secondaire Conseils méthodologiques CF : « L'examen de tableaux statistiques conduira à approcher empiriquement la probabilité » FESeC : « La notion de probabilité expérimentale [...] sera introduite à partir des fréquences et précisée en montrant la tendance qu’ont celles-ci à se stabiliser lorsque le nombre d’expériences est grand (des simulations avec logiciels sont très instructives et éclairantes) »

La variabilité unit statistique et probabilités Laplace (1795) « Quelquefois les phénomènes paraissent dépendre d'une cause régulière ; et cependant, ils ne sont que le résultat de ces causes irrégulières, variables et inconnues, auxquelles nous donnons le nom de hasard. C'est à l'analyse des probabilités à déterminer jusqu'à quel point une cause régulière est probable en vertu de ces phénomènes, et à l'indiquer aux philosophes, comme objet digne de leurs recherches. » L’étude de la variabilité permettra l’induction statistique, avec l’estimation et les tests (aide à la décision) La problématique générale de la statistique est celle de la recherche et de la constitution d’une dialectique à caractère scientifique entre régularité et fluctuations, dans l’analyse de phénomènes marqués par un caractère de variabilité

Entre régularité et fluctuation L’idée centrale, qui porte en elle implicitement l’idée d’inférence, c’est celle de la tendance moyenne, ou de régularité Voir les régularités derrière l’apparent désordre de la variabilité en travaillant sur des populations étendues, ou comme on dit, sur les « grands nombres » Importance de la moyenne – dès Tycho Brahé, et souvent dans le cadre de l’astronomie Intervention d’une théorie extérieure = calcul des probabilités et loi de Bernoulli, première approche de la loi des grands nombres

Entre régularité et fluctuation La théorie des erreurs permet de penser commodément les permanences du réel – dès Galilée (1632); Gauss propose une mesure des écarts proche de la variance (1805) Apport des méthodes d’ajustement (moindres carrés) Minimisation des carrés des écarts par rapport à une valeur centrale – la moyenne comme estimateur optimal (Legendre, Gauss) La distribution des erreurs selon une « loi universelle » (Laplace, Gauss) – loi « normale » (Pearson) Variance et écart-type : 19e seulement

Entre régularité et fluctuation Levée progressive d’un obstacle : les fluctuations ne pourront plus être pensées comme des « aberrations » par rapport à la tendance moyenne Prise en compte des fluctuations autour de cette tendance centrale : elles sont révélatrices Fin du 19e s et les débuts du 20e siècle surtout : représentativité d’un échantillon, problématique de l’estimation (Fischer), de l’intervalle de confiance (Neyman) et des tests d’hypothèse (Pearson+Neyman)

Une réflexion intéressante (Parnaudeau J-M., Lycée Poitiers) Dans ce que l’on appelle habituellement la vie courante, la plupart des individus, pour la plupart des problèmes, raisonnent par induction. Demandez à quelqu’un qui fait des « mots codés » comment il procède, demandez à un réparateur comment il procède pour trouver une panne. Si mettre en oeuvre un test statistique, c'est dérouler un algorithme ou appliquer une technique, comme lors de la résolution des équations du second degré par radicaux, pour ne prendre qu’un exemple, alors nul besoin de faire un effort didactique et dans ce cas il faut laisser l’enseignement des tests statistiques aux praticiens ou aux techniciens qui le font très bien. Si, par contre, on souhaite enseigner le raisonnement plausible, au même titre que le raisonnement déductif ou le raisonnement par récurrence, alors cet enseignement est du ressort du professeur de mathématiques.

Statistique inférentielle On l’enseigne à l’université Peut-on envisager de l’enseigner avant ? Quelle place lui donner ? Brousseau a testé l’enseignement du test d’hypothèse à l’école élémentaire (1974) Enseignement secondaire : ? Source d’inspiration possible: JM Parnaudeau (Lycée Poitiers) « Quelques hypothèses sur les risques que l’on prend lorsque l’on souhaite enseigner les tests d’hypothèses ! » (Atelier JN 2006 APMEP Clermont Ferrand) Ce ne sont pas le vocabulaire ou les formules qui apportent le sens Possibilités: ds croissance/décr, dans dérivée

Une approche possible dans le secondaire Parcours où stat et probas se rencontrent dès le début Mariage de raison pour répondre à des besoins précis – aspect incontournable, « fondamental » Statistique inférentielle (dite aussi « inductive » ou … « mathématique ») comme point de départ Nécessaire abandon de l’approche purement calculatoire Eviter « l’apprentissage inflationniste de vocabulaire » Formalisation définitive des probabilités par axiomes en finale

Un cas d’infrastructure manquante… … statistique et probabilités en classe de 3eme (Y. Chevallard + F. Wozniak) – atelier à l’école d’été de didactique des mathématiques Que pourrait être un scénario qui fait vivre les probabilités comme modélisant la variabilité statistique ? Inévitable question : en quoi et comment les probabilités modélisent-elles la variabilité statistique ?

Un cas d’infrastructure manquante… Elément-clé absent : la probabilité est regardée comme une approximation de la fréquence observable, plutôt que l’inverse; or La relation d’approximation est symétrique C’est le sens inverse qui est central dans la modélisation probabiliste de la variabilité statistique Autre manque essentiel : en stat/probas, on part d’un état de non-mathématisation préalable : la variabilité est extérieure aux maths (loi « expérimentale » des grands nombres) ; donc; en attente de mathématisation Poincaré : (loi normale) « Tout le monde y croit […] car les expérimentateurs s’imaginent qu’il s’agit d’un théorème de mathématiques et les mathématiciens que c’est un fait expérimental »

Un cas d’infrastructure manquante… Les règles de calcul : les axiomes de Kolmogorov naissent de la modélisation des fréquences empiriques – or : occultation de la « relation to experimental data » Processus d’oubli du fondement fréquentiste du calcul des probabilités, au profit de principes de symétrie et d’équiprobabilité, de la combinatoire Le calcul des probabilités devient une réalité en soi et pour soi : l’origine statistique semble perdue, refoulée; c’est même devenu une « fin en soi »

Un cas d’infrastructure manquante… Estimation contre pari Mis en avant : la problématique de l’estimation (proba inconnue, on l’estime par une fréquence observée sur une série de réalisations) La problématique statistique est le point de vue inverse : ayant estimé la probabilité, on veut prédire la fréquence qu’on s’attend à observer : c’est le pari qu’il faut privilégier plutôt que l’estimation

Stat/Probas - Quels liens ? La Statistique sans la théorie des Probabilités est aveugle et la théorie des Probabilités sans la Statistique est vide. (Hanss Schupp, in Studies in mathematics education. Vol 7. The teaching of statistics. Editions UNESCO, Paris, 1994)

Répartition des tâches (business model) Contexte: réalisation d’un test d’hypothèse en biostatistique

Obstacles majeurs identifiés Obstacles a priori à l’apprentissage de l’analyse statistique inférentielle (Calmant, Ducarme, Schneider, Statistique & Enseignement, 2011, Vol 2-1, « Expériences commentées ») 3 obstacles majeurs identifiés Non prise en compte de la variabilité Obstacle épistémologique Décodage d’ostensifs graphiques en termes X-Y Obstacle didactique Difficulté à concevoir des niveaux sémantiques plus abstraits Obstacle cognitif

Quelques suggestions de lecture Traité de didactique des mathématiques, pp118-131, pp182-188, pp230-233 Eléments de statistique (Dehon, Droesbeke, Vermandel) Que sais-je La statistique (Vessereau) Les probabilités (Jacquard) Histoire de la statistique (Droesbeke & Tassi) La probabilité, le hasard et la certitude (Deheuvels) L’induction statistique au Lycée (Dutarte)