La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Introduction à la statistique inférentielle Expérimentation en 6 e G Pierre Henrotay Hilda Rosseel Maggy Schneider ULg, Ladimath 1.

Présentations similaires


Présentation au sujet: "Introduction à la statistique inférentielle Expérimentation en 6 e G Pierre Henrotay Hilda Rosseel Maggy Schneider ULg, Ladimath 1."— Transcription de la présentation:

1 Introduction à la statistique inférentielle Expérimentation en 6 e G Pierre Henrotay Hilda Rosseel Maggy Schneider ULg, Ladimath 1

2 Le but poursuivi Introduire la statistique inférentielle, via la problématique des tests dhypothèses portant sur une situation : Introduire la statistique inférentielle, via la problématique des tests dhypothèses portant sur une situation : de la vie courante (industrielle) de la vie courante (industrielle) nécessitant une modélisation nécessitant une modélisation faisant intervenir un critère de décision faisant intervenir un critère de décision amenant à une étude fréquentiste amenant à une étude fréquentiste ne permettant une conclusion quavec un risque derreur ne permettant une conclusion quavec un risque derreur sans nécessité dun formalisme avancé ni algorithmes ou formules sans nécessité dun formalisme avancé ni algorithmes ou formules Terminer par un exemple plus proche des élèves : le QCM Terminer par un exemple plus proche des élèves : le QCM 2

3 Le contexte scolaire 1 classe de 13 élèves de 6e Humanités Générales 1 classe de 13 élèves de 6e Humanités Générales Math 4H Math 4H Connaissances en statistique disparates; un rappel sur la notion de fréquence a été fait Connaissances en statistique disparates; un rappel sur la notion de fréquence a été fait Déjà abordé : analyse combinatoire (y compris binôme de Newton) Déjà abordé : analyse combinatoire (y compris binôme de Newton) Probas : rien sauf un exposé sur la notion (« historique ») de probabilité Probas : rien sauf un exposé sur la notion (« historique ») de probabilité 4 séances de 50 minutes, travaux en groupes de séances de 50 minutes, travaux en groupes de 4-5 Inspiré de JM Parnaudeau (Lycée Poitiers) Inspiré de JM Parnaudeau (Lycée Poitiers) « Quelques hypothèses sur les risques que lon prend lorsque lon souhaite enseigner les tests dhypothèses ! » (Atelier JN 2006 APMEP Clermont Ferrand) 3

4 Jour 1-1 Après formation des groupes de réflexion (3 groupes de 4 à 5 élèves), la situation suivante est donnée aux élèves pour en débattre : 4

5 Quelques extraits menfin ce nest que 38 produits, peut-être que si on en prend 10000, ce sera quand même inférieur à 7%, peut-être que justement un grand nombre… menfin ce nest que 38 produits, peut-être que si on en prend 10000, ce sera quand même inférieur à 7%, peut-être que justement un grand nombre… on en a prélevé que 38 peut-être que lui (le responsable), il en avait justement prélevé beaucoup, en fait ça pourrait être 7% si ten prends 1000 on en a prélevé que 38 peut-être que lui (le responsable), il en avait justement prélevé beaucoup, en fait ça pourrait être 7% si ten prends 1000 si ça se met, il vend des camions, alors les 38…, cest déjà pas mal si ça se met, il vend des camions, alors les 38…, cest déjà pas mal ou alors il vend des cure-dents et 38, pf… ou alors il vend des cure-dents et 38, pf… en gros cest pas vrai mais comme cest un petit nombre… en gros cest pas vrai mais comme cest un petit nombre… 6/38, cest plus que 7% - ça paraît un peu fort 6/38, cest plus que 7% - ça paraît un peu fort tu fais 38*7/100 et tu regardes si cest plus grand… tu fais 38*7/100 et tu regardes si cest plus grand… ah 2,6 donc cest supérieur donc le mec il ment ; il ment pour vendre ses produits ah 2,6 donc cest supérieur donc le mec il ment ; il ment pour vendre ses produits 5

6 Idées en gestation rôle du hasard rôle du hasard variabilité, représentativité dun échantillon variabilité, représentativité dun échantillon taille dun échantillon et coût ou faisabilité dun sondage taille dun échantillon et coût ou faisabilité dun sondage critère de comparaison critère de comparaison rôle du testeur et type de risque derreur rôle du testeur et type de risque derreur 6

7 Jour 1-2 Les élèves sont invités à réfléchir en groupe aux questions suivantes (1-Q1 à 1-Q5) : 7

8 Quelques extraits le responsable de la fabrication le responsable de la fabrication ça peut être quelquun de malveillant pour lentreprise ; on en tient compte de ça ? ça peut être quelquun de malveillant pour lentreprise ; on en tient compte de ça ? on ne sait pas qui fait les mesures, on ne sait pas ses diplômes, cest peut-être le responsable, peut-être pas on ne sait pas qui fait les mesures, on ne sait pas ses diplômes, cest peut-être le responsable, peut-être pas ah non le responsable de la fabrication puisque cest lui qui affirme que… ah non le responsable de la fabrication puisque cest lui qui affirme que… on doit voir si 7% est juste ; 6/38 ça représente 16% en faisant une règle de 3 - ça en ferait 16 mauvais sur 100 on doit voir si 7% est juste ; 6/38 ça représente 16% en faisant une règle de 3 - ça en ferait 16 mauvais sur 100 avec 7%, ça ferait 2,63, y a sûrement un problème avec 7%, ça ferait 2,63, y a sûrement un problème et si on prenait le plus de produits possible ? et si on prenait le plus de produits possible ? si ça tombe, cest 7% de plein de produits quils ont pris et ici on nen a que 38 si ça tombe, cest 7% de plein de produits quils ont pris et ici on nen a que 38 les %, ils les ont peut-être trouvés sur plus, et cest ça que cest 7% les %, ils les ont peut-être trouvés sur plus, et cest ça que cest 7% 8

9 Un contexte à préciser Il y a bien problème, sinon on ne ferait rien Il y a bien problème, sinon on ne ferait rien Qui fait les mesures ? – lattitude peut-elle être différente ? (position acheteur/vendeur) Qui fait les mesures ? – lattitude peut-elle être différente ? (position acheteur/vendeur) Quelle garantie a-t-on que les mesures soient faites dans les mêmes conditions que celles du responsable de fabrication ? Quelle garantie a-t-on que les mesures soient faites dans les mêmes conditions que celles du responsable de fabrication ? Remise en cause : >7%, voire >>7% Remise en cause : >7%, voire >>7% Le responsable de fabrication ne souhaite pas être pris en défaut, donc il annonce probablement chiffre pessimiste, avec marge de sécurité Le responsable de fabrication ne souhaite pas être pris en défaut, donc il annonce probablement chiffre pessimiste, avec marge de sécurité 9

10 Jour Débriefing organisé par le professeur pour consolider les résultats ; les élèves restent en groupe et commentent leurs résultats Débriefing organisé par le professeur pour consolider les résultats ; les élèves restent en groupe et commentent leurs résultats Puis, les élèves réexplorent en groupe les questions 1- Q1 à 1-Q5 Puis, les élèves réexplorent en groupe les questions 1- Q1 à 1-Q5 10

11 Quelques extraits 38 cest pas énorme, faut une quantité beaucoup plus grande 38 cest pas énorme, faut une quantité beaucoup plus grande ça ne correspond pas à ce qui est annoncé ça ne correspond pas à ce qui est annoncé cest une trop petite quantité, et on ne peut pas juger : il y a peut- être beaucoup de problèmes dans les produits quil a pêchés, ce nest que 38, on ne peut pas juger cest une trop petite quantité, et on ne peut pas juger : il y a peut- être beaucoup de problèmes dans les produits quil a pêchés, ce nest que 38, on ne peut pas juger sil prend les 38 produits daprès, il aura peut-être moins de défaut sil prend les 38 produits daprès, il aura peut-être moins de défaut le responsable de la fabrication : il veut améliorer la qualité, il essaie de faire moins pour diminuer le nombre de défauts le responsable de la fabrication : il veut améliorer la qualité, il essaie de faire moins pour diminuer le nombre de défauts 11

12 Quelques extraits (la discussion porte sur la situation : le responsable a fait les mesures) (la discussion porte sur la situation : le responsable a fait les mesures) on veut optimaliser la vente, on veut que ce soit rentable on veut optimaliser la vente, on veut que ce soit rentable on veut une qualité du produit on veut une qualité du produit pour améliorer le produit pour améliorer le produit le responsable de la production, il le sait : il essaie de le prouver (que cest moins), de se rassurer, rien na changé le responsable de la production, il le sait : il essaie de le prouver (que cest moins), de se rassurer, rien na changé pour être sûr que cest inférieur à 7% pour être sûr que cest inférieur à 7% une machine qui déconne une machine qui déconne (la discussion porte sur la situation : le client a fait les mesures) (la discussion porte sur la situation : le client a fait les mesures) on essaie de prouver quil y a plusieurs défauts on essaie de prouver quil y a plusieurs défauts on essaie de prouver quil y a « jamais plus de 7% de défauts » cest faux on essaie de prouver quil y a « jamais plus de 7% de défauts » cest faux 12

13 Quelques extraits (la discussion porte sur les conditions de lexpérience) (la discussion porte sur les conditions de lexpérience) sur une quantité plus grande sur une quantité plus grande ça dépend par rapport à qui cest ça dépend par rapport à qui cest ça dépend des critères ça dépend des critères le client ne va pas acheter 38 produits le client ne va pas acheter 38 produits le nombre de produits testés, on doit tjrs prendre le même nombre de produits le nombre de produits testés, on doit tjrs prendre le même nombre de produits le même genre de test, la manière dont on les teste le même genre de test, la manière dont on les teste il faut un classement il faut un classement les outils pour le tester les outils pour le tester sur une même période sur une même période faut pas quon ait remplacé des machines, sinon la valeur sera faussée faut pas quon ait remplacé des machines, sinon la valeur sera faussée faut les prendre au même moment faut les prendre au même moment on va les prendre au hasard, par ex le 1 er qui vient, puis le 17 e … on va les prendre au hasard, par ex le 1 er qui vient, puis le 17 e … 13

14 Idées en gestation nécessaires garanties sur le prélèvement nécessaires garanties sur le prélèvement prélèvement au hasard prélèvement au hasard rôle du hasard (fluctuation déchantillonnage) rôle du hasard (fluctuation déchantillonnage) échantillon vs population échantillon vs population risque vendeur vs acheteur risque vendeur vs acheteur estimation à partir dun échantillon estimation à partir dun échantillon représentativité de léchantillon représentativité de léchantillon biais possible biais possible 14

15 Jour 1-5 Le professeur propose de réécrire le problème : Faisons comme si 7% était bien le taux de défectueux. On laisse donc le maximum de chances au responsable de la fabrication. Si on est un client mécontent : on se met dans le pire des cas, on laisse le bénéfice du doute. => hypothèse statistique 15

16 Jour Les élèves sont invités à réfléchir en groupe aux questions 2-Q1 à 2-Q2 On se quitte sur un double malaise : Ça semble beaucoup Ça semble beaucoup 7% cest entre 2 et 3, mais pas un nombre entier 7% cest entre 2 et 3, mais pas un nombre entier

17 Quelques extraits ça ne tombe pas juste ça ne tombe pas juste cest bizarre cest bizarre cest le double cest le double sur le total de la production ça irait encore sur le total de la production ça irait encore 15% cest pas énorme 15% cest pas énorme de 7 à 15, cest le double de 7 à 15, cest le double il na pas pris assez de marge de sécurité : il a dit 7, cest 15… cest beaucoup il na pas pris assez de marge de sécurité : il a dit 7, cest 15… cest beaucoup il y a trop de produits défectueux, il na pas pris assez de marge de sécurité il y a trop de produits défectueux, il na pas pris assez de marge de sécurité 17

18 Jour 2-1 Résumé par le professeur de la séance précédente Résumé par le professeur de la séance précédente Après formation des groupes de réflexion, les questions 3-Q1 à 3-Q4 sont données aux élèves Après formation des groupes de réflexion, les questions 3-Q1 à 3-Q4 sont données aux élèves 18 => variabilité, fluctuations, loi des grands nombres

19 Quelques extraits on sattend à moins : 2 à 3 si on croit le responsable on peut faire autant de prélèvements de 38 quon veut, ça peut être moins, ça peut être plus si on faisait beaucoup de prélèvements de 38, on aurait 2 ou 3 à chaque fois, ça devrait être plutôt entre 2 et 3, pour le 7% il se pourrait très bien, sur les 38 quon vient de prendre juste maintenant, quil ny en ait aucun qui soit défectueux il peut y en avoir jusquà 38 défectueux la pire des situations : 38 et la meilleure : 0 – on peut tout obtenir entre 19

20 Jour Débriefing organisé par le professeur pour consolider les résultats; les élèves restent en groupe et commentent leurs résultats Débriefing organisé par le professeur pour consolider les résultats; les élèves restent en groupe et commentent leurs résultats Les questions 4-Q1 et 4-Q2 sont abordées en commun Les questions 4-Q1 et 4-Q2 sont abordées en commun 20

21 Quelques extraits on pourrait faire une moyenne si on fait plusieurs prélèvements de 38 il y a peut-être un nombre qui se répétera, qui arrivera plus souvent quun autre il y en aura sûrement au minimum 2 ou 3, pour les 7% on fait au hasard on le garde près de soi et on ne le remet pas sinon on ressortirait tt le temps le même défectueux (le modèle de lurne est introduit) oui mais ça veut dire quon peut tirer 38 blanches, donc aucune noire, aucun défaut 21

22 Quelques extraits cest totalement au hasard on en tire 1 on va décider si … il est bon ou pas on en tire un autre, non dabord on note puis on en prend un autre jusque 38 on le garde près de soi, on ne le remet pas 22

23 Jour Modèle = nécessité de sentendre sur les « garanties », les conditions de lexpérience, du prélèvement Modèle = nécessité de sentendre sur les « garanties », les conditions de lexpérience, du prélèvement on prélève un produit, on teste, on note, on prend un autre produit, on sarrête après 38 on prélève un produit, on teste, on note, on prend un autre produit, on sarrête après 38 le produit est fabriqué en grande quantité – sinon ? (prélever modifie la proportion de défectueux) le produit est fabriqué en grande quantité – sinon ? (prélever modifie la proportion de défectueux) le responsable de production dit vrai (on fait une hypothèse) le responsable de production dit vrai (on fait une hypothèse) on prélève au hasard (le lundi est un jour difficile) on prélève au hasard (le lundi est un jour difficile) => utilité dun modèle, urne, tirage exhaustif ou non 23

24 Jour 2-4 La question 5-Q1 est abordée en commun 24

25 Les caractéristiques communes Caractéristiques Caractéristiques tirage individuel : succès ou échec tirage individuel : succès ou échec on répète : plusieurs tirages on répète : plusieurs tirages entre tirages : rapport des fréquences inchangé entre tirages : rapport des fréquences inchangé on sintéresse au nombre de succès (ou déchecs) on sintéresse au nombre de succès (ou déchecs) pas de mémoire dun résultat à lautre (indépendance et non-exhaustivité) pas de mémoire dun résultat à lautre (indépendance et non-exhaustivité) => tirage de Bernoulli, « succès vs échec », absence de mémoire, indépendance 25

26 Jour 2-5 Les questions 7-Q1 à 7-Q4 sont distribuées mais seules 7-Q1 et 7-Q2 sont abordées ce jour en groupe Les questions 7-Q1 à 7-Q4 sont distribuées mais seules 7-Q1 et 7-Q2 sont abordées ce jour en groupe 26

27 Quelques extraits 0 sur 38 cest bien mais il peut toujours y avoir un défectueux, ce sera rare mais moins 0 sur 38 cest bien mais il peut toujours y avoir un défectueux, ce sera rare mais moins on devrait avoir 0 plus souvent que 6 mais je ne sais pas pourquoi on devrait avoir 0 plus souvent que 6 mais je ne sais pas pourquoi le 0 est plus près de 2-3 que 6 : on devrait avoir plus souvent 0 que 6 le 0 est plus près de 2-3 que 6 : on devrait avoir plus souvent 0 que 6 oui mais 2-3 cest juste au milieu oui mais 2-3 cest juste au milieu 0 sur 38 ça pourrait arriver, 38 sur 38 aussi 0 sur 38 ça pourrait arriver, 38 sur 38 aussi 38/38 cest plus rare : on a quand même plus de bonnes que de mauvaises 38/38 cest plus rare : on a quand même plus de bonnes que de mauvaises 0/38, ça va arriver plus souvent que 6 0/38, ça va arriver plus souvent que 6 ce qui arrivera le plus souvent, cest darriver entre 2 et 3 ce qui arrivera le plus souvent, cest darriver entre 2 et 3 0 est plus près que 6 de 2-3, donc 0 sera plus souvent 0 est plus près que 6 de 2-3, donc 0 sera plus souvent 6 cest vache : 0 par rapport à 3 et 6 par rapport à 3… 6 cest vache : 0 par rapport à 3 et 6 par rapport à 3… => valeur attendue (espérance), comment quantifier la dispersion, distribution, asymétrie 27

28 Jour Résumé par le professeur de la séance précédente Résumé par le professeur de la séance précédente Répondre à un besoin de chiffrer notre « bon sens » : Répondre à un besoin de chiffrer notre « bon sens » : 38/38 rarissime, 0/38 rare 38/38 rarissime, 0/38 rare entre 2 et 3/38 le plus fréquent, si 7% de défectueux … mais encore ? entre 2 et 3/38 le plus fréquent, si 7% de défectueux … mais encore ? Les questions 7-Q3 et 7-Q4 sont discutées en commun Les questions 7-Q3 et 7-Q4 sont discutées en commun 28

29 Lanalyse combinatoire à la rescousse Vérifions par dénombrements : Vérifions par dénombrements : une urne, 100 billes : 93 B et 7 N une urne, 100 billes : 93 B et 7 N on en tire 38, lune après lautre, avec remise on en tire 38, lune après lautre, avec remise 29

30 Jour Q1 est discutée en commun 30

31 Et le hasard dans tout cela ? On a fait un dénombrement ! Lanalyse précédente repose sur un comptage : les dénombrements obtenus en tirant de notre urne de toutes les manières possibles (il y en a ) ; évidemment, ce nest pas tout à fait conforme à la réalité, où on fait un ou quelques prélèvement(s) de 38 => Fréquences vs probabilités, lois des grands nombres, confiance en une « régularité statistique » 31

32 Comparons… 32

33 Jour 4-1 Résumé de la séance précédente fait par le professeur Résumé de la séance précédente fait par le professeur Les questions 9-Q1 à 9-Q5 sont remises aux élèves Les questions 9-Q1 à 9-Q5 sont remises aux élèves Réflexion en 3 groupes sur 9-Q1 à 9-Q2 Réflexion en 3 groupes sur 9-Q1 à 9-Q2 33

34 Jour 4 34

35 Jour 4-2 Débriefing par le professeur Débriefing par le professeur Retour sur la notion dhypothèse Retour sur la notion dhypothèse Questions 9-Q2 à 9-Q5 abordées en groupe Questions 9-Q2 à 9-Q5 abordées en groupe => Hypothèse nulle et alternative, seuil, risque de rejeter lhypothèse alors quelle est vraie (1ere espèce) 35

36 Quelques extraits (le professeur : si jétais le responsable de la production, je pourrais dire : quest-ce qui vous autorise à ne pas me croire) (le professeur : et 6 ou plus, ça arrive souvent ?) ça arrivera rarement 3% non cest pour 6 seulement cest la somme, il faut faire la somme (le professeur : donc on peut rejeter à tort – avec quelle fréquence ?) on va se tromper 4 fois sur 100 à peu près (le professeur introduit la notion de seuil, d erreur de 1ere espèce : je vais me plaindre quand ça dépasse le seuil de 5%) le seuil, cest accepter de se tromper 36

37 Jour 4-3 Les questions 10-Q1 à 10-Q4 sont remises aux élèves Les questions 10-Q1 à 10-Q4 sont remises aux élèves 37

38 Risques et types derreurs Rejeter hypothèse > < déclarer fausse Ne pas rejeter hypothèse > < déclarer vraie Types derreur Types derreur erreur 1e espèce : rejeter hypothèse nulle alors que vraie ; à un seuil de 5% : le risque de se tromper est de 5 cas sur 100 erreur 1e espèce : rejeter hypothèse nulle alors que vraie ; à un seuil de 5% : le risque de se tromper est de 5 cas sur 100 erreur 2e espèce : accepter hypothèse nulle alors que fausse ; le risque de se tromper dépend de notre hypothèse alternative erreur 2e espèce : accepter hypothèse nulle alors que fausse ; le risque de se tromper dépend de notre hypothèse alternative On veut essayer de minimiser les 2 risques à la fois or cest antagoniste On veut essayer de minimiser les 2 risques à la fois or cest antagoniste 38

39 Quelques extraits (le professeur introduit la notion dhypothèse nulle) elle nest pas correcte, cest pas faux mais pas non plus… je ne sais pas comment expliquer le risque de se tromper en disant elle est fausse est faible 39

40 Jour 4-4 Illustration des concepts introduits par une simulation de QCM : Illustration des concepts introduits par une simulation de QCM : 20 questions, 3 propositions chacune, une seule vraie 20 questions, 3 propositions chacune, une seule vraie Si pas étudié : Si pas étudié : 1 chance sur 3 de réussir une question individuelle 1 chance sur 3 de réussir une question individuelle Décision : on buse lélève sil a moins de 11 : on élimine 96 sur 100 mais 4 sur 100 passent malgré tout Décision : on buse lélève sil a moins de 11 : on élimine 96 sur 100 mais 4 sur 100 passent malgré tout Si un peu étudié (6 chances sur 10 par question) : Si un peu étudié (6 chances sur 10 par question) : moins de 11 dans 24 cas sur 100 ; donc environ 1 sur 4 de ceux qui ont étudié seront éliminés malgré tout moins de 11 dans 24 cas sur 100 ; donc environ 1 sur 4 de ceux qui ont étudié seront éliminés malgré tout Inspiré de : Dutarte Ph., L'induction statistique au lycée, Didier,

41 Quelques extraits (professeur : comment séparer bons et mauvais au QCM) à la proposition de mettre la cote à 8 au lieu de 10 il y en a plus qui vont passer à la proposition de mettre la cote à 11 ou 12 ceux qui ont étudié vont en pâtir aussi sur quoi jouer alors ? il faut poser plus de questions 41


Télécharger ppt "Introduction à la statistique inférentielle Expérimentation en 6 e G Pierre Henrotay Hilda Rosseel Maggy Schneider ULg, Ladimath 1."

Présentations similaires


Annonces Google