La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Statistiques et probabilité : Au collège :. Continuité dans les apprentissages. Apprentissage progressif des arbres pondérés de la troisième à la première.

Présentations similaires


Présentation au sujet: "Statistiques et probabilité : Au collège :. Continuité dans les apprentissages. Apprentissage progressif des arbres pondérés de la troisième à la première."— Transcription de la présentation:

1 Statistiques et probabilité : Au collège :

2 Continuité dans les apprentissages. Apprentissage progressif des arbres pondérés de la troisième à la première. (Cette notion est essentielle à la bonne compréhension des probabilités.)

3 En seconde

4 Notion déchantillon Dans le sens commun des sondages, un échantillon est un sous ensemble obtenu par prélèvement aléatoire dans un population.

5 Intervalle de fluctuation dune fréquence au seuil de 95 %

6 Propriété : Connaissant la proportion p (0,2p0,8) dindividus dans une population, la fréquence dun certain caractère dans un échantillon de taille n, n 25 appartient à lintervalle [p-1/rac(n) ; p+1/rac(n)] avec une probabilité dau moins 95% Cas où la proportion est connue :

7 Exemple : « La parité, cest quoi ? » Deux entreprises A et B recrutent dans une région où il y a autant dhommes que de femmes. Dans lentreprise A, il y a 100 employées dont 43 femmes. Dans lentreprise B, il y a 2500 employés dont 1150 femmes. Quelle entreprise respecte le mieux la parité ?

8 Dans lentreprise A, lintervalle de fluctuation est [0,4 ; 0,6] et 43% appartient à cet intervalle. Dans lentreprise B, lintervalle de fluctuation est [0,48 ; 0,52] et 46% nappartient pas à cet intervalle. Dans lentreprise B la proportion 46% sobserve dans moins de 5% des échantillons, donc on peut rejeter lhypothèse quelle respecte mieux la parité que lentreprise A, contrairement aux apparences

9 Cas où la proportion nest pas connue : Propriété : Dans une population, on désire estimer la proportion inconnue p dun caractère donné. On étudie, pour cela, un échantillon de taille n, n 25. Le caractère étudié apparait avec la fréquence f (0,2f0,8). On peut estimer, que la proportion p est dans lintervalle [f-1/rac(n) ; f+1/rac(n)] avec une probabilité dau moins 95%

10 Explication de lintervalle de fluctuation de la classe de seconde

11 Nouveau programme en 1 ère S Statistiques et probabilité : Les points majeurs : La loi géométrique tronquée La loi binomiale Échantillonnage et prise de decision

12 CONTENUSCAPACITES ATTENDUESCOMMENTAIRES Modèle de la répétition dexpériences identiques et indépendantes à deux ou trois issues. Représenter la répétition dexpériences identiques et indépendantes par un arbre pondéré. Utiliser cette représentation pour déterminer la loi dune variable aléatoire associée à une telle situation. Pour la répétition dexpériences identiques et indépendantes, la probabilité dune liste de résultats est le produit des probabilités de chaque résultats. La notion de probabilité conditionnelle est hors programme. On peut aussi traiter quelques situations autour de la loi géométrique tronquée. On peut simuler la loi géométrique tronquée avec un algorithme.

13 1.Loi géométrique tronquée Les situations de répétitions d'une expérience aléatoire, dans des conditions d'indépendance constituent un élément fort du programme de première. L'introduction de la loi géométrique tronquée présente de nombreux avantages : – travailler sur des répétitions d'une expérience de Bernoulli ; – envisager ces répétitions sous l'angle algorithmique ; – présenter une situation d'arbre pour lequel tous les chemins n'ont pas la même longueur ; – exploiter dans un autre cadre les propriétés des suites géométriques ; – exploiter dans un autre cadre des résultats sur la dérivation.

14 Exemple pour n=4 Déterminons la loi de X. X = 0 si aucun succès n'a été obtenu donc avec l'outil arbre: P(X = 0) = (1-p) Pour 1 k n, avec l'arbre, le premier succès est obtenu à l'étape k pour le chemin qui présente dans l'ordre (k – 1) échecs et un succès d'où : P(X = k) = (1 – p) p s e s e s e s e 1-p p p p p n k-1 Définition Soit p un réel de l'intervalle ]0, 1[ et n un entier naturel non nul. On considère l'expérience aléatoire qui consiste à répéter dans des conditions identiques une expérience de Bernoulli de paramètre p avec au maximum n répétitions et arrêt du processus au premier succès. On appelle loi géométrique tronquée de paramètres n et p la loi de la variable aléatoire X définie par : X = 0 si aucun succès n'a été obtenu ; pour 1 k n, X = k si le premier succès est obtenu à l'étape k.

15 CONTENUSCAPACITES ATTENDUESCOMMENTAIRES Epreuve de Bernoulli, loi de Bernoulli. Schéma de Bernoulli, loi binomiale (loi du nombre de succès) Coefficients binomiaux, triangle de Pascal. Reconnaître des situations relevant de la loi binomiale. Calculer une probabilité dans le cadre de la loi binomiale. Démontrer que : ( ) + ( ) = ( ) Représenter graphiquement la loi binomiale. La représentation à laide dun arbre est privilégiée : il sagit ici dinstaller une représentation mentale efficace. On peut ainsi : - Faciliter la découverte de la loi binomiale pour des petites valeurs de n (n 4); - Introduire le coefficient binomial ( ) comme nombre de chemins de larbre réalisant k succès pour n répétitions; - Etablir enfin la formule générale de la loi binomiale. Cette égalité est établie en raisonnant sur le nombre de chemin réalisant k+1 succès pour n+1 répétitions. On établit également la propriété de symétrie des coefficients binomiaux. Lutilisation des coefficients binomiaux dans des problèmes de dénombrement et leur écriture à laide des factorielles ne sont pas des attendus du programme. En pratique, on utilise une calculatrice ou un logiciel pour obtenir les valeurs des coefficients binomiaux, calculer directement des probabilités et représenter graphiquement la loi binomiale. nknk nknk n k+1 n+1 k+1

16 Loi binomiale 1 – Découverte de la loi binomiale et introduction des coefficients binomiaux Répétition d'une épreuve de Bernoulli de paramètre p quelconque On répète 4 fois cette épreuve. Nous représentons cette répétition par un arbre pondéré à 4 niveaux On note ( ) et on lit « 1 parmi 4 » le nombre de chemins qui conduisent à 1 succès exactement. Ici ( ) = 4 On décide cette fois de répéter 5 fois cette épreuve de Bernoulli et on note toujours X la variable aléatoire correspondant au nombre de succès obtenus à lissue des 5 répétitions. La répétition de larbre devient fastidieuse. Nous allons déterminer le nombre ( ) « 2 parmi 5 » le nombre de chemins qui conduisent à 2 succès. Déterminons ce nombre en utilisant larbre déjà réalisé pour 4 répétitions. 5252

17 Il y a 2 façons dobtenir 2 succès suivant quà la dernière étape on obtient un succès ou un échec. Si la dernière étape donne un échec, il faut compter les chemins qui au niveau précédent conduisaient déjà à 2 succès. Avec larbre déjà réalisé, on sait que 6 chemins sont dans ce cas. Si la dernière étape donne un succès, il faut compter les chemins qui au niveau précédent conduisaient à un seul succès. Avec larbre déjà réalisé, on sait que 4 chemins sont dans ce cas. En conclusion, 6+4=10 chemins de larbre des 5 répétitions conduisent à 2 succès, soit avec les notations introduites : ( ) = ( ) + ( )

18

19 2.Formule générale de la loi binomiale La probabilité de chacun des chemins qui réalisent exactement k succès est p (1 – p). On obtient donc : soient un entier naturel n et un réel p de l'intervalle [0, 1]. La variable aléatoire X correspondant au nombre de succès dans la répétition de n épreuves de Bernoulli de paramètre p suit la loi binomiale B(n, p) avec pour tout entier k compris entre 0 et n : p(X=k) = ( )p (1-p) kn-k k nknk

20 CONTENUSCAPACITES ATTENDUESCOMMENTAIRES Échantillonnage Utilisation de la loi binomiale pour une prise de décision à partir dune fréquence. Exploiter lintervalle de fluctuation à un seuil donné, déterminé à laide de la loi binomiale, pour rejeter ou non une hypothèse sur une proportion Lobjectif est damener les élèves à expérimenter la notion de « différence significative » par rapport à une valeur attendue et à remarquer que, pour une taille de léchantillon importante, on conforte les résultats vus en classe de seconde. Lintervalle de fluctuation peut être déterminé à laide dun tableur ou dun algorithme. Le vocabulaire des tests (test dhypothèse, hypothèse nulle, risque de première espèce) est hors programme.

21 Fluctuation déchantillonnage 1.Positionnement du problème à laide dun exemple. Un médecin de santé publique veut savoir si, dans sa région, le pourcentage dhabitants atteints dhypertension artérielle est égal à la valeur de 16 % récemment publiée pour des populations semblables. En notant p la proportion dhypertendus dans la population de sa région, le médecin formule lhypothèse p = 0,16. Pour vérifier cette hypothèse, le médecin constitue un échantillon de n = 100 habitants de la région, dont il détermine la fréquence f dhypertendus (léchantillon est prélevé au hasard et la population est suffisamment importante pour considérer quil sagit de tirages avec remise). Lorsque la proportion dans la population vaut p = 0,16, la variable aléatoire X correspondant au nombre dhypertendus observé dans un échantillon aléatoire de taille n = 100, suit la loi binomiale de paramètres n = 100 et p = 0,16.

22 On cherche à partager lintervalle [0, 100], où X prend ses valeurs, en trois intervalles [0, a – 1], [a, b] et [b + 1, 100] de sorte que X prenne ses valeurs dans chacun des intervalles extrêmes avec une probabilité proche de 0,025, sans dépasser cette valeur. En tabulant les probabilités cumulées P(X <= k), pour k allant de 0 à 100, il suffit de déterminer le plus petit entier a tel que P(X 0,025 et le plus petit entier b tel que P(X 0,975. On lit a = 9 et b = 23.

23 La règle de décision est la suivante : si la fréquence observée f appartient à lintervalle de fluctuation à (au moins) 95 % [a/n, b/n] = [0,09 ; 0,23], on considère que lhypothèse selon laquelle la proportion dhypertendus dans la population est p = 0,16 nest pas remise en question et on laccepte ; sinon, on rejette lhypothèse selon laquelle cette proportion vaut p = 0,16. Zone de rejet à gauche : au plus 2,5 % Zone de rejet à droite : au plus 2,5 % Intervalle de fluctuation : au moins 95 % a b

24 2.Définition de lintervalle de fluctuation à 95 % déterminé dans une situation bilatérale à laide de la loi binomiale Définition : lintervalle de fluctuation à 95 % dune fréquence correspondant à la réalisation, sur un échantillon aléatoire de taille n, dune variable aléatoire X de loi binomiale, est lintervalle [a/n, b/n ] défini par : a est le plus petit entier tel que P(X 0,025 ; b est le plus petit entier tel que P(X 0, Comparaison de lintervalle de fluctuation de première avec lintervalle de fluctuation exploité en classe de seconde Le programme des classes de premières S, ES et STI2D-STL, demande de comparer, pour une taille de léchantillon importante, cet intervalle avec lintervalle de fluctuation exploité en classe de seconde. On pourra le faire lors dexemples (sur des tailles déchantillon importantes) pour conforter les résultats vus en seconde


Télécharger ppt "Statistiques et probabilité : Au collège :. Continuité dans les apprentissages. Apprentissage progressif des arbres pondérés de la troisième à la première."

Présentations similaires


Annonces Google