La distribution normale
Plan Distribution de fréquences: page 3 Distribution normale: page 14 Théorème central limite: page 26 Utilisation de la distribution normale standardisée: page 33
Idée de la distribution normale On lance 2 dés et on regarde la somme = 7 Le nombre totale de possibilités est de : 6x6=36 possibilités
Simulation par Monte Carlo Nombre d’essais = 10
Simulation par Monte Carlo Nombre d’essais = 50
Simulation par Monte Carlo Nombre d’essais = 200
Simulation par Monte Carlo Nombre d’essais = 1000
Simulation par Monte Carlo Nombre d’essais = 5000
Simulation par Monte Carlo Nombre d’essais = 50 000
Simulation par Monte Carlo Nombre d’essais = 200 000
Résultats théoriques Somme Possibilité 2 (1,1) 3 (1,2) (2,1) 4 (1,3) (2,2) (3,1) 5 (1,4) (2,3) (3,2) (4,1) 6 (1,5) (2,4) (3,3) (4,2) (5,1) 7 (1,6) (2,5) (3,4) (4,3) (5,2) (6,1) 8 (2,6) (3,5) (4,4) (5,3) (6,2) 9 (3,6) (4,5) (5,4) (6,3) 10 (4,6) (5,5) (6,4) 11 (5,6) (6,5) 12 (6,6)
Résultats théoriques Probabilité % Somme Possibilités 1/36 2,78 2 (1,1) 2/36 5,56 3 (1,2) (2,1) 3/36 8,33 4 (1,3) (2,2) (3,1) 4/36 11,11 5 (1,4) (2,3) (3,2) (4,1) 5/36 13,89 6 (1,5) (2,4) (3,3) (4,2) (5,1) 6/36 16,67 7 (1,6) (2,5) (3,4) (4,3) (5,2) (6,1) 8 (2,6) (3,5) (4,4) (5,3) (6,2) 9 (3,6) (4,5) (5,4) (6,3) 10 (4,6) (5,5) (6,4) 11 (5,6) (6,5) 12 (6,6) =36/36 = 100
Simulation par Monte Carlo Distribution d’échantillonnage de la somme de 2 dés
Distribution normale Ce type de distribution est rencontrée régulièrement dans la nature (grandeur, poids, habiletés, propriétés psychologiques, etc.) Existe-il une formule mathématique qui pourrait ajuster ces données empiriques ?
Distribution normale Distribution d’échantillonnage de la somme de 2 dés
Distribution normale Définition: fonction mathématique qui décrit des phénomènes pour un n élevé. Propriétés: - Unimodale et symétrique (autour de la moyenne) - Mode = Médiane = Moyenne - Asymptotique à l’abscisse (la courbe ne touche jamais l’axe des x) m = 50 s = 2 Fonction de densité
Probabilité d’observation Quelle est la probabilité d’obtenir une somme de 8 ? p(8) =Aire du bâtonnet p(8) = basehauteur p(8) = 15/36 = 5/36 6/36 5/36 4/36 3/36 2/36 1/36 2 4 6 8 10 12
Probabilité d’observation Supposons que la taille des bâtonnets est divisée en 2 1/36 2/36 3/36 4/36 5/36 6/36 2 3 4 5 6 7 8 9 10 11 12 1/36 2/36 3/36 4/36 5/36 6/36 2 3 4 5 6 7 8 9 10 11 12
Probabilité d’observation Encore et encore … 1/36 2/36 3/36 4/36 5/36 6/36 2 3 4 5 6 7 8 9 10 11 12 1/36 2/36 3/36 4/36 5/36 6/36 2 3 4 5 6 7 8 9 10 11 12
Probabilité d’observation … infini 1/36 2/36 3/36 4/36 5/36 6/36 2 3 4 5 6 7 8 9 10 11 12 1/36 2/36 3/36 4/36 5/36 6/36 2 3 4 5 6 7 8 9 10 11 12
Probabilité d’observation Quelle est la probabilité d’obtenir une somme de 8 ? p(8) =Aire du bâtonnet p(8) = 0hauteur p(8) = 05/36 = 0 1/36 2/36 3/36 4/36 5/36 6/36 2 3 4 5 6 7 8 9 10 11 12 On ne peut donc plus connaître la probabilité d’une somme donnée !
Fréquences cumulatives Solution: Fréquences cumulatives Si on veut p(8), alors on fait la différence entre 2 fréquences cumulatives => f.c.(8)-f.c.(7) 1/36 2/36 3/36 4/36 5/36 6/36 2 3 4 5 6 7 8 9 10 11 12 f.c.(8) = (1+2+3+4+5+6+5)/36=26/36 f.c.(7) = (1+2+3+4+5+6)/36=21/36 => f.c.(8) - f.c.(7) = (26-21)/36 = 5/36
Fonction de densité cumulée Distribution normale De façon similaire, pour connaître la probabilité d’un score x quelconque sous la courbe normale, il faut calculer l’aire sous la courbe (intégrer) de -∞ jusqu’à x. x Fonction de densité cumulée x
Distribution normale standard Comme il existe une infinité de valeurs que peuvent prendre les paramètres m et s, par convention on parle de distribution normale standard si m = 0 et s = 1. PDF Z
Distribution normale standard Ex. z = -1,75
Théorème central limite Même si la distribution initiale n’est pas normale, la distribution des moyennes d’échantillonnage le sera Ex.: x={1, 1, 1, 2, 2, 3}
Théorème central limite Exemple x={1, 1, 1, 2, 2, 3} On tire des échantillons n=10 un très grand nombre de fois. Pour chaque série on calcul la moyenne. t1={2,2,3,2,3,3,2,2,1,3}=> moyenne = 2.3 t2={3,2,2,2,1,2,1,2,2,2} => moyenne = 1.9 t3={1,1,3,2,1,2,1,2,1,1} => moyenne = 1.5 t10000000 = {1,2,1,3,2,1,3,1,3,3} => moyenne = 2.0 Puis, on regarde la distribution de ces moyennes.
Simulation par Monte Carlo Nombre d’essais = 10 Moyenne = 1.760 Écart-type = 0.225
Simulation par Monte Carlo Nombre d’essais = 100 Moyenne = 1,663 Écart-type = 0,232
Simulation par Monte Carlo Nombre d’essais = 1000 Moyenne = 1,666 Écart-type = 0,240
Simulation par Monte Carlo Nombre d’essais = 10 000 Moyenne = 1,668 Écart-type = 0,235
Simulation par Monte Carlo Nombre d’essais = 100 000 Moyenne = 1,668 Écart-type = 0,235
Utilisation de la distribution normale Quelle est la proportion de données qui est en dessous d’un score spécifique ? Pour utiliser la table des z, il faut transformer toute distribution normale en une distribution normale standardisée (m=0, s=1) Solution: Transformation en score z Logique de cette transformation : Soustrait une quantité de la distribution. Moy = 0 É.-t. = 1 Moy = 50 É.-t. = 2
Utilisation de la distribution normale Moy = 0 É.-t. = 1 Moy = 50 É.-t. = 2 distribution-10 Moy = 40 É.-t. = 2 distribution-20 Moy = 30 É.-t. = 2
Utilisation de la distribution normale Moy = 0 É.-t. = 1 Moy = 30 É.-t. = 2 distribution-30 Moy = 20 É.-t. = 2 distribution-40 Moy = 10 É.-t. = 2
Utilisation de la distribution normale Moy = 0 É.-t. = 1 Moy = 10 É.-t. = 2 distribution-50 Moy = 0 É.-t. = 2 Donc, si on soustrait la moyenne de la distribution, sa nouvelle moyenne sera effectivement 0.
Utilisation de la distribution normale -On divise le résultat de la soustraction par une autre quantité Moy = 0 É.-t. = 1 É.-t = 2 (distribution-50)/1.25 Moy = 0 É.-t. = 1 É.-t = 1.75
Utilisation de la distribution normale - Divise le résultat de la soustraction par une autre quantité Moy = 0 É.-t. = 1 É.-t = 1.75 (distribution-50)/1.5 Moy = 0 É.-t. = 1 É.-t = 1.5
Utilisation de la distribution normale - Divise le résultat de la soustraction par une autre quantité Moy = 0 É.-t. = 1 É.-t = 1. 5 (distribution-50)/1.75 Moy = 0 É.-t. = 1 É.-t = 1.25
Utilisation de la distribution normale - Divise le résultat de la soustraction par une autre quantité Moy = 0 É.-t. = 1 É.-t = 1. 25 (distribution-50)/2 Moy = 0 É.-t. = 1 É.-t = 1
Utilisation de la distribution normale - Divise le résultat de la soustraction par une autre quantité (distribution-50)/2 Moy = 0 É.-t. = 1 É.-t = 1 Donc, si on soustrait la moyenne de la distribution, sa nouvelle moyenne sera effectivement 0. Et si on divise le résultat de cette soustraction par l’écart-type, alors le nouvel écart-type de la distribution sera de 1.
Utilisation de la distribution normale suite Quelle est la proportion de données qui est en dessous d’un score spécifique ? Ex.1 : x = 3,70 moy = 2,93 é.t. = 0,33 Solution: Transformation en score z (nombre d’écart types standards entre x et la moyenne)
Utilisation de la distribution normale suite Quelle est la proportion de données qui est au dessus d’un score spécifique ? Ex.2 : x = 2,50 moy = 2,93 é.t. = 0,33
Utilisation de la distribution normale suite Quelle est la proportion de données qui est comprise entre 2 scores spécifiques ? Ex.3 : x1 = 3,00 ; x2 = 2,85 moy = 2,93 é.t. = 0,33
Utilisation de la distribution normale suite Quelle est la proportion de données qui est comprise entre 2 scores spécifiques ?
Utilisation de la distribution normale suite À quel score correspond une proportion de 85% en dessous de la moyenne ? Ex.4 : x = ? moy = 2,93 é.t. = 0,33