La distribution normale

Slides:



Advertisements
Présentations similaires
Introduction à l’analyse
Advertisements

L’échantillonnage & Ses Fluctuations
Présentation des données
2-3-4 : Avantages de la médiane.
Probabilités et statistiques au lycée
STATISTIQUE INFERENTIELLE L ’ESTIMATION
Séries statistiques à une variable
Organisation et gestion de données, fonctions
Chapitre 5. Description numérique d’une variable statistique.
Echantillonnage Introduction
Inférence statistique
Comparaison d'une distribution observée à une distribution théorique
1. Les caractéristiques de dispersion. 11. Utilité.
CONFORMITE d’une distribution expérimentale à une distribution théorique Professeur Pascale FRIANT-MICHEL > Faculté de Pharmacie
Autour d’une expérience aléatoire simple:
Moyenne, écart type et incertitude de mesure.
Les tests d’hypothèses
Mathématiques classe de seconde professionnelle
Statistique et probabilités au collège
variable aléatoire Discrète
Probabilités et statistique en TS
La loi normale et l’estimation de paramètres
L’OUTIL STATISTIQUE.
LE CHOIX EN CONTEXTE D’INCERTITUDE (suite...)
Autres LOIS de PROBABILITES
1 - Construction d'un abaque Exemple
L’inférence statistique
Cours Corporate finance Eléments de théorie du portefeuille Le Medaf
Décomposer un nombre en facteurs premiers.
Probabilités et Statistiques
Introduction aux probabilités
Opération et systèmes de décision Faculté des Sciences de l administration MQT Probabilités et statistique Mesures caractéristiques.
Tableaux de distributions
Tableaux de distributions
TECHNIQUES QUANTITATIVES APPLIQUEES A LA FINANCE
Les Pourcentages.
La statistique descriptive
Université dOttawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :47 1 Concepts fondamentaux: statistiques et distributions.
Corrélation Principe fondamental d’une analyse de corrélation
La Distribution des Données
LÉcart Type. LÉtendue Donne seulement le une mesure entre le maximum et le minimum Elle ne donne pas linformation sur la variation à lintérieur des valeurs.
LES PRODUITS DÉRIVÉS troisième partie: Black - Scholes modèle binomial
Dépannage du 12 mars 2007.
Théorie… Inférence statistique: étude du comportement d’une population ou d’un caractère X des membres d’une population à partir d’un échantillon aléatoire.
Loutil statistique les mesures de tendance centrale Auto-évaluation.
Analyse statistique des données expérimentales
La fonction inversement proportionnelle
Les familles de fonctions
Les relations - Règles - Variables - Table de valeurs - Graphiques.
Les intervalles de confiance pour la moyenne d’une population
ASI 3 Méthodes numériques pour l’ingénieur
Les mesures de tendance centrale
Mesures de position Ils s’expriment dans la même unité que les observations Moyenne et moyenne pondérée Exemple : on dispose du nombre moyen d’enfants.
1 - Programme de Seconde (juin 2009) Statistique et probabilités
1 Introduction à la théorie des tests. 2 Plan I- choix entre 2 paramètres de tendance centrale Choix entre 2 proportions pour un caractère qualitatif.
Activité 1 sommaire Vous avez redécouvert ce que l'on appelle le principe 68%-95%-99,7% : Ce principe est valable pour des distributions de fréquences.
Rappels de statistiques descriptives
Théorème de la limite centrale l’inférence statistique
Probabilités et Statistiques Année 2009/2010
STATISTIQUES DESCRIPTIVES
TD4 : « Lois usuelles de statistiques »
Intervalles de confiance pour des proportions L’inférence statistique
Chapitre 3: Variables aléatoires réelles continues
Atelier Probabilités et statistiques
Chapitre 4 Variables aléatoires discrètes
Le Distribution Normale
1 Licence Stat-info CM3 a 2004 V1.2Christophe Genolini Problème des groupes Un amphi de 200 élèves : loi normale moyenne X et écart type s –Un élève :
ECHANTILLONAGE ET ESTIMATION
TP1: Statistique application chapitre 2. Le tableau suivant reprend le taux d'intérêt (en %) payé par 20 banques sur les dépôts d'épargne de leurs clients.
Loi Normale (Laplace-Gauss)
Transcription de la présentation:

La distribution normale

Plan Distribution de fréquences: page 3 Distribution normale: page 14 Théorème central limite: page 26 Utilisation de la distribution normale standardisée: page 33

Idée de la distribution normale On lance 2 dés et on regarde la somme = 7 Le nombre totale de possibilités est de : 6x6=36 possibilités

Simulation par Monte Carlo Nombre d’essais = 10

Simulation par Monte Carlo Nombre d’essais = 50

Simulation par Monte Carlo Nombre d’essais = 200

Simulation par Monte Carlo Nombre d’essais = 1000

Simulation par Monte Carlo Nombre d’essais = 5000

Simulation par Monte Carlo Nombre d’essais = 50 000

Simulation par Monte Carlo Nombre d’essais = 200 000

Résultats théoriques Somme Possibilité 2 (1,1) 3 (1,2) (2,1) 4 (1,3) (2,2) (3,1) 5 (1,4) (2,3) (3,2) (4,1) 6 (1,5) (2,4) (3,3) (4,2) (5,1) 7 (1,6) (2,5) (3,4) (4,3) (5,2) (6,1) 8 (2,6) (3,5) (4,4) (5,3) (6,2) 9 (3,6) (4,5) (5,4) (6,3) 10 (4,6) (5,5) (6,4) 11 (5,6) (6,5) 12 (6,6)

Résultats théoriques Probabilité % Somme Possibilités 1/36 2,78 2 (1,1) 2/36 5,56 3 (1,2) (2,1) 3/36 8,33 4 (1,3) (2,2) (3,1) 4/36 11,11 5 (1,4) (2,3) (3,2) (4,1) 5/36 13,89 6 (1,5) (2,4) (3,3) (4,2) (5,1) 6/36 16,67 7 (1,6) (2,5) (3,4) (4,3) (5,2) (6,1) 8 (2,6) (3,5) (4,4) (5,3) (6,2) 9 (3,6) (4,5) (5,4) (6,3) 10 (4,6) (5,5) (6,4) 11 (5,6) (6,5) 12 (6,6) =36/36 = 100

Simulation par Monte Carlo Distribution d’échantillonnage de la somme de 2 dés

Distribution normale Ce type de distribution est rencontrée régulièrement dans la nature (grandeur, poids, habiletés, propriétés psychologiques, etc.) Existe-il une formule mathématique qui pourrait ajuster ces données empiriques ?

Distribution normale Distribution d’échantillonnage de la somme de 2 dés

Distribution normale Définition: fonction mathématique qui décrit des phénomènes pour un n élevé. Propriétés: - Unimodale et symétrique (autour de la moyenne) - Mode = Médiane = Moyenne - Asymptotique à l’abscisse (la courbe ne touche jamais l’axe des x) m = 50 s = 2 Fonction de densité

Probabilité d’observation Quelle est la probabilité d’obtenir une somme de 8 ? p(8) =Aire du bâtonnet p(8) = basehauteur p(8) = 15/36 = 5/36 6/36 5/36 4/36 3/36 2/36 1/36 2 4 6 8 10 12

Probabilité d’observation Supposons que la taille des bâtonnets est divisée en 2 1/36 2/36 3/36 4/36 5/36 6/36 2 3 4 5 6 7 8 9 10 11 12 1/36 2/36 3/36 4/36 5/36 6/36 2 3 4 5 6 7 8 9 10 11 12

Probabilité d’observation Encore et encore … 1/36 2/36 3/36 4/36 5/36 6/36 2 3 4 5 6 7 8 9 10 11 12 1/36 2/36 3/36 4/36 5/36 6/36 2 3 4 5 6 7 8 9 10 11 12

Probabilité d’observation … infini 1/36 2/36 3/36 4/36 5/36 6/36 2 3 4 5 6 7 8 9 10 11 12 1/36 2/36 3/36 4/36 5/36 6/36 2 3 4 5 6 7 8 9 10 11 12

Probabilité d’observation Quelle est la probabilité d’obtenir une somme de 8 ? p(8) =Aire du bâtonnet p(8) = 0hauteur p(8) = 05/36 = 0 1/36 2/36 3/36 4/36 5/36 6/36 2 3 4 5 6 7 8 9 10 11 12 On ne peut donc plus connaître la probabilité d’une somme donnée !

Fréquences cumulatives Solution: Fréquences cumulatives Si on veut p(8), alors on fait la différence entre 2 fréquences cumulatives => f.c.(8)-f.c.(7) 1/36 2/36 3/36 4/36 5/36 6/36 2 3 4 5 6 7 8 9 10 11 12 f.c.(8) = (1+2+3+4+5+6+5)/36=26/36 f.c.(7) = (1+2+3+4+5+6)/36=21/36 => f.c.(8) - f.c.(7) = (26-21)/36 = 5/36

Fonction de densité cumulée Distribution normale De façon similaire, pour connaître la probabilité d’un score x quelconque sous la courbe normale, il faut calculer l’aire sous la courbe (intégrer) de -∞ jusqu’à x. x Fonction de densité cumulée x

Distribution normale standard Comme il existe une infinité de valeurs que peuvent prendre les paramètres m et s, par convention on parle de distribution normale standard si m = 0 et s = 1. PDF Z

Distribution normale standard Ex. z = -1,75

Théorème central limite Même si la distribution initiale n’est pas normale, la distribution des moyennes d’échantillonnage le sera Ex.: x={1, 1, 1, 2, 2, 3}

Théorème central limite Exemple x={1, 1, 1, 2, 2, 3} On tire des échantillons n=10 un très grand nombre de fois. Pour chaque série on calcul la moyenne. t1={2,2,3,2,3,3,2,2,1,3}=> moyenne = 2.3 t2={3,2,2,2,1,2,1,2,2,2} => moyenne = 1.9 t3={1,1,3,2,1,2,1,2,1,1} => moyenne = 1.5 t10000000 = {1,2,1,3,2,1,3,1,3,3} => moyenne = 2.0 Puis, on regarde la distribution de ces moyennes.

Simulation par Monte Carlo Nombre d’essais = 10 Moyenne = 1.760 Écart-type = 0.225

Simulation par Monte Carlo Nombre d’essais = 100 Moyenne = 1,663 Écart-type = 0,232

Simulation par Monte Carlo Nombre d’essais = 1000 Moyenne = 1,666 Écart-type = 0,240

Simulation par Monte Carlo Nombre d’essais = 10 000 Moyenne = 1,668 Écart-type = 0,235

Simulation par Monte Carlo Nombre d’essais = 100 000 Moyenne = 1,668 Écart-type = 0,235

Utilisation de la distribution normale Quelle est la proportion de données qui est en dessous d’un score spécifique ? Pour utiliser la table des z, il faut transformer toute distribution normale en une distribution normale standardisée (m=0, s=1) Solution: Transformation en score z Logique de cette transformation : Soustrait une quantité de la distribution. Moy = 0 É.-t. = 1 Moy = 50 É.-t. = 2

Utilisation de la distribution normale Moy = 0 É.-t. = 1 Moy = 50 É.-t. = 2 distribution-10 Moy = 40 É.-t. = 2 distribution-20 Moy = 30 É.-t. = 2

Utilisation de la distribution normale Moy = 0 É.-t. = 1 Moy = 30 É.-t. = 2 distribution-30 Moy = 20 É.-t. = 2 distribution-40 Moy = 10 É.-t. = 2

Utilisation de la distribution normale Moy = 0 É.-t. = 1 Moy = 10 É.-t. = 2 distribution-50 Moy = 0 É.-t. = 2 Donc, si on soustrait la moyenne de la distribution, sa nouvelle moyenne sera effectivement 0.

Utilisation de la distribution normale -On divise le résultat de la soustraction par une autre quantité Moy = 0 É.-t. = 1 É.-t = 2 (distribution-50)/1.25 Moy = 0 É.-t. = 1 É.-t = 1.75

Utilisation de la distribution normale - Divise le résultat de la soustraction par une autre quantité Moy = 0 É.-t. = 1 É.-t = 1.75 (distribution-50)/1.5 Moy = 0 É.-t. = 1 É.-t = 1.5

Utilisation de la distribution normale - Divise le résultat de la soustraction par une autre quantité Moy = 0 É.-t. = 1 É.-t = 1. 5 (distribution-50)/1.75 Moy = 0 É.-t. = 1 É.-t = 1.25

Utilisation de la distribution normale - Divise le résultat de la soustraction par une autre quantité Moy = 0 É.-t. = 1 É.-t = 1. 25 (distribution-50)/2 Moy = 0 É.-t. = 1 É.-t = 1

Utilisation de la distribution normale - Divise le résultat de la soustraction par une autre quantité (distribution-50)/2 Moy = 0 É.-t. = 1 É.-t = 1 Donc, si on soustrait la moyenne de la distribution, sa nouvelle moyenne sera effectivement 0. Et si on divise le résultat de cette soustraction par l’écart-type, alors le nouvel écart-type de la distribution sera de 1.

Utilisation de la distribution normale suite Quelle est la proportion de données qui est en dessous d’un score spécifique ? Ex.1 : x = 3,70 moy = 2,93 é.t. = 0,33 Solution: Transformation en score z (nombre d’écart types standards entre x et la moyenne)

Utilisation de la distribution normale suite Quelle est la proportion de données qui est au dessus d’un score spécifique ? Ex.2 : x = 2,50 moy = 2,93 é.t. = 0,33

Utilisation de la distribution normale suite Quelle est la proportion de données qui est comprise entre 2 scores spécifiques ? Ex.3 : x1 = 3,00 ; x2 = 2,85 moy = 2,93 é.t. = 0,33

Utilisation de la distribution normale suite Quelle est la proportion de données qui est comprise entre 2 scores spécifiques ?

Utilisation de la distribution normale suite À quel score correspond une proportion de 85% en dessous de la moyenne ? Ex.4 : x = ? moy = 2,93 é.t. = 0,33