Télécharger la présentation
La présentation est en train de télécharger. S'il vous plaît, attendez
1
Statistiques et probabilités
2
Statistiques Dans une population, on étudie un caractère qui peut être qualitatif (exemple : la couleur des yeux) ou quantitatif (exemple : taille de fratries). Dans la cas du quantitatif, il peut être discret (exemple : nombre de TV dans un foyer) ou continu (exemple : durée avant une panne) L’observation nous donnera une série statistique brute et on cherchera à : présenter les données pour les rendre compréhensibles. analyser les données pour permettre des comparaisons. prévoir de futures observations.
3
Statistiques Présenter Sous la forme de diagramme en bâtons, de courbes, barres 100%, diagrammes circulaires, anneaux, histogramme …
4
Statistiques Analyser Un caractère est mesuré dans une population, il peut être : discret. exemple : le nombre de frères et sœurs dans des familles. ou continu. exemple : le temps mis pour se rendre au travail.
5
Statistiques et/ou les quartiles, la médiane.
Analyser un caractère discret Pour résumer une série statistique, on utilise des indicateurs : la moyenne, l’écart-type. et/ou les quartiles, la médiane.
6
Statistiques Analyser un caractère discret : la moyenne Elle représente la valeur que prendrait chaque élément de la série statistique si elle était constante. Pour la calculer, on utilise la formule :
7
Statistiques Analyser un caractère discret : la moyenne Les données peuvent être regroupées par valeurs distinctes Xi affectées d’effectifs Ni Dans ce cas, la formule s’écrit et sous excel on utilise : =sommeprod(plage des xi;plage des ni)/somme(plage des ni) Sous EXCEL =moyenne(plage) ne s’utilise que si les valeurs ne sont pas regroupées par effectifs !
8
Statistiques L’écart-type est la racine carrée de la variance.
Analyser un caractère discret : l’écart type Il représente l’écart moyen des valeurs avec leur moyenne. Il caractérise la dispersion des valeurs autour de leur moyenne. Pour le calculer, on utilise la variance : On démontre que La variance est la moyenne des carrés moins le carré de la moyenne. L’écart-type est la racine carrée de la variance.
9
Plage des Xi deux fois pour créer des carrés
Statistiques Analyser un caractère discret : l’écart type Lorsque les données sont regroupées par valeurs distinctes Xi affectées d’effectifs Ni Dans ce cas, la formule s’écrit Sous excel cela donne =racine(sommeprod(plage des Ni;plage des Xi;plage des Xi)/somme(plage des Ni)-moyenne²) Plage des Xi deux fois pour créer des carrés
10
Statistiques La moyenne est
Analyser un caractère discret : La moyenne est augmentée de k si on ajoute k à toutes les valeurs multipliée par k on multiplie par k toutes les valeurs L’écart type est : inchangé si on ajoute k à toutes les valeurs multipliée par |k| on multiplie par k toutes les valeurs
11
Statistiques Analyser un caractère discret : quartiles, médiane Les quartiles et médianes s’obtiennent en analysant les fréquences de valeurs distinctes présentées dans l’ordre croissant. La fréquence de la valeur Xi dont l’effectif est Ni es donnée par :
12
Statistiques Lorsque la somme des fréquences cumulés
Analyser un caractère discret : quartiles Lorsque la somme des fréquences cumulés égale ou dépasse 25% on obtient le 1er quartile Q1 égale ou dépasse 75% on obtient le 3ème quartile Q3
13
Statistiques Lorsque le nombre total de valeurs est :
Analyser un caractère discret : médiane Lorsque le nombre total de valeurs est : impaire, il y a 2N+1 valeurs, la médiane est la Nième paire, il y a 2N valeurs, la médiane est
14
Statistiques Présenter un caractère discret : quartiles, médiane On peut alors présenter les valeurs sous la forme d’un diagramme en boite max min médiane Q3 Q1 Axe gradué
15
Statistiques Analyser un caractère discret : EXCEL On peut facilement obtenir ces informations avec l’utilitaire d’analyse d’EXCEL Données>Utilitaire d’analyse>AnalyseDescriptive
16
Statistiques Les valeurs sont alors regroupées en classes.
Analyser un caractère continu : Les valeurs sont alors regroupées en classes. pour calculer la moyenne, l’écart type on utilise comme valeurs Xi les centres de chaque classe
17
Statistiques Les valeurs sont alors regroupées en classes.
Analyser un caractère continu : Les valeurs sont alors regroupées en classes. pour calculer la moyenne, l’écart type on utilise comme valeurs Xi les centres de chaque classe Xi borne inf borne sup centres Ni 2 4 3 9 6 5 8 7 10 12 11 14 13 16 15 18 17
18
Statistiques Présenter un caractère continu sous la forme d’un histogramme Pour réaliser un histogramme on peut suivre les étapes suivantes : Obtenir le min et la max de la série de valeurs : fonction, min/max ou avec "statistiques descriptives" de l'utilitaire d'analyse Calculer k le nombre optimal de classes avec la formule de Sturges et arrondir à l'entier Calculer le pas avec : (max-min) / k Compléter une colonne de "classes" avec : min, min+pas, min+2pas, ..., min+k*pas utiliser l'utilitaire d'analyse avec histogramme en réglant : la plage de données la plage des classes choisir l'endroit du graphique cocher : graphique arranger les classes en choisissant le nombre de décimales et les présentant sous forme d'intervalles
19
Statistiques On retire la 1ère et la dernière ligne Arrondi « à la main » Présenter un caractère continu sous la forme d’un histogramme Il y a 62% des avant 44 Il y a 21% des valeurs entre 44 et 87
20
Statistiques Présenter un caractère continu sous la forme d’un histogramme Largeur des barres Intitulés des classes
21
Statistiques Prévoir Pour permettre des interpolations et des extrapolations, on essaie de trouver une loi de probabilité qui correspond au mieux à la série statistique. On peut alors utiliser une courbe de tendance sous EXCEL
22
Statistiques Prévoir Classes Fréquence Centres Ni [0;44[ 62 22 [44;87[ 21 65 [87;130[ 8 108 [130;173[ 4 151 [173;216[ 3 194 [216;259[ 237 0,01 [259;302[ 1 280 [302;359[ 323 Les centres des classes Rappel des effectifs, on triche un peu Ici la courbe de tendance permet de proposer une loi de probabilité Exponentielle
23
Probabilités Généralités Une fois les statistiques mises en forme, on essaie de déterminer une loi de probabilité qui correspond au mieux au modèle. Là encore deux familles de lois existent : Les lois discrètes et les lois continues
24
Probabilités Lois discrètes On donne alors la liste des valeurs P(X = k) Par exemple considérons la loi binomiale B(n, p). n est le nombre de tentatives p est la probabilité d’un succès X compte le nombre de succès, On donnera P(X=k) pour k variant de 0 à n Excel dispose de la formule : =loi.binomiale(k,n,p,0) Si X était B(10,0.34) alors P(X = 2) s’écrirait =loi.binomiale(1,10,0.34,0)
25
Probabilités Lois discrètes On peut alors dessiner le diagramme en bâtons présentant P(X = k) en fonction de k
26
Probabilités Lois discrètes L’espérance E est définie par : E a pour propriétés : E(X+cste) = E(X)+ cste et E(X) = E(X) La variance Var est définie par : Var(X) = E(X²)-E(X)² Var a pour propriétés : Var(X+cste) = Var(X) et Var(X) = ²Var(X)
27
Probabilités Lois discrètes Pour une loi binomiale l’espérance est E(X) = np la variance est Var(X) = np(1-p) = npq avec q=1-p l’écart type est alors
28
Probabilités Lois discrètes Propriété : Excel donne uniquement avec la formule =loi.binomiale(k,n,p,1) (tout est dans le 1 final !) A noter : =loi.binomiale(n,n,p,1) donnera 1 car la somme de toutes les probabilités est égale à 1
29
Probabilités P(X = t) = 0 Lois continues
Pour les lois continues, la probabilité de chaque valeur est nulle. En effet quelle serait la probabilité que je fasse 1, m ? P(X = t) = 0 Par contre pour calculer la probabilité d’être compris entre a et b, il suffira de calculer l’aire sur la courbe de densité de la probabilité.
30
Probabilités Lois continues Par contre pour calculer la probabilité d’être compris entre a et b, il suffira de calculer l’aire sous la courbe de densité de la probabilité entre les valeurs a et b.
31
Probabilités Loi continue exponentielle Pour dessiner une densité point par point, on peut utiliser Excel On choisit un pas (par exemple de 0.5 en 0.5) et on écrit : =loi.exponentielle(t,,0)
32
Le 1 à la fin est pour calculer l’aire jusqu’à b
Probabilités Le 1 à la fin est pour calculer l’aire jusqu’à b Loi continue exponentielle Pour calculer la probabilité d’être compris entre a et b , on peut utiliser Excel, on écrit : =loi.exponentielle(b,,1) - loi.exponentielle(a,,1) En effet l’aire entre 2 et 3 est l’aire de ∞ à 3 ôtée de celle de ∞ à 2 P(2<X<3)
33
Probabilités Loi continue exponentielle La densité est donnée par si et si L’espérance est E(X) = On appelle fonction de répartition, la fonction F définie par : Ce qu’Excel calcule avec =loi.exponentielle(t,,1)
34
Probabilités Loi continue normale N(m,²) La représentation de la densité est Une courbe en cloche, ou gaussienne Elle est symétrique par rapport à la verticale d’équation x=m Comme pour toute densité, l’aire totale sous la courbe est égale à 1 P(X > a) = 1 – P(X < a) P(a < X < b) = P(X<b) – P(X< a) Par symétrie P(X < -a) = P(X > a) P(-a < X < a) = P(X<a) – P(X< -a) = 2P(X<a) – 1 Excel calcule P(X < a) avec =loi.normale(t,m,,1)
Présentations similaires
© 2024 SlidePlayer.fr Inc.
All rights reserved.