Statistiques descriptives-Distributions expérimentales à une dimension Chapitre 4 Statistiques descriptives-Distributions expérimentales à une dimension
Plan 1. Généralités 2. Paramètres de positions 3. Paramètres de dispersion 4. Paramètres de la forme
1. Généralités: Vocabulaire général La statistique étudie des ensembles appelés populations dont les éléments sont appelés individus. Lorsque chaque individu présente un caractère X, la statistique est dite simple ou à une dimension. Généralement, on n’a pas accès à la population totale et l’étude se fait sur un échantillon (une partie de la population). Qualitatif Ex: maladie Caractère Continu: Prend toute les valeurs d’un intervalle Quantitatif Ex: durées de vie Discret: Ne prend que des valeurs ponctuelles et isolées Remarque: Quand un caractère est continu, ou discret avec beaucoup de valeurs possible, on effectue des regroupements en classes statistiques.
1. Généralités: Effectifs et fréquences Une statistique simple est présentée à l’aide d’un tableau: Valeurs ou modalités de la statistique X x1 ………. xi xk Effectifs ni n1 ni nk Fréquences fi f1 fi fk
1. Généralités: Exemple Pour déterminer le nombre moyenne d’enfants dans chaque famille d’une ville, on a prélevé un échantillon de 50 famille: 1 3 2 5 2 2 4 1 0 4 3 4 1 2 3 4 2 4 3 1 4 5 1 3 5 3 1 3 2 5 5 3 3 3 2 1 2 1 2 3 4 4 1 4 5 2 3 1 1 4 Le tableau statistique associé avec cette statistiques est: Nom. Enf (xi) Effectifs(ni) Fréquences(fi) Fréq cum (Fi) 1 0,02 11 0,22 0,24 2 10 0,2 0,44 3 12 0,68 4 0,88 5 6 0,12 Total 50
1. Généralités: Fonction de répartition Définition: La fréquence cumulé correspondant à la condition ‘X≤x’ est un nombre noté F(x); F est appelée fonction de répartition. Cette fonction est croissante et sa courbe est celle des fréquences cumulées. xi Fi 0,02 1 0,24 2 0,44 3 0,68 4 0,88 5 Condition F(x) x<0 0≤x<1 0,02 1≤x<2 0,24 2≤x<3 0,44 3≤x<4 0,68 4≤x<5 0,88 5<x 1 Fonction de répartition
1. Généralités: Représentations graphiques et variable discrète Diagramme en bâtons: Les longueurs des bâtons ou des bandes Sont proportionnelles aux effectifs Diagramme en cercle: Ces représentations sont utilisés pour visualiser la distribution de la statistique
1. Généralités: Représentations graphiques et variable continue Histogramme: Les longueurs des bandes Sont proportionnelles aux effectifs Diagramme circulaire: L ’effectif d’une classe est représenté par une angle. A chaque classe, on fait correspondre un pourcentage.
2. Paramètres de positions: Le mode, moyenne Définition: On appelle mode d’une statistique, toute valeur correspondant à l’effectif maximal. Nom. Enf (xi) Effectifs(ni) Fréquences(fi) Fréq cum (Fi) 1 0,02 11 0,22 0,24 2 10 0,2 0,44 3 12 0,68 4 0,88 5 6 0,12 Définition: Si le caractère étudié est quantitatif, on appelle la moyenne arithmétique de la série statistique la valeur: Proposition: Si X et Y sont deux variables statistiques liées comme suit Y=aX+b, Alors
2. Paramètres de positions: La médiane Définition: On appelle médiane d’une série statistique, toute valeur m vérifiant les deux conditions: - la moitié au plus de l’effectif total de la série a un caractère de valeur inférieur à m, - la moitié au plus de l’effectif total de la série a un caractère de valeur supérieur à m. Définition: lorsque cette définition conduit à un intervalle médian, on retient souvent le milieu comme valeur de la médiane. Classe ni [140-160[ 10 [160-165[ 20 [165-170[ 30 [170-175[ 45 [175-180[ 40 [180-185[ 35 Nom. Enf (xi) Effectifs(ni) 1 11 2 10 3 12 4 5 6 médiane=3 médiane=172,5
3. Paramètres de dispersion: La variance et l’écart-type Définition: La variance V et l’écart type de σ d’une série statistique de taille n sont définis comme suit: Exemple: Pour l’exemple précédent, on a Propriétés: La variance V et l’écart type de σ d’une série statistique de taille n vérifient les équations suivantes:
3. Paramètres de dispersion: Les moments Définition: Soit r un entier naturel non nul. On définit pour un caractère quantitatif X: Remarque: En général, les moments centrés d’ordre pair renseignent sur la dispersion des observations autour de la moyenne et les moments centrés d’ordre impair sur la dissymétrie de la distribution. Exemple: Pour l’exemple précédent, on a
4. Paramètres de la forme : Coefficient de Fischer (dissymétrie) Définition: le coefficient γ1 de Fischer est définie par Exemple: Pour l’exemple précédent, on a Propriétés: - Si γ1=0, alors la distribution est symétrique - Si γ1<0, alors la distribution est étalée vers la gauche - Si γ1>0, alors la distribution est étalée vers la droite Exemple: Pour l’exemple précédent, on a 0.05465=γ1>0, donc la distribution est étalée vers la droite.
4. Paramètres de la forme: Coefficient de Fischer (aplatissement) Définition: le coefficient γ2 de Fischer est définie par Exemple: Pour l’exemple précédent, on a Propriétés: - Si γ2=0, alors l’aplatissement de la distribution est le même que celui de la loi de Gauss - Si γ2<0, alors la distribution est plus aplatie - Si γ2>0, alors la distribution est moins aplatie (EXERCICE) Exemple: Pour l’exemple précédent, on a 1.95=γ2>0, donc la distribution est moins aplatie que la loi de Gauss.
4. Paramètres de la forme: Illustration géométrique Exemple: Pour l’exemple précédent, on a 1.95=γ2>0, donc la distribution est moins aplatie que la loi de Gauss. 1.95=γ2