Télécharger la présentation
1
Statistique descriptive
I-STATISTIQUE ET VARIABILITE Variation instrumentale Variation pré instrumentale Variation intra-sujet Variation inter-sujet (Technique de dosage) Variation Analytique Variation Biologique Variation Totale (Technique de prélèvement)
2
II-LES DEUX DOMAINES DE LA STATISTIQUE
· Décrire des ensembles de données complexes en opérant des réductions de ces données.C’est la Statistique descriptive. 1 Débusquer (chercher) dans une variabilité constatée ; ce qui peut être expliqué par le hasard seulement ou ce qui relève d’une autre explication. C’est ce qu’on appelle la Statistique Analytique ou Inductive. 2
3
DONNEES STATISTIQUES A titre d’exemple
Afin de décrire un ensemble de mesure ou d’observations concernant l’état ou l’évolution d’un phénomène, on peut présenter les données statistiques de plusieurs manières. A titre d’exemple
4
Un médecin, pour étudier les risques cardio-vasculaires de ses patients, peut remplir pour chacun d’eux une fiche notant un certain nombre de caractéristiques. 1 -Nom et prénom :_______________________________________ -Sexe (1 pour masculin et 0 pour féminin) __________________ -Age (ans)_____________________________________________ - Profession :___________________________________________ -Nombre d’incidents cardiaque :__________________________ -Taille (en m) :_________________________________________ -Poids (en Kg) :________________________________________ -Cholestérol (en g/l) :____________________________________ - ……… DONNEES STATISTIQUES
5
2 Pour étudier la répartition des terres agricoles d’une région,on peut faire l’inventaire des exploitations agricoles (Soit N leur nombre), et noter pour chacune d’elle sa taille (en hectares), la culture dominante, le nom du chef de l’exploitation…etc DONNEES STATISTIQUES
6
VARIABLE ALEATOIRE 1- Nature des variables VARIABLES Observables
Mesurables Quantitative Qualitatives Discrètes Continues Normales Ordinales N. d’enfants N. de bactéries N. de pièces N. d’automobiles N. de patients …etc. Taille Poids Taux de glucose Diamètre d’une Coquille …etc. -Sexe Couleur Ville d’origine Culture …etc. Taille vestimentaire Temps observé Intensité lumineuse …etc. Expression littérales Expression numérique
7
SERIE STATISTIQUE 1- Définition: S
L’étendue de variation de X est définie par l’intervalle {x1, xk}. Une série statistique est représentée par les valeurs relatives à une variable aléatoire X telle que X peut prendre les valeurs {x1, x2, x3……. xi……..xk }. x1 x2 x3 ….. xi xk S ni n1 n2 n3 nk N fi= f1= f2= f3= fk= 1 fci fc1= f1 fc2= f1+ f2 - fdi 1-f1 1-f1 -f2 fk
8
SERIE STATISTIQUE 2- Représentation graphique
Pour exploiter au mieux une série de valeurs expérimentales,plusieurs opérations s’avèrent indispensables : - - Classement des valeurs par ordre croissant ou décroissant. - Transformation des effectifs ni en fréquence fi. ( ou encore en fréquence cumulées croissantes ou décroissantes). - Répartition des valeurs xi en classes Ci . ; il s’agit là d’une répartition en intervalles ; égaux ou inégaux selon les séries étudiées ; et définies par leurs fréquences relatives.
9
Représentation graphique
2-1.Cas des variations discontinues: Fréquence Valeurs de xi Diagramme en bâtons Les plus classiques Diagramme circulaire
10
Représentation graphique 2-2.Cas des variations continues:
175 5 10 15 20 25 30 35 161 163 165 167 169 171 173 177 179 Histogramme des fréquences Polygone des fréquences Les plus classiques 20 40 60 80 100 120 140 161 163 165 167 169 171 173 175 177 179 20 40 60 80 100 120 140 161 163 165 167 169 171 173 175 177 179 Histogramme des fréquences cumulées c ou d.
11
SERIE STATISTIQUE 3- Caractéristiques d’une série statistique
On caractérise très souvent une série statistique par deux types de paramètres : - Les paramètres dits de position ou d’ordre 1: (moyenne, mode, médiane, quartiles…..etc.) - Les paramètres de dispersion ou d’ordre 2: ( variance, écart-type, coefficient de variation ….etc.)
12
Caractéristiques d’une série statistique
3-1. Les paramètres dits de position ou d’ordre 1 La moyenne arithmétique : Soit X, une V.A. qui peut prendre les valeurs {x1, x2, … xi;….xk },et où chacune des valeurs élémentaire xi est représenté par un ni ou sa fréquence fi. - Si les données sont organisées en classes de centre ci et de fréquences fi, on aura :
13
Caractéristiques d’une série statistique
3-2. Les paramètres dits de position ou d’ordre 1 La moyenne géométrique : Pour le calcul, on applique: Log G = n1Logx1+n2Logx2+….+nkLogxk La moyenne harmonique : La moyenne quadratique :
14
Caractéristiques d’une série statistique
3-3. Les paramètres dits de position ou d’ordre 1 Le mode ou la valeur modale : est la valeur de l’observation dont la fréquence est maximale (c.a.d. la plus représentée). Une série peut être unimodale, bimodale ou plurimodale. La médiane : est la valeur de l’observation située exactement au milieu de la série rangée par ordre croissant ou décroissant. Elle correspond à la fréquence cumulée de N/2 ou de 50%. Les quartiles : Ils divisent la série en 4 parties égales. Le premier quartile correspond à 25%, le second à 50% ( se confond avec la médiane) et le troisième à 75% des observations pour des série rangée par ordre croissant ou décroissant.
15
Caractéristiques d’une série statistique
3-4. Les paramètres dits de dispersion ou d’ordre 2 Ces paramètres essayent de synthétiser par une seule valeur numérique la dispersion de toutes les valeurs observées. L’étendue de variation : C’est la différence entre la plus grande et la plus petite valeur de l’observation. L’intervalle inter-quartile : C’est la différence entre le 3ème et le 1er quartile. La variance et l’écart-type : C’est une estimation de la dispersion autour de la moyenne. Le coefficient de variation : Aussi, on peut avoir une idée de l’amplitude de la variation en comparant et
16
Caractéristiques d’une série statistique
3-5. Les paramètres dits de dispersion ou d’ordre 2 Calcul de la variance de l’écart type et du C.V: Soit X, une V.A. telle que X= {x1, x2, … xi;….xk }. La dispersion autour de la moyenne pour toute valeur xi est : Ces écart peuvent être positifs ou négatifs de sorte que la somme de ces écarts est nulle par compensation : En effet : et
17
La somme de ces écarts est nulle, elle ne permet pas d’estimer la dispersion autour de la moyenne.
En élevant ces écart au carré on aura: Ce terme même s’il est différent de 0; il donne la même signification pour des différences non comparables: (10-5)d2=25 et ( ) d2=25. Afin de palier à ce problème chaque somme des carrés des écarts était pondérée de l’effectif total, soit donc:
18
Ce terme défini ce que l’on appelle la variance et constitue avec l’écart type la meilleure estimation de la dispersion autour de la moyenne; elle est noté: Si les valeurs sont répétés, cette équation revient à:
19
L’écart type est défini par la racine carré de la variance, il est noté:
Le coefficient de variation permet de donner une idée sur l’amplitude de variation en comparant l’écart l’écart type et la moyenne, il est noté: Plus le coefficient de variation est petit, plus la série est homogène. D’une manière générale, la population étudiée est considérée homogène lorsque le CV < 30%.
Présentations similaires
© 2024 SlidePlayer.fr Inc.
All rights reserved.