La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Présentation des données Résumé et description numérique.

Présentations similaires


Présentation au sujet: "Présentation des données Résumé et description numérique."— Transcription de la présentation:

1 Présentation des données Résumé et description numérique

2 Résumé numérique Fréquence Dispersion Position Étendue(intervalle de variation) interquartile Variance Écart type Coefficient de variation Mode Médiane Moyenne quartiles forme asymétrie aplatissement

3 Paramètres de position (valeurs centrales autour desquelles se groupent les valeurs observées) désigne la moyenne arithmétique de n éléments (n = effectif) tirés dun échantillon. Mêmes unités que x. μx = E(x) = moyenne de la distribution théorique des éléments x dune population Moyenne arithmétique (mean) Statistiques descriptives – Paramètres dune distribution

4 Statistiques: mesures de la tendance centrale moyenne: facile à calculer mais peut être influencée par des valeurs extrêmes X Fréquence

5 Médiane (median) Me x La médiane est la valeur de la variable qui se situe au centre de la série statistique, classée en ordre croissant. La médiane sépare la série en deux groupes dégale importance. Sil y a un nombre impair dobservations, Me est une observation de la série. Exemple: pour la série [1, 32, 128, 129, ] Sil y a un nombre pair dobservations, la médiane est située entre les deux observations centrales de la série. Par convention, on utilise la moyenne de ces deux valeurs. Exemple: pour la série [1, 32, 128, 129, 532, ] médiane (M): est la valeur de la variable mesurée pour laquelle le nombre dobservations supérieures et inférieures est égal. Elle est moins influencée par les valeurs extrêmes que la moyenne. Me = 128,5 Me = 128

6 Stabilité de la médiane:exemple1 on a reporté le temps mis par 20 nouveaux diplômés pour décrocher un premier emploi( en mois): 0; 0; 0; 0;0;1;1;1;2;2;2;3;3;3;4;4;6;6;8;20 Avec les 20 valeurs: MOY=3,3 Me=2 En éliminant la valeur 20 mois: moy=2,42 Me=2 Conclusion: la moy est bcp plus stable que la moy vis-à-vis des valeurs extrêmes

7 Stabilité de la médiane pour des données quantitatives discrètes:exemple 2 Tab. Nombre de frères et sœurs de tous les étudiants dune section Moy=1,57 Me=1(130 e et 131 e =1)

8 Stabilité de me pour des données quantitatives discrètes:exemple 2 fin. Six étudiants absents lors du recueil des données annoncent quils ont respectivement:2;3;2;0;4 et 2 frères et sœurs Pour cette série complétée : Moy=1,58 me=2 On remarque que la médiane change beaucoup avec lajout de seulement 6 données sur 260 alors que la moy reste stable. Cest linconvénient de la médiane sur des données quantitatives discrètes

9 Mode Mo Le mode est lindice de la classe comportant le plus de valeurs. Dans une distribution continue cest la "bosse" de la distribution. Il peut y avoir plusieurs modes dans une distribution. Dans le cas des classes à amplitudes inégales, le mode ne correspond pas toujours à la valeur de la classe la plus fréquente(td)

10 é Chaque pic correspond à un stade larvaire différent Le mode: exemple

11 Forme dune distribution en fonction de ses paramètres de position

12 Intérêt de chaque paramètre de position

13 Variance (variance) Population statistique d'effectif N: Échantillon aléatoire d'effectif n: Attention Paramètres de dispersion (ils renseignent sur létalement des valeurs observées)

14 Lécart type (standard deviation) σ x pour une population ou une distribution théorique s x pour un échantillon Coefficient de variation (coefficient of variation) Symbole: C.V., CV ou V Le coefficient de variation permet donc de comparer la variation de variables exprimées originellement dans des unités physiques différentes. Lorsque les échantillons sont de petite taille (n<20), on applique une correction à la formule du coefficient de variation:

15 Exemple Soit une série de 5 valeurs: 28, 42, 48, 59, 63 x(x-x)(x-x)

16 Intervalle interquartile: regroupe 50% des valeurs de léchantillon IQ=Q 3 -Q 1 = longueur de la boite du box plot Étendue de variation (range)=max-min Exemple: notes Étudiant A:8;9;10;11;12 Étudiant B:5; 5;6; ;15;19 Étendue A=12-8=4 Étendue B=19-5=14 SENSIBLE AUX VALEURS EXTREMES

17 Paramètres de dispersion: létendue de la variation Létendue de la variation est définie par la valeur la plus grande et la valeur la plus petite de léchantillon Cest une statistique simple mais qui est biaisée parce quelle sous-estime la valeur de la population. Fréquence Létendue de la variation de la population Létendue de la variation de léchantillon

18 Paramètres de forme

19 Coefficient dasymétrie (skewness) Mesure l'asymétrie d'une distribution, c'est-à-dire si elle "penche" d'un côté ou de l'autre. Où est le cube de l'écart type de la distribution distribution symétrique distribution tend vers la droitedistribution tend vers la gauche

20 Coefficient daplatissement (kurtosis) Mesure l'aplatissement d'une distribution Où est la quatrième puissance de l'écart type de la distribution normale

21 Paramètre de dispersion d'une série statistique double Covariance s xy La covariance est une généralisation à deux dimensions du concept de variance. Ce paramètre mesure la dispersion conjointe de deux variables. La covariance renseigne sur la forme et l'orientation du nuage de points d'un diagramme de dispersion.

22 Présentation des données dans un listage logiciel

23 PH 3,48 3,51 3,55 3,57 3,59 3,6 3,72 3,79 3,82 3,83 3,85 3,86 3,89 3,91 3,92 3,93 3,96 4,06 4,12 Listage Excel


Télécharger ppt "Présentation des données Résumé et description numérique."

Présentations similaires


Annonces Google