Présentation des données

Slides:



Advertisements
Présentations similaires
Statistique Descriptive Chapitre 2: Paramètres de tendance centrale
Advertisements

5. Statistiques.
Statistique descriptive
Chapitre 5. Description numérique d’une variable statistique.
Comparaison de deux moyennes observées
Inférence statistique
Optionnel de Statistique appliquée À la lecture critique d’articles
Licence 3ème année de sociologie Semestre 1
1. Les caractéristiques de dispersion. 11. Utilité.
Statistique et probabilités au collège
L’OUTIL STATISTIQUE.
Statistiques descriptives
INF L14 Initiation aux statistiques
STATISTIQUES Révision du 1er cycle
Les principaux résumés de la statistique
Statistique descriptive, analyse de données
Groupe 1: Classes de même intervalle
Opération et systèmes de décision Faculté des Sciences de l administration MQT Probabilités et statistique Mesures caractéristiques.
Tendance centrale Ex: Examen de philo. La moyenne était de 34%. Permet de caractériser une série statistique au moyen dune valeur ou modalité typique.
Tableaux de distributions
Comprendre la variation dans les données: Notions de base
La statistique descriptive
Université dOttawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :47 1 Concepts fondamentaux: statistiques et distributions.
Théorie… Inférence statistique: étude du comportement d’une population ou d’un caractère X des membres d’une population à partir d’un échantillon aléatoire.
Les mesures de la tendance centrale
Objectifs du chapitre 2 d’Howell sur les statistiques descriptives
Séries chronologiques et prévision
Mesures de position Ils s’expriment dans la même unité que les observations Moyenne et moyenne pondérée Exemple : on dispose du nombre moyen d’enfants.
Méthodes de Biostatistique
Statistique descriptive
Thème: statistiques et probabilités Séquence 3: Statistique descriptive Utiliser un logiciel (par exemple, un tableur) ou une calculatrice pour étudier.
Rappels de statistiques descriptives
STATISTIQUE DESCRIPTIVE ÉLÉMENTAIRE
STATISTIQUES DESCRIPTIVES
Micro-intro aux stats.
JEAN-MARC FONTAN SOC-1101 COURS 3
ANALYSE D’UN ÉCHANTILLON PORTANT SUR UNE VARIABLE STATISTIQUE
Mode, moyenne et médiane
Seconde partie Cours de seconde
STATISTIQUE DESCRIPTIVE Dr LEMDAOUI MOHAMED CHERIF
Td sur la statistique descriptive. Enoncé du problème On a étudié la taille en cm chez 20 enfants de quatrième année primaire à l’école Constantine année.
Introduction à une analyse statistique de données
Statistiques descriptives-Distributions expérimentales à une dimension
Distribution symétrique
Concepts fondamentaux: statistiques et distributions
1 Licence Stat-info CM1 b 2004Christophe Genolini 2.1. Vocabulaire Individu : objet étudié Population : Ensemble des individus Variable : nom donné à ce.
Méthodologie de l’observation
PARAMETRES STATISTIQUES
Audit de l’entreprise iA Xperts Robin BUREL Anthony BRANCA Clément GARNIER Alexis SMADJA Groupe B.
Chapitre 4 Variables aléatoires discrètes
STATISTIQUES DESCRIPTIVES
STATISTIQUE DESCRIPTIVE Dr LEMDAOUI MOHAMED CHERIF
Statistique Descriptive Les Paramètres de Tendance Centrale
Seconde 8 Chapitre 4: Les statistiques
Rapport 20 Final 40 Partiel TD.
Statistiques Première partie Cours de première S.
BIOSTATISTIQUES Définitions.
BIOSTATISTIQUES Définitions.
Paramètres de position et de dispersion
ECHANTILLONAGE ET ESTIMATION
Mesures de description des valeurs des variables
Les mesures de tendance centrale
Nature de la statistique La statistique est la science qui étudie la collecte, la présentation, l’analyse et l’utilisation des données numériques en vue.
 Champ des mathématiques  Ensemble de méthodes et de techniques  Permet une analyse objective  Facilitées aujourd’hui par les tableurs.
Chapitre 4 Statistique descriptive 1. Echantillonnage statistique population On appelle population, un ensemble d’individus auquel on s’intéresse échantillon.
Biostatistique pour le troisième cycle P. Leroy, F. Farnir 2013.
TP1: Statistique application chapitre 2. Le tableau suivant reprend le taux d'intérêt (en %) payé par 20 banques sur les dépôts d'épargne de leurs clients.
Notions de statistiques et d’analyse de données Master 1 MGS – Sarah MISCHLER –
1 M1 MQSE Cours n°2 1 - Rappels du cours n°1 2 - La statistique: un outil pour décrire.
STATISTIQUE DESCRIPTIVE
Transcription de la présentation:

Présentation des données Résumé et description numérique

Résumé numérique Dispersion Fréquence forme Position Mode Médiane Étendue(intervalle de variation) interquartile Variance Écart type Coefficient de variation Fréquence Dispersion Position forme Mode Médiane Moyenne quartiles asymétrie aplatissement

Paramètres de position Statistiques descriptives – Paramètres d’une distribution Paramètres de position (valeurs centrales autour desquelles se groupent les valeurs observées) μx = E(x) = moyenne de la distribution théorique des éléments x d’une population Moyenne arithmétique (mean) désigne la moyenne arithmétique de n éléments (n = effectif) tirés d’un échantillon. Mêmes unités que x.

Statistiques: mesures de la tendance centrale moyenne: facile à calculer mais peut être influencée par des valeurs extrêmes Fréquence X

Médiane (median) Mex La médiane est la valeur de la variable qui se situe au centre de la série statistique, classée en ordre croissant. La médiane sépare la série en deux groupes d’égale importance. • S’il y a un nombre impair d’observations, Me est une observation de la série. Exemple: pour la série [1, 32, 128, 129, 1000235] S’il y a un nombre pair d’observations, la médiane est située entre les deux observations centrales de la série. Par convention, on utilise la moyenne de ces deux valeurs. Exemple: pour la série [1, 32, 128, 129, 532, 1000235] médiane (M): est la valeur de la variable mesurée pour laquelle le nombre d’observations supérieures et inférieures est égal. Elle est moins influencée par les valeurs extrêmes que la moyenne. Me = 128 Me = 128,5

Stabilité de la médiane:exemple1 on a reporté le temps mis par 20 nouveaux diplômés pour décrocher un premier emploi( en mois): 0; 0; 0; 0;0;1;1;1;2;2;2;3;3;3;4;4;6;6;8;20 Avec les 20 valeurs: MOY=3,3 Me=2 En éliminant la valeur 20 mois: moy=2,42 Conclusion: la moy est bcp plus stable que la moy vis-à-vis des valeurs extrêmes

Stabilité de la médiane pour des données quantitatives discrètes:exemple 2 Tab. Nombre de frères et sœurs de tous les étudiants d’une section Moy=1,57 Me=1(130e et 131e =1)

Stabilité de me pour des données quantitatives discrètes:exemple 2 fin. Six étudiants absents lors du recueil des données annoncent qu’ils ont respectivement:2;3;2;0;4 et 2 frères et sœurs Pour cette série complétée : Moy=1,58 me=2 On remarque que la médiane change beaucoup avec l’ajout de seulement 6 données sur 260 alors que la moy reste stable. C’est l’inconvénient de la médiane sur des données quantitatives discrètes

Mode Mo Le mode est l’indice de la classe comportant le plus de valeurs. Dans une distribution continue c’est la "bosse" de la distribution. Il peut y avoir plusieurs modes dans une distribution. Dans le cas des classes à amplitudes inégales, le mode ne correspond pas toujours à la valeur de la classe la plus fréquente(td)

Le mode: exemple é Chaque pic correspond à un stade larvaire différent

Forme d’une distribution en fonction de ses paramètres de position

Intérêt de chaque paramètre de position

Paramètres de dispersion (ils renseignent sur l’étalement des valeurs observées) Variance (variance) Population statistique d'effectif N: Échantillon aléatoire d'effectif n: Attention

L’écart type (standard deviation) σx pour une population ou une distribution théorique sx pour un échantillon Coefficient de variation (coefficient of variation) Symbole: C.V., CV ou V Le coefficient de variation permet donc de comparer la variation de variables exprimées originellement dans des unités physiques différentes. Lorsque les échantillons sont de petite taille (n<20), on applique une correction à la formule du coefficient de variation:

Exemple Soit une série de 5 valeurs: 28, 42, 48, 59, 63 x (x-x) (x-x)2 -20 440 42 -6 36 48 59 11 121 63 15 225

Intervalle interquartile: regroupe 50% des valeurs de l’échantillon IQ=Q3-Q1= longueur de la boite du box plot Étendue de variation (range)=max-min Exemple: notes Étudiant A:8;9;10;11;12 Étudiant B:5; 5;6; ;15;19 Étendue A=12-8=4 Étendue B=19-5=14 SENSIBLE AUX VALEURS EXTREMES

Paramètres de dispersion: l’étendue de la variation L’étendue de la variation est définie par la valeur la plus grande et la valeur la plus petite de l’échantillon C’est une statistique simple mais qui est biaisée parce qu’elle sous-estime la valeur de la population. L’étendue de la variation de la population Fréquence L’étendue de la variation de l’échantillon

Paramètres de forme

Coefficient d’asymétrie (skewness) Mesure l'asymétrie d'une distribution, c'est-à-dire si elle "penche" d'un côté ou de l'autre. Où est le cube de l'écart type de la distribution distribution symétrique distribution tend vers la droite distribution tend vers la gauche

Coefficient d’aplatissement (kurtosis) Mesure l'aplatissement d'une distribution Où est la quatrième puissance de l'écart type de la distribution normale

Paramètre de dispersion d'une série statistique double Covariance sxy • La covariance est une généralisation à deux dimensions du concept de variance. Ce paramètre mesure la dispersion conjointe de deux variables. • La covariance renseigne sur la forme et l'orientation du nuage de points d'un diagramme de dispersion.

Présentation des données dans un listage logiciel

PH 3,48 3,51 3,55 3,57 3,59 3,6 3,72 3,79 3,82 3,83 3,85 3,86 3,89 3,91 3,92 3,93 3,96 4,06 4,12 Listage Excel