STATISTIQUE DESCRIPTIVE Dr LEMDAOUI MOHAMED CHERIF

Slides:



Advertisements
Présentations similaires
Introduction aux Statistiques
Advertisements

5. Statistiques.
Pr. Abdelkrim EL MOUATASIM EST de Guelmim Maroc
Présentation des données
Statistique descriptive
Chapitre 5. Description numérique d’une variable statistique.
Licence 3ème année de sociologie Semestre 1
Notions de variable aléatoire et de probabilité d’un événement
Statistique et probabilités au collège
Statistiques descriptives
INF L14 Initiation aux statistiques
la statistique descriptive se compose de 3 domaines distincts :   
STATISTIQUES Révision du 1er cycle
Les principaux résumés de la statistique
Groupe 1: Classes de même intervalle
Opération et systèmes de décision Faculté des Sciences de l administration MQT Probabilités et statistique Mesures caractéristiques.
Lectures Livre du cours :
Tableaux de distributions
Comprendre la variation dans les données: Notions de base
Statistique descriptive
Université dOttawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :47 1 Concepts fondamentaux: statistiques et distributions.
La statistique Définitions et méthodes. La statistique est la branche des mathématiques qui collecte, classe, analyse et interprète des données afin den.
Séries chronologiques et prévision
Méthodes statistiques
Mesures de position Ils s’expriment dans la même unité que les observations Moyenne et moyenne pondérée Exemple : on dispose du nombre moyen d’enfants.
Statistique Descriptive Analyse des données
Thème: statistiques et probabilités Séquence 3: Statistique descriptive Utiliser un logiciel (par exemple, un tableur) ou une calculatrice pour étudier.
Introduction à l’analyse statistique
EPIDEMIOLOGIE ET STATISTIQUE Pr LEMDAOUI.M.C
Rappels de statistiques descriptives
COURS STATISTIQUE - DESCRIPTIVE DEFINITIONS
STATISTIQUE DESCRIPTIVE ÉLÉMENTAIRE
STATISTIQUES DESCRIPTIVES
Micro-intro aux stats.
JEAN-MARC FONTAN SOC-1101 COURS 3
ANALYSE D’UN ÉCHANTILLON PORTANT SUR UNE VARIABLE STATISTIQUE
Seconde partie Cours de seconde
STATISTIQUE DESCRIPTIVE Dr LEMDAOUI MOHAMED CHERIF
Introduction à une analyse statistique de données
Statistiques descriptives-Distributions expérimentales à une dimension
VARIABLES ET MESURES DE FREQUENCES Pr. KELLIL M 1.
Collège Fontaine des Ducs
Concepts fondamentaux: statistiques et distributions
1 Licence Stat-info CM1 b 2004Christophe Genolini 2.1. Vocabulaire Individu : objet étudié Population : Ensemble des individus Variable : nom donné à ce.
Méthodologie de l’observation
Statistiques IUP-1 Statistiques I. Généralités II. Décrire III. Notion de probabilités IV. Tester V. De la corrélation à la cause VI. Évaluation de risques.
PARAMETRES STATISTIQUES
STATISTIQUES DESCRIPTIVES
Chapitre 2 La statistique descriptive I
Les distributions de fréquences et de pourcentages
Statistique Descriptive Les Paramètres de Tendance Centrale
Seconde 8 Chapitre 4: Les statistiques
Rapport 20 Final 40 Partiel TD.
Statistiques Première partie Cours de première S.
Opération et systèmes de décision Faculté des Sciences de l ’administration MQT Probabilités et statistique Les statistiques descriptives.
BIOSTATISTIQUES Définitions.
BIOSTATISTIQUES Définitions.
Paramètres de position et de dispersion
Mesures de description des valeurs des variables
Tests relatifs aux variables qualitatives: Tests du Chi-deux.
Nature de la statistique La statistique est la science qui étudie la collecte, la présentation, l’analyse et l’utilisation des données numériques en vue.
 Champ des mathématiques  Ensemble de méthodes et de techniques  Permet une analyse objective  Facilitées aujourd’hui par les tableurs.
Chapitre 4 Statistique descriptive 1. Echantillonnage statistique population On appelle population, un ensemble d’individus auquel on s’intéresse échantillon.
Biostatistique pour le troisième cycle P. Leroy, F. Farnir 2013.
TP1: Statistique application chapitre 2. Le tableau suivant reprend le taux d'intérêt (en %) payé par 20 banques sur les dépôts d'épargne de leurs clients.
Notions de statistiques et d’analyse de données Master 1 MGS – Sarah MISCHLER –
1 M1 MQSE Cours n°2 1 - Rappels du cours n°1 2 - La statistique: un outil pour décrire.
STATISTIQUE DESCRIPTIVE
Statistique descriptive
Transcription de la présentation:

FACULTE DE MEDECINE DE CONSTANTINE DEPARTEMENT DE MEDECINE ENSEIGNEMENT GRADUE 6ème Année 2014-2015 STATISTIQUE DESCRIPTIVE Dr LEMDAOUI MOHAMED CHERIF Pr Agrégé en Epidémiologie

I- INTRODUCTION Le mot statistique vient du mot latin « STATUS » situation ou état. - la statistique= méthode d’analyse et de raisonnement scientifique, mathématique appliquée à un ensemble de données - permet des généralisations afin d’établir des indicateurs, des indices, des liaisons et des prévisions.

Statistique Descriptive La statistique descriptive = instrument de description  simplifie, résume et synthétise. ne pas altérer la fidélité de l’information. organise et résume des observations. On ne fait pas de comparaisons on s'intéresse en général à un seul groupe, échantillon ou population.

II- POPULATION ET VARIABLES ensemble d'unités statistiques. .peuvent différer les uns des autres dans une même population, un même groupe, une même famille, ….etc, ces différences ne se résument pas à de simples erreurs de mesures, car chacun diffère des autres par ces gènes, par son environnement, par des hasards de la vie .

2- Unité Statistique unité sur laquelle va porter l’observation

3- Variable ou Caractère Un individu de la population : étudié selon certaines propriétés. Ces propriétés sont appelées caractères ou variables statistiques. Elles diffèrent d’un état à un autre et d’une unité d’observation à une autre

4- Modalité  éventualité que peut prendre un caractère. Chaque caractère possède deux ou plusieurs modalités.  

5- Caractère qualitatif  s’exprime par des qualificatifs, variable qui ne prend pas de valeur numérique nominal Exemple : sexe, nationalité, groupe sanguin, profession, couleur des yeux…etc . Chaque variable qualitative a plusieurs modalités.

ordinale ( échelle ordinale ) prend des valeurs qui sont ordonnées, hiérarchisées. On peut classer les modalités les unes par rapport aux autres . Exemple : évolution d’une maladie = état de santé du patient  amélioration, stabilité ou détérioration

Il existe un type particulier de variables qualitatives: variables binaires qui peuvent prendre que deux valeurs on les appelle aussi variables dichotomiques car elles partagent la population en deux parties ou variables booléennes pouvant prendre la valeur « vrai  » ou « faux » ou variables de Bernouilli codées respectivement 1 et 0

6 - caractère quantitatif Une variable quantitative est une variable qui prend des valeurs de nature numérique.

quantitative discrète ou discontinue Une variable quantitative discrète peut prendre des valeurs dénombrables, isolées séparées les unes des autres. Exemple : le nombre d'enfants d'un ménage  

Varibale quantitative continue Une variable quantitative continue peut prendre théoriquement toutes les valeurs à l'intérieur d'un intervalle entre deux modalités Exemple : la taille, l’âge, la glycémie, la pression artérielle ..etc..  

on représente généralement les variables sous forme de classe .  Une classe est caractérisée par son centre et son amplitude.  Les classes doivent être mutuellement exclusives et collectivement exhaustives.  Cette échelle de classification de l’information est une échelle dite par intervalle.

III- REGROUPEMENT DES DONNEES - le regroupement des données un tableau de fréquence à partir d’une série statistique ou d’un tableau brut de données. 1- Série statistique ensemble des données résultant du dépouillement d’une observation d’une population ou d’un groupe 2- Tableau brut des données tableau élémentaire de travail. Toutes les données y figurent, unité par unité et variable par variable ( tableau excel…) 3- Tableau de fréquence C’est une matrice à double entrée

Colonne type Entête de colonne EC EC rubrique Rubrique

- Horizontalement on a les lignes - Verticalement on a les colonnes - Entre l’entête des colonnes et la colonne type, l’ensemble des rubriques forme le corps du tableau. - Le titre du tableau, en haut, comporte trois informations essentielles, à savoir, le quoi, le quand et le ou, en plus de la source des données.

Tableau de fréquence Variable/Effectif Fréquence absolue =effectif Fréquence relative =fréquence Pourcentage =fréquence Total = effectif totale = 1 = 100%

Variable Fréquence absolue =effectif Effectif cumulée Fréquence F réquence cumulée N = 1 Total N= effectif totale

IV- REPRESENTATION GRAPHIQUE 1- Histogramme Il provient du mot grec « HISTOS » = tissu ou voile. C’est un diagramme en surface contiguës. Utile pour les distributions de variables quantitatives continues et discontinues

Répartition des cas de diabète sucré de type 2 en 2005 dans la commune de Constantine. Etude Epidiab constantine Thèse DESM 2009

2- Polygone de fréquence ligne polygonale, construite à partir de l’histogramme . Adapté à la représentation d’une variable quantitative continue mais aussi discontinue. Il convient généralement mieux que l’histogramme quand il s’agit de représenter plusieurs distributions de fréquences sur un même système d’axes

ALLURE GLYCEMIQUE A JEUN NON DIABETIQUES

3- Diagramme en bâtonnets ou en barres surfaces non contiguës. Utilisées surtout pour les caractères qualitatifs nominaux ou ordinaux.

TYPE DE DIABETE FAMILIAL DIABETIQUES

4- Diagramme en barres horizontales . variables qualitatives nominales

NOTION DE DIABETE FAMILIAL NON DIABETIQUES

5- Diagramme circulaire ou à secteurs En par de gâteau, camembert. représentation d’une seule distribution d’une variable qualitative nominale. Le camembert à la place d’un diagramme en barres / le nombre de classes faible .

ACTIVITE PHYSIQUE DIABETIQUES HOMMES

6- Pyramide double histogramme inversé et juxtaposé. pour la distribution d’une population selon l’âge et le sexe en démographie.

MESURES DE TENDANCE CENTRALE OU PARAMETRES DE POSITION - Moyenne Arithmétique C’est la somme de chacune des valeurs observées d’une variable donnée sur le nombre de valeurs observées ( effectif ). n ∑Xi X1+X2+……..Xn 1 M=---------------------------------= -------------- N N Mais souvent les valeurs X1,X2….se répètent on a alors la moyenne arithmétique pondérée. k ∑ niXi 1 M= ----------------- N

- Médiane valeur du caractère qui divise l’ensemble des valeurs observées disposées en ordre croissant ou décroissant, en deux parties égales . En théorie: 50% > et 50% < La médiane est une valeur de rang (n+1)/2 Les fréquences relatives cumulées permettent de situer la médiane aussi bien sur la représentation tabulaire que graphique. n’est pas influencée par les valeurs extrêmes contrairement à la moyenne arithmétique.  utilisée la médiane pour décrire une tendance centrale d’une distribution fortement asymétrique. Elle est utilisée dans le cadre des variables quantitatives.

- Quartiles divisent la distribution en quatre parties - Quartiles divisent la distribution en quatre parties. Il sont au nombre de trois : * premier quartile : valeur de la variable ou 25% sont inférieures et 75% sont supérieures. * deuxième quartile= médiane * troisième quartile : valeur de la variable ou 75% sont inférieures et 25% supérieures - Déciles et percentiles * Déciles : partagent la distribution en dix. Ils sont au nombre de neuf Chaque partie comprend 10% des effectifs * Percentiles : valeurs partageant la distribution d’une variable en 100 groupes. On a : - percentile 10%= premier décile ( 10%inf et 90% sup ) - percentile 25%= premier quartile - percentile 50%= médiane - percentile 90%= neuvième décile ( 90%inf et 10% sup)

- Mode valeur du caractère qui revient le plus souvent valeur de la variable qui a le plus grand effectif valeur dominante. distribution uni modale : un seul mode bimodale : deux modes.

Mesures de dispersion - Etendue C’est la différence entre la plus grande et la plus petite des valeurs observées. - Variance n 2 ∑ ( x- M ) . ni 2 1 σ = ----------------- N La variance = mesure de dispersion intéressante pour évaluer la variabilité l’homogénéité ou non d’une population ou d’un groupe par rapport à différentes variables. La variance la dispersion des observations autour de la moyenne influencée par les valeurs extrêmes  la dispersion autour de la médiane.

- Ecart type ou déviation standard Mesure la dispersion autour de la moyenne arithmétique N 2 ∑ ( x-M ) . ni 1 σ = racine de carrée de …………………… N En biologie par exemple: l’intervalle de normalité= M+ou -2

- l’intervalle semi-interquartile Q = Q3-Q1 / 2 Plus les valeurs observées sont concentrées plus les quartiles Q1 et Q3 sont rapprochés, plus Q est petit, témoignant d’une faible variabilité. - Coefficient de variation pour comparer deux distributions de variables différentes. les unités sont différentes  mesure relative de dispersion appelée : le Coefficient de variation égal à : σ CV= ……. * 100 ( % ) M

regroupement, organisation et réduction des données  paramètres . VI- CONCLUSION statistique descriptive trouve donc sa place dans le cadre de l’étude des phénomènes et des évènements de santé. regroupement, organisation et réduction des données  paramètres . Cette simplification primordiale  pistes de recherche : domaine épidémiologique, clinique, biologique.

Références Bibliographiques 1- Anahita Basirat, Initiation aux statistiques descriptives .cours Vocabulaire de base : Statistique descriptive , Statistique inférentielle . anahita.basirat@gipsa-lab.inpg.fr Janvier 2009 2- Epidémiologie ; Principes et méthodes quantitatives. Notions de base en statistique p 162, Editions INSERM 1995 3- Marie Bernard .P,Lapointe .C, Mesures Statistiques en Epidémiologie.Variables et échelles de classification p4-8 ; Mesures de base p 24-41 ; Presses de l’université du Québec 1987 4- Ancelle T, Statistique Epidémiologie, chapitres : 1-2-3-45, P 4-4O Maloine, 2002