Nature de la statistique La statistique est la science qui étudie la collecte, la présentation, l’analyse et l’utilisation des données numériques en vue d’aide à la prise de décision. La statistique est subdivisée en : – Statistique descriptive : synthèse et présentation des données – Statistique inférentielle (Mathématique) : Processus qui s’intéresse à la population à travers l’examen des échantillons Mme GUERRAB.A
Définition de la statistique Descriptive C’est un ensemble de méthodes permettant de décrire et d’analyser de façon quantifiée des phénomènes repérés par des éléments nombreux, de même susceptible d’être dénombrés et classés. Mme GUERRAB.A
Concepts fondamentaux de la statistique Population et individu: – Population : l’ensemble des éléments auxquels se rapportent les observation objet de l’étude. Exemple : l’ensemble du parc auto, L’ensemble des Algériens, interventions chirurgicales, accidents de la route,…. – Echantillon : est une partie ou sous-ensemble de la population considérée. – Individu : représente l’élément ou l’unité statistique composant la population. Mme GUERRAB.A
Concepts fondamentaux de la statistique – Variable et caractère : représentent les aspects particuliers de la population auxquelles nous nous intéressons, Notées x i, y i Exemple : Le personnel d’une entreprise peut être classé par : Grille de salaire, niveau d’instruction, âge, sexe. Remarque : Une variable ou un caractère peut être présenté selon une, deux ou plusieurs situations appelés modalités. Mme GUERRAB.A
Concepts fondamentaux de la statistique Variable qualitative : Lorsque l’observation n’est pas mesurable ( Profession, nationalité, couleur, secteur d’activité, goût,…) Variable quantitatives : quand les observations sont mesurables par un nombre traduisant sa valeur (Âge, la taille, le prix, le nombre d’enfant par ménage, …) Variable quantitative discrète : prend des valeurs isolées comme {0,1,2,…}. Exemple : nb d’enfant par ménage, nb de pièces par appartement, nb de salarié d’une entreprise. Variable quantitative continue : Si elle prend toutes les valeurs d’un intervalle. Les observations sont groupées en Classes. Exemple : niveau de stock, taille, le poids,… Mme GUERRAB.A
Concepts fondamentaux de la statistique Population Variable statistique Variable quantitative Discrète Continue Variable qualitative Echantillon Inférence Statistique Estimation Mme GUERRAB.A
Concepts fondamentaux de la statistique Effectif : Appelé fréquence absolue, il est noté n i désigne le nombre d’individus de la population présentant la modalité de la variable x i. Si N est l’effectif globale et r est le nombre des modalités alors : On défini l’effectif cumulé en x i par Fréquence : Appelée fréquence relative, elle est notée fi et exprime la proportion (%) d’individus présentant la même modalité de la vs On défini la fréquence cumulée en x i par Mme GUERRAB.A
Représentation des données Tableau statistique : Tableau qui relève pour chaque modalité de la variable statistique, l’effectif ou la fréquence. On appelle l’ensemble des couples (x i ; n i ) une distribution statistique. Variable quantitative discrète : Diagramme en bâtons. Variable quantitative continue : Histogramme. Variable qualitative : Diagramme circulaire. Var statistiqueEffectif Modalité 1 Modalité 2 … n1 n2 TotalN Mme GUERRAB.A
Représentation des données qualitatives Exemple 1 : On a enquêté sur la situation familiales des 20 employés. Le résultat suivant a été obtenu : Population : 20 employés Individu : Un employé Var stat : Situation familiale Type de vs : Qualitative Modalité : M(marié); C(célibataire); D(divorcé ); V(veuf) Situation familiale Effectif (ni)Fréquence (fi)Angle° C70,35360°×0,35= 126 M80,40360°×0,40=144 V20,10360°×0,10=36 D30,15360°×0,15=54 Total201 Mme GUERRAB.A
Représentation des données qualitatives Mme GUERRAB.A
Représentation des données qualitatives Mme GUERRAB.A
Représentation des données Exemple 2 : Une enquête sur le nombre d’enfant par famille a donnée le résultat suivant: Var stat : Nombre d’enfant par famille Type de vs : Quantitative, discrète. Le nb de famille ayant 2 enfants et moins = =50 soit F 2 = 0,5 NB enfant/familleEffectif (ni)Fréquence (fi) 01010/ / / / /100 Total1001 Mme GUERRAB.A
Représentation des données Mme GUERRAB.A
Représentation des données Exemple 2 : Une enquête sur les salaires des employés d’une entreprise a donné le résultat suivant: Var stat : salaire des employés Type de vs : Quantitative, continu. Le nb des employés ayant un salaire < = =40 soit F = 0,2 Mme GUERRAB.A
Représentation des données ClassesCentre Fréq Fréq cum [1000;2000[150,08 [2000;3000[250,210,29 [3000;4000[350,260,55 [4000;6000[500,310,86 [6000;8000[700,141 Mme GUERRAB.A
Représentation des données Histogramme des effectifs Mme GUERRAB.A
Représentation des données Exemple : Les travailleurs dans un chantier de TP ont reçu la fin du mois les salaires suivants : 6, 7, 6, 8, 5, 7, 6, 9, 10, et 6. RevenuEffectifsFréquence 510,1 640,4 720,2 810, ,1 TOTAL101 Mme GUERRAB.A
Représentation des données Histogramme des effectifsHistogramme des fréquences Revenus Effectifs Fréquences Mme GUERRAB.A
Les Mesures de la tendance centrale En statistiques, la tendance centrale désigne le point autour duquel se regroupent à un certain degré les différentes valeurs d'une variable quantitative mesurées dans un échantillon ou issues d'une population, c'est-à-dire le « centre » autour duquel ces valeurs « tendent » à se concentrer. Il existe plusieurs mesures de la tendance centrale dites aussi critères de position ; les plus connues sont la moyenne, la médiane ou le mode.statistiquesquantitativeéchantillonpopulationmesuresmoyennemédianemode Mme GUERRAB.A
Les Mesures de la tendance centrale 1.Le Mode 2.La Médiane 3.La Moyenne Mme GUERRAB.A
Les Mesures de la tendance centrale Le Mode (Mo) Variable quantitatives discrète Définition : Le mode est la valeur de la variable qui a l’effectif ou la fréquence la plus élevée. Il existe des séries uni-modales (un mode) et des séries plurimodales (plusieurs modes). Exemple : Soit la production d’un bien durant les 12 mois: La production ayant le plus grand effectif est 8 MoisJanFevMarAvrMaiJuil AoûtSepOctNovDéc Prod Mme GUERRAB.A
Les Mesures de la tendance centrale Le Mode (Mo) Exemple 2 : Lors d’un sondage de 1000 ménages sur le nombre de pièces dans leurs appartements, on a : On dit que la modalité 3 pièces est le mode car max n i = 296 Nombre de piècesEffectifs Mme GUERRAB.A
Les Mesures de la tendance centrale Variable continue Le calcul passe par 2 étapes 1.Déterminer la classe modale: Max n i si les amplitudes a i sont constantes, si non max densité d i = ni/ai (amplitude) 2.Calculer le mode à l’intérieur de la classe modale par le biais de la formule Avec – [x 1 ; x 2 [ la classe modale – k1: l’écart entre la hauteur de la classe modale et celle de la classe venant avant la classe modale – k2 : l’écart entre la hauteur de la classe modale et celle de la classe venant après la classe modale Mme GUERRAB.A
Les Mesures de la tendance centrale Le Mode d’une Var stat continue Exemple 3 : Le nombre de personne atteint d’une maladie par tranche d’âge est repris comme suit : L’âge modal de la population étudiée est 19,49 ans soit 19 ans et presque 6 mois ÂgeNb de personne [5; 10[7632 [10; 15[12316 [15; 20[26192 [20; 25[24631 Mme GUERRAB.A
Les Mesures de la tendance centrale La Médiane (Me) Définition : La médiane est la valeur de la série pour laquelle l’effectif est divisé en deux. Dans le cas discret : Les obs sont classées par ordre croissant, on distingue 02 cas : 1.Le Nb d’obs est impair (N = 2p+1) : Me = x p+1 2.Le Nb d’obs est pair (N = 2p): Me = (x p + x p+1 )/2 Exemple 1: Les notes de 11 élèves dans un examen sont : 7 – 9 – 8 – 14 – 16 – 8 – 14 – 16 – 13 – 7 – 12 Les obs classées : 7 – 7 – 8 – 8 – 9 – 12 – 13 – 14 – 14 – 16 – 16 N = 11, P = 5 et Me = x 6 = 12 Mme GUERRAB.A
Les Mesures de la tendance centrale La Médiane d’une var discrète Interprétation : Le nb d’élèves ayant une note 12. Exemple 1: On rajoute un 12 ème élève ayant obtenu la note 10 7 – 9 – 8 – 14 – 16 – 8 – 14 – 16 – 13 – 7 – 12 – 10 Le classement : 7 – 7 – 8 – 8 – 9 – 10 – 12 – 13 – 14 – 14 – 16 – 16 N = 12 et p = 6 alors Me = (x 6 + x 7 )/2 = ( )/2 = 11 Interprétation : Le nb d’élèves ayant une note 11. Mme GUERRAB.A
Les mesures de la tendance centrale La médiane d’une variable continue 02 Méthodes pour le calcul de la Me : – Localiser Me à l’aide du graphe des fréquences cumulées croissantes et décroissante F i ; – Calcul de la Me par extrapolation linéaire; [x k-1 ; x k [ : la classe qui contient Me (classe médiane) F k : la fréquence croissante de la classe médiane F k-1 : la fréquence croissante de la classe venant avant la classe médiane; Me est donnée par : Mme GUERRAB.A
Les mesures de la tendance centrale La médiane d’une variable continue Exemple : On s’intéresse sur le temps passé devant le PC auprès de 68 personnes : Calculer la médiane? Temps devant PCEffectifFréquenceFi [0; 15[14 21% [15; 30[10 15% 35% [30; 60[16 24% 59% [60; 120[20 29% 88% [120; 180[8 12% 100% Mme GUERRAB.A
Les mesures de la tendance centrale La médiane d’une variable continue Me correspondant à 50 % est située dans [30; 60[ 50% de l’effectif total soit 34 personnes restent devant leurs PC moins de 49 mn. L’autre moitié reste plus de 49 mn devant le PC Mme GUERRAB.A
Les Mesures de la tendance centrale La moyenne Moyenne arithmétique simple : sur une série de N observations, on a Les notes de six étudiants sont : 8 – 9 – 12 – 10 – 11 – 5, la moyenne est Moyenne arithmétique pondérée : Sur K observations Mme GUERRAB.A
Les Mesures de la tendance centrale La moyenne Exemple : considérons le nombre d’enfant dans 850 ménages Nbre d’enfantEffectifsn i. x i Somme Mme GUERRAB.A
Les Mesures de la tendance centrale La moyenne Si c i est le centre de la classe i alors la moyenne est donnée par Exemple : Le nombre de personne atteint d’une maladie par tranche d’âge est repris comme suit : ÂgeCentre de classeNb de personne [5; 10[7,57632 [10; 15[12, [15; 20[17, [20; 25[22, Mme GUERRAB.A
Les Mesures de la tendance centrale Les quantiles Définition: On suppose que les modalités de la série statistique sont rangées dans l’ordre croissant. Soit p un réel tel que 0 < p < 1, on lui associe la valeur de la série, notée Q p, appelée quantile d’ordre p. Le quantile est une valeur de la variable telle qu’au moins p % des observations ont une valeur = à Q p. Exemple : Si « 10 % des salariés gagnent un salaire annuel net inférieur à DA ». Alors, on dit que DA constitue le quantile d’ordre 0,10 ou 10% de la série des salaires considérée. Mme GUERRAB.A
Les Mesures de la tendance centrale Les quantiles Les quantiles les plus courants sont : 1.les trois quartiles partagent la série en quatre groupes comprenant chacun 25 % des observations ; 2.les neuf déciles partagent la série en dix groupes comprenant chacun 10 % des observations ; 3.les quatre-vingt-dix-neuf centiles partagent la série en cent groupes comprenant chacun 1 % des observations. Mme GUERRAB.A
Les quartiles Les 3 quartiles Q1/4, Q1/2 et Q3/4 se calculent par interpolation linéaire de la même façon que la Me. Q1 est le quantile d’ordre 0,25 : au moins 25 % des observations sont inférieures ou égales à Q1 et au moins 75 % supérieures ou égales à Q1. Q2 est le quantile d’ordre 0,50 : au moins 50 % des observations sont inférieures ou égales à Q2 et au moins 50 % supérieures ou égales à Q2 ; Q2 est égal à la médiane. Q3 est le quantile d’ordre 0,75 : au moins 75 % des observations sont inférieures ou égales à Q3 et au moins 25 % supérieures ou égales à Q3. Mme GUERRAB.A
Les quartiles Exemple Le nombre de personnes malades par tranches d’âge : ÂgeEffectif FréquenceFi [5; 10[ % [10; 15[ %28% [15; 20[ %65% [20; 25[ %100% Mme GUERRAB.A
Les mesures de la dispersion 1. L’ÉTENDUE Cette mesure est la différence entre la plus grande et la plus petite valeur observée. E = Max (xi) – Min (xi) 2. LES ÉCARTS INTERQUANTILES L’intervalle interquartile [Q1 ; Q3] comprenant 50 % de la série; on le note : EIQ = Q3/4 – Q1/4. Mme GUERRAB.A
Les mesures de la dispersion 4. LA VARIANCE ET L’ÉCART-TYPE Dans le cas de n observations, la variance est donnée par : L’écart-type, noté σ x, est la racine carrée de la variance. Dans le cas de n observations présentant r modalités : Mme GUERRAB.A
Les mesures de la dispersion 5. LE COEFFICIENT DE VARIATION Le coefficient de variation noté CV(x) est le rapport de l’écart- type à la moyenne et défini par : Soient 2 séries statistiques x et y, Si CV(x) > CV(y) alors on dit que la série x est plus dispersée que la série y. Exemple : Considérons Le nombre de personnes malades par tranches d’âge : La moyenne est 17,29 ans La variance est 23,79 soit un écart-type de 4,87 ans Mme GUERRAB.A
Les caractéristiques de forme 1. L’ASYMÉTRIE (SKEWNESS) Mme GUERRAB.A