STATISTIQUES pour la Gestion JM. Petit M. Belkhadir JP Bouffenie

Slides:



Advertisements
Présentations similaires
Du chapitre 1 au chapitre 2 1. Les graphiques : introduction (p.19)  Pour prendre possession des données o des chiffres dans un tableau, c’est bien o.
Advertisements

Introduction à la notion de fonction 1. Organisation et gestion de données, fonctions 1.1. Notion de fonction ● Déterminer l'image d'un nombre par une.
Intégration et usages innovants de la vidéo dans les pratiques pédagogiques en Economie et Gestion. Réunion du 11 mars 2016 – Usages numériques et TRAAM.
Des outils pour travailler la compréhension au cycle 2 Je lis, je comprends CE1.
Volée 1316 S3 Cours No 2_3 : Le nombre en 1-2H. Les fonctions du nombre  Dénombrer, énumérer, décrire une collection. Aspect cardinal  Dater, classer,
Dr. Tarek Barhoumi statistiques descriptives Statistiques descriptives Dr. Tarek Barhoumi.
Calcul de probabilités
Exploitation de mesures scientifiques.
Le Mouvement Directionnel
Outils de suivi des compétences
Reforme du collège physique chimie au cycle 4
Suites ordonnées ou mettre de l’ordre
Chapitre 4: Variation dans le temps
Une étude pour Les entreprises de moins de 20 salariés et le projet de loi Travail, dit « El Khomri » Comment se positionnent notamment les artisans, les.
PIB en valeur et en volume
épreuve E6 questionnement possible
Valeurs de toutes les différences observables sous H0
ELABORER UN CAHIER DES CHARGES Formuler une préconisation
Ecriture collaborative d’une dissertation en classe
Reprise du cours ( ) Aujourd’hui :
Chapitre 4: Variation dans le temps
Contribution: Revue des études, enquêtes et systèmes d’informations disponibles au niveau de l’INS, pour alimenter la méthode d’analyse et la cartographie.
7.10 Le suivi des évaluations annuelles Textes de référence Norme AFNOR NF X § 5 Compétences requises liées aux fonctions 7.10 Le suivi.
Direction Régionale Tanger- Tétouan مديــرية جهــة طنجــة – تطــوان
Les Mathématiques en Seconde
STRATÉGIES ET INSTRUMENTS D´ÉVALUATION
Anne Burban – Anne Szymczak
Statistiques Sociales LC3
Tableau de bord des risques
Épreuve E5 Diagnostic opérationnel et proposition de solutions
Méthode Taguchy Analyse de la variance Anavar
Troisième Chapitre 3: Statistiques
Institut Universitaire Virtuel de Formation des Maîtres
Pourquoi étudier la statistique ?
Deuxième partie LE DOSSIER TECHNIQUE DU MARINGOUIN.
Formation sur les bases de données relationnelles.
POL1803: Analyse des techniques quantitatives
Chapitre 3 : Caractéristiques de tendance centrale
Thèmes de convergence 10/11/2018.
L1 Technique informatique
LES ÎLOTS BONIFIES.
A l’aide du triangle pédagogique de Jean Houssaye
4°) Intervalle de fluctuation :
Lois de Probabilité Discrètes
Programme financé par l’Union européenne
Chapitre 4: Caractéristiques de dispersion
Les indices simples Définition
Mesures de Position Dispersion et Forme
Présentation 4 : Sondage stratifié
Présentation 9 : Calcul de précision des estimateurs complexes
chapitre 3 Les Statistiques
Chapitre 8 : Organisation et gestion de données
Jean-Sébastien Provençal
Reconnaissance de formes: lettres/chiffres
La qualification de la clientèle
Présentation 6 : Sondage à plusieurs degrés
Conception cartographique
Analyse des données et complémentarité des sources
Conception cartographique
Dans toutes les séries technologiques, les compétences de la démarche scientifique structurent la formation en physique-chimie et les évaluations. Compétences.
Tableaux croisés dynamiques sous Excel: des outils simples pour une analyse rapide de jeux de données en cytométrie Camille SANTA MARIA Ingénieur d’étude.
Design, innovation et créativité
Statistiques et probabilités
μ = N 3) Moyenne d’une série discrète : ∑ ni xi que l’on peut noter
Support de formation Administrateur Entretiens
2. Traiter et suivre les réclamations
Pour en moduler l’ouverture et la complexité
Variables statistiques discrètes
Exercice 2 Soient les notes obtenues dans une classe par les élèves, et leur appartenance aux groupes 1 ou 2 : 8(groupe 1), 9(groupe 2), 11(groupe 2),
Séquence 1:Analyse du système d’information comptable
Transcription de la présentation:

STATISTIQUES pour la Gestion JM. Petit M. Belkhadir JP Bouffenie A. Moraglia JB Rudant A. Saïdane Premier ppt pour expliquer règles, déroulement du cours, le book…

Bienvenue dans ce cours Statistiques pour la Gestion Sommaire de la première partie Présentation des objectifs de ce cours dans votre parcours de formation Les « Règles du jeu »: Modalités de travail et évaluation Les grandes parties qui structurent ce cours Premier Cours sur les Séries Statistiques Desriptives Univariées (SSDU) Annales corrigées sur la partie SSDU Premier Cours : Focus sur les étapes 1 et 2 cf. Chapitres 1 et 2 partie cours du book

En management d’entreprises, on utilise les statistiques et probabilités dans de multiples domaines : Economie, Gestion, Marketing, RH, Communication etc… Il s’agit avant tout d’ outils de traitement et d’analyse d’informations chiffrées et d’aide à la décision. Objectifs du cours Jean-Marc Petit

Objectifs du cours Analyser ? Prévoir ? Anticiper ? Piloter ? Analyser ? Pour maîtriser la gestion Prévoir ? Pour anticiper le marché, les besoins logistiques (appro, livraisons, RH…) Anticiper ? Pour Piloter …. Piloter ? La bonne conduite d’une entreprise passe par la maîtrise des informations et donc par le traitement des données : statistiques mais aussi économique, de contrôle de gestion… Nous sommes un maillon de la chaîne du manager performant

Objectifs du cours Existant Contrôle Prévisions Prise de décision Moyens Méthodologie d’analyse : étape après étape Maîtrise des outils : lesquels, quand, comment, pour quels résultats resitués dans la problématique managériale Existant Prise de décision Pilotage Données Information Traitement statistique Contrôle PB Situation managériale Anticipation Prévisions Les données de départ (ex ensemble de CA) sont transformées en informations pertinentes : CA moyen, 20% des produits concentre 80% du CA total …. Objectifs Répondre à un problème Apporter des informations pertinentes Aider à la prise de décision(s) La mise en œuvre d’études statistiques permet de collecter, classer, présenter, analyser des données pour déboucher sur une analyse de l’existant (SSDU); modéliser l’existant pour ensuite prévoir (SC) Moyens Méthodologie d’analyse : étape après étape Maîtrise des outils : Lesquels : connaître les outils pour avoir une idée des traitements possibles Quand : quand peut-on les utiliser (CHI2, par exemple, il n’est pas possible d’étudier les caractéristiques de variabilité si le caractère est qualitatifi …), comment (comprendre les formules et exploiter un tableur), pour quels résultats resitués dans la problématique managériale et des analyses prévisionnelles (dans tout le cours nous mettrons l’accent sur l’importance de l’interprétation)

E Objectifs du cours Et donc à l’issue de ce cours Vous saurez élaborer un dossier professionnel En créant des enquêtes En mobilisant des données existantes En choisissant les méthodes et outils adéquats En déjouant les chausses trappes Afin de construire des interprétations pertinentes permettant d’éclairer le prises de décisions

II. Règles du jeu STATISTIQUES POUR LA GESTION COURS = chaque CM est articulé avec 1 TD Vous aurez à votre disposition: -Des supports numériques pour retravailler le CM et préparer votre TD. -Des polys d’exercices pour travailler en TD des mini cas/exercices « maison » à préparer pour être évalué par votre professeur de TD Votre extranet SKEMA Knowledge est à consulter obligatoirement: (Supports de cours, doc de travail et ressources complémentaires) Leur montrer knwodge

II. Règles du jeu (suite) STATISTIQUES POUR LA GESTION II. Règles du jeu (suite) Matériel : Calculatrice, book, polys d’exercices Et… …votre ordinateur pour QCM en ligne en début de TD et application EXCEL ou open Office des exercices. Si un étudiant l’utilise hors besoin du cours (mail, Facebook), il sera exclu du cours avec 5 points de pénalités sur la note de participation. Cette pénalité sera également appliquée en cas de comportement non éthique. Si un étudiant l’utilise hors besoin du cours (mail, Facebook), il sera exclu du cours A la discrétion du professeur, par exemple, la première fois exclu de la séance avec pénalité et la deuxième fois exclu du cours et donc automatiquement en rattrapage et l’ordinateur sera supprimé de la séance pour tous les étudiants Pour autodiscipline

Règles du jeu (suite) STATISTIQUES POUR LA GESTION Les évaluations ! Contrôle continu : 50% : Note de participation 10% : 20/20 (-3) retard ou absence excusée hors activités organisées par l’Ecole (ex: salon…) (-5) absence non excusée ou cas grave reconnu par le responsable du cours sur le campus. – usage inapproprié de l’ordinateur Bonus possibles sur cette note également en fonction de la participation : jusqu’à 25/20 ! Mini quizzs et Exercices de TD: 20% Cas d’invention Dossier+ Présentation: 20% Mais 2 absences maximum (excusées ou non) (et au-delà que décidons nous?) ? Pour SSDU/CHI2 1 à 2 notes par étudiant. Soit toutes les copies sont à remettre en début de cours et quelques copies sont choisies au hasard pour être notées à chaque séance y compris en amphi. Soit le professeur relève qq copies et note aléatoirement Soit le professeur demande qq copie pour vérifier que le travail est fait et met bonus/malus et relève VLJFree en fin de SSDU

Les notes Contrôle Continu! STATISTIQUES POUR LA GESTION Les notes Contrôle Continu! Mini QCM début de TD + exercices de préparation pour évaluer la préparation du TD à partir du CM. Cas d’invention : Séries Chronologiques La dernière séance de TD est consacrée à finaliser un cas inventé et préparé par groupes de 4/5 étudiants sur la base d’un cahier des charges fourni (disponible sous knowledge). Le professeur échange avec chaque groupe afin d’&évaluer la contribution de chacun (d’où la présence en TD indispensable, sinon évaluation=0). Ce cas d’invention doit permettre un lien entre le cours et des situations réelles possibles avec également des applications des outils informatiques.

STATISTIQUES POUR LA GESTION Les notes ! Examen final : 50% sous forme d’un QCM comportant : Des questions de cours Des exercices sous forme de mini cas Quelques questions porteront sur les lois de probabilités (traitées en RAN) et que vous pouvez réviser via les books sous knowledge et de tutoriels sous knowledge Ordinateur non autorisé pendant l’épreuve (en raison du caratère communiquant de ces appareils) Calculatrice autorisée (et vivement recommandée) Examen de rattrapage : QCM (100% de la note de rattrapage). Il portera sur l’ensemble du cours: parties 1, 2 et 3 Préciser que c’est le cas pour tous les examens de rattrapage (compteur remis à 0) Exam rattrapage question bonus ? Ou question ouverte qui peut examinée pour réajuster la note de quizz…. A décider ensemble

Cours en 3 grandes parties Avec 2 remises à niveau pour les compétences nécessaires aux cours de SKEMA (marketing, économie, finance…) Séries Statistiques Descriptives Univariées Tests de CHI2, et analyse bivariée Séries Chronologiques et Variations Saisonnières 1. RAN MATHS 2. RAN probabilités SSDU Série Statistique Descriptive Univariée Exemple : étude du CA du panier moyen du nouveau site d’e-commerce d’une entreprise Tests, analyse bivariée Exemple CHI2: étude de la dépendance entre le CA du panier moyen et la catégorie socio-professionnelle ou l’âge ou la région… SC Série Chronologique Exemple : étude de l’évolution de ce CA dans le temps avec l’analyse de la saisonnalité pour aider au contrôle de gestion et pour mieux programmer les livraisons

STATISTIQUES DESCRIPTIVES DE QUOI S’AGIT-IL ? Il s’agit bien d’un outil de description, support pour l’analyse, sans s’y substituer. Par exemple, Il ne faut pas confondre lien et interprétation causale : Les statistiques vont mettre en évidence un lien entre population hospitalisée et surmortalité comparée à la population générale Cela ne signifie pas que l’hospitalisation soit la cause de la surmortalité… Jean-Marc Petit

STATISTIQUES DESCRIPTIVES Déjouer les résultats statistiques qui induisent une interprétation erronée… Par exemple étudions les naissances sur 6 périodes on obtient le graphique suivant : Qui montre une baisse puis une remontée Années 2004 2005 2006 2007 2008 2009 Nbre de naissances en Milliers 10 8 6 12 Jean-Marc Petit

STATISTIQUES DESCRIPTIVES Déjouer les résultats statistiques qui induisent une interprétation erronée… Recommençons l’étude sur 2 périodes tri-annuelles Jean-Marc Petit

STATISTIQUES DESCRIPTIVES Déjouer les résultats statistiques qui induisent une interprétation erronée… Recommençons l’étude sur 3 périodes bi-annuelles on obtient le graphique suivant : Plus proche du modèle original, ci-dessous On le verra plus loin les regroupements doivent être objet d’attention, Jean-Marc Petit

LA DEMARCHE D’ETUDE STATISTIQUE Le Plan d’Etude d’une Série Statistique Descriptive Univariée 1 Définition du problème 2 Formalisation 3 Collecte 4 Dépouillement et tri 5 Regroupement 6 Graphiques 7 Résumé 8 Conclusion

LA DEMARCHE D’ETUDE STATISTIQUE La démarche d’étude statistique. La définition du problème Au départ, on trouve un objectif qui demande un certain nombre de renseignements chiffrés afin d’adopter une stratégie adapté. Pour améliorer mes recettes locatives je souhaite mieux adapter mon parc de logement aux caractéristiques de la population locale Pour cela j’ai besoin de mieux connaître - , LA DEMARCHE D’ETUDE STATISTIQUE Jean-Marc Petit

LA DEMARCHE D’ETUDE STATISTIQUE 2. La Formalisation Qui? Pour quelles caractéristiques? 2.1 La Population. Il convient de bien cerner la population concernée par notre étude. Ici, on définira un périmètre de population concernée, susceptible de vouloir habiter dans la zone géographique où se situe le parc locatif. i Nbre d’enfants : xi ni 1 10 2 20 3 40 4 5 6 Jean-Marc Petit

LA DEMARCHE D’ETUDE STATISTIQUE 2. La Formalisation Qui? Pour quelles caractéristiques? 2.1 La Population. On pourra également créer des groupes de sous populations à des fins de comparaisons ou de segmentation du marché. Par exemple on pourrait étudier la population cadre d’une part et des employés d’autre part car on dispose d’immeubles de standings différents i Nbre d’enfants : xi ni 1 10 2 20 3 40 4 5 6 Jean-Marc Petit

LA DEMARCHE D’ETUDE STATISTIQUE 2. La Formalisation Qui? Pour quelles caractéristiques? 2.1 La Population. On pourra également travailler sur des échantillons: - Totalement aléatoires. - Aléatoires et Représentatifs . Exemples pour un logement : En revanche couleur des cheveux, peu pertinent pour des logements, mais utile si on lance des lunettes… i Nbre d’enfants : xi ni 1 10 2 20 3 40 4 5 6 C’est-à-dire que dans l’échantillon, sur un certain nombre de critères, on retrouvera les mêmes pourcentages que dans la population mère. On parlera de Méthode des Quotas

LA DEMARCHE D’ETUDE STATISTIQUE 2. La Formalisation Qui? 2.1 La Population. Une population sera composée d’individus. Même s’il s’agit d’objets Chaque individu sera classé sur la base des caractéristiques étudiées. Le regroupement d’individus sur une même caractéristique constituera des effectifs, qualifiés de fréquences absolues: ni A différencier des fréquences relatives fi (part du tout) i Nbre d’enfants : xi ni 1 10 2 20 3 40 4 5 6

LA DEMARCHE D’ETUDE STATISTIQUE 2. La Formalisation Quoi? 2.1 Les Caractères. Il s’agit de la caractéristique étudiée pour laquelle des modalités ont été repérées. La population se répartira sur les différentes modalités du/des caractères étudiés ici i Nbre d’enfants : xi ni 1 10 2 20 3 40 4 5 6 Ages 20 - 25 26-30 30-35 nbre d'enfants 5 6 4 1 8 9 7 2 12 11 13 3 Deux caractères étudiés Simultanément Série bivariée Un seul caractères étudié: Série Univariée: SSDU

LA DEMARCHE D’ETUDE STATISTIQUE 2. La Formalisation 2.1 Les Caractères. (Quoi?) Classes ni [0;4[ 1500 [4;12[ 2500 [12;14[ 4500 [14;18[ 5500 [18;20[ 7000 Catégories Nbres agriculteurs 20 artisans 15 commerçants 10 cadres 5 Q……………… Q……………….; i xi ni 1 10 2 20 3 40 4 5 6 Catégories Nbres ouvrier 20 Contremaître 15 Techniciens 10 Cadres 5 Q……………………… Q………………………

LA DEMARCHE D’ETUDE STATISTIQUE 2. La Formalisation 2.1 Les Caractères. (Quoi?) Si lecractère est qualitatif nominal les cumuls n’ont pas de sens, on ne peut dire qu’il y a 35 personnes ayant un statut inférieur à commerçants Alors que pour un caractère qualitatif ordinal le cumul a du sens : ici 35 personnes ont un statut………………………. Catégories ni NI ouvrier 20 Contremaître 15 35 Techniciens 10 45 Cadres 5 50 Catégories Nbres agriculteurs 20 artisans 15 commerçants 10 cadres 5

LA DEMARCHE D’ETUDE STATISTIQUE 2. La Formalisation 2.1 Les Caractères quantitatifs. (Quoi?) Des élément non divisibles mais aux modalités multiples seront étudiées selon un caractère continu ex: des production de voitures : La caractère continu en statistiques est différent de la continuité mathématique car limité par l’observation: L’âge est connu dans la limite du relevé. (minute) âges ni [0;4[ 1500 [4;12[ 2500 [12;14[ 4500 [14;18[ 5500 [18;20[ 7000 Productions Nombre d’usines [1000;2000[ 5 [2000;2200[ 8 [2200;2400[ 10 [2400;2600[ 6 [2600;2800[ 4

LA DEMARCHE D’ETUDE STATISTIQUE Une fois la problématique définie («étape 1 de la SSDU), la formalisation établie au travers du caractère et du choix de la population de référence (étape 2) il faut passer : A la collecte des données (étape 3) A leur dépouillement ,à leur étiquetage et au tri (étape 4) aux regroupements et présentation en tableaux de synthèse. (étape 5) A leur représentation graphique (étape 6) Aux calculs permettant de caractériser et résumer les données recensées (étape 7) Aux conclusions permises par les résultats obtenus, (étape 8) Jean-Marc Petit

LA DEMARCHE D’ETUDE STATISTIQUE 3. La collecte La collecte peut se faire à partir d’études existantes, libres ou payantes. Il peut être intéressant de s’informer sur l’existant, pour éviter de doubler la collecte, Il faudra alors vérifier l’actualité et la fiabilité de cet existant. A défaut, il conviendra d’engager une démarche d’enquête en direct ou via un organisme. Là encore fiabilité et confidentialité, devront être envisagées. Jean-Marc Petit

LA DEMARCHE D’ETUDE STATISTIQUE La collecte des données, leur dépouillement 4. Le dépouillement, l’étiquetage et le tri Il s’agit de la phase où l’on reporte les données ponctuelles obtenues sur un support devant permettre leur traitement, C’est le temps de l’étiquetage qui doit permettre la traçabilité ex: date, heure, lieu, identité de l’enquêteur, L’étiquette sera unique et numérotée pour être retrouvée. Mais aussi l’anonymat. Non croisement des fichiers de données personnelles imposée par la CNIL Jean-Marc Petit

LA DEMARCHE D’ETUDE STATISTIQUE A. La collecte des données, leur dépouillement et leur étiquetage. ii. Le dépouillement et le tri : étape 4 Exemple d’étiquette : Exemple de données dépouillées, avec tri croissant: Selon l’âge : Selon le nombre d’enfants? N°étiquette Enquêteur Date de l’enquête Adresse Qualité de l'enquêté Nbre d'enfant Age de l'aîné Etiquette 101 Jean Aymard 28/04/2011 26, rue du chat bossu, Paris 12ème Père de famille 1 enfant 8 ans i Etiquette Nbre d'enfants Age de l'aîné 1 103 4 2 102 7 3 101 8 104 12 i Etiquette Nbre d'enfants Age de l'aîné 1 101 2 103 3 102 4 104 Jean-Marc Petit

STATISTIQUES DESCRIPTIVES 5. Le regroupement des données et leur présentation en tableaux. 5.1 le caractère qualitatif Pour un caractère qualitatif, il suffit de bien repérer les différentes modalités possibles, repérer le nombre de fois où elles se sont présentées puis les présenter dans l’ordre hiérarchique lorsqu’il s’agit d’un caractère qualitatif ordinal pour pouvoir présenter les valeurs cumulées Exemple : i Catégories ni Ni 1 ouvrier 38 2 Contremaître 4 42 3 Techniciens 6 48 Cadres 50 Jean-Marc Petit

LA DEMARCHE D’ETUDE STATISTIQUE 5. Le regroupement des données et leur présentation en tableaux. 5.1 le caractère quantitatif est discret Pour tout caractère quantitatif, Il faut prendre garde à ne pas confondre variable (xi) et effectifs(ni) Par exemple si : 5 familles ont 5 enfants, 5 en ont 4, 10 en ont 0, 20 en ont 1, 20 en ont 3 et 40 en ont 2? Ce sont les familles (ni) qui se distribueront selon le nombres d’enfants (xi) Jean-Marc Petit

LA DEMARCHE D’ETUDE STATISTIQUE 5. Le regroupement des données et leur présentation en tableaux. 5.1 le caractère quantitatif discret Cela donnera le tableau suivant : xi nombre d’enfants ni :nombre de familles Une manière d’éviter toute erreur de repérage consiste à exprimer la moyenne en ses unités : exemple: ici, ce sera un nombre moyen d’enfants par famille et non un nombre moyen de familles par enfant. i xi ni 1 10 2 20 3 40 4 5 6 Jean-Marc Petit

LA DEMARCHE D’ETUDE STATISTIQUE 5. Le regroupement des données et leur présentation en tableaux. 5.1 le caractère quantitatif continu Ce caractère correspond à des situations où le nombre de modalités recensées de la variable est trop important avec des effectifs individuels trop faibles pour que cela ait du sens de les répertorier dans un tableau de type discret. Il faudra donc procéder à la constitution de classe de données, regroupant plusieurs valeurs de la variable dans une logique de continuité. Jean-Marc Petit

LA DEMARCHE D’ETUDE STATISTIQUE 5. Le regroupement des données et leur présentation en tableaux. 5.1 le caractère quantitatif continu AGES EFFECTIFS 8 12 13 1 9 11 2 7 14 3 15 5 4 16 6 17 18 19 20 21 10 22 23 Jean-Marc Petit

LA DEMARCHE D’ETUDE STATISTIQUE 5. Le regroupement des données et leur présentation en tableaux. 5.1 le caractère quantitatif continu a. Classes d’égales amplitudes On prend le nombre de données, et on divise par le nombre de classes voulu, Ici, cela fait 24/6 = 4 soit 6 classes d’amplitude 4. Soit : Classes ni Jean-Marc Petit

LA DEMARCHE D’ETUDE STATISTIQUE Cette méthode est simple mais exposée aux risques en effet : Le graphique qui en découle a une forme différente de celui qu’on aurait obtenu en reportant chaque année individuellement. Par exemple, cette chute suivi de cette remontée. Jean-Marc Petit

LA DEMARCHE D’ETUDE STATISTIQUE 5. Le regroupement des données et leur présentation en tableaux. 5.1 le caractère quantitatif continu Si en (1), (2), (3) et (6) les effectifs individuels se situaient dans un même ordre de grandeur, en (4) et en( 5) on a regroupé des données aux effectifs trop disparates (5) (6) (4) (1) (3) (2) Jean-Marc Petit

LA DEMARCHE D’ETUDE STATISTIQUE Cette méthode est simple mais exposée aux risques en effet : On retrouve ce problème dans le tableau suivant : En 4 et en 5 l’effectif moyen par unité d’amplitude est trop éloigné des valeurs réelles observées. ex: en (4) : 9 pour des valeurs qui vont de 5 à 13. modalités effectifs classes effectifs regroupés effectif/ amplitude 8   1 9 2 7 3 0-4 32 4 5 6 4 - 8_ 21 5,25 10 11 8-12 19 4,75 12 13 14 15 12-16 36 16 17 18 16 - 20 44 20 22 23 20 - 24 48 (1) (2) (3) (4) (5) (6) Jean-Marc Petit

LA DEMARCHE D’ETUDE STATISTIQUE b. d’amplitudes différentes mais homogènes En redécoupant les classes disparates et en regroupant les classes homogènes on peut envisager le découpage suivant : Jean-Marc Petit

LA DEMARCHE D’ETUDE STATISTIQUE 5. Le regroupement des données et leur présentation en tableaux. 5.1 le caractère quantitatif continu b. d’amplitudes différentes mais homogènes En redécoupant les classes disparates et en regroupant les classes homogènes on peut envisager le tableau suivant : Classes ni [0;4[ 32 [4;12[ 40 [12;14[ 24 [14;18[ [18;20[ [20;24[ 48 Jean-Marc Petit

LA DEMARCHE D’ETUDE STATISTIQUE b. d’amplitudes différentes mais homogènes Découpage offrant une certaine homogénéité entre les effectifs moyens par unité d’ amplitude et les valeurs réelles : modalités effectifs classes effectifs regroupés effectif/ amplitude 8   1 9 2 7 3 0-4 32 4 5 6 10 11 4-12 40 12 13 12-14 24 14 15 16 17 14-18 18 19 18-20 20 21 22 23 20-24 48 Jean-Marc Petit

LA DEMARCHE D’ETUDE STATISTIQUE 6. Les représentations graphiques 6.1 le caractère qualitatif Pour présenter graphiquement l’importance de chaque catégorie on peut calculer la part de chaque catégorie fi=ni/N en valeurs décimales ou en % puis lui affecter un angle proportionnel dans un graphique en secteurs i Catégories ni 1 ouvrier 20 2 Contremaître 15 3 Techniciens 10 4 Cadres 5 Total N =50 fi=ni/N 0,4 0,3 0,2 0,1 1 fi en % 40,00% 30,00% 20,00% 10,00% 100% Angles 360°x fi 144° 108° 72° 36° 360° Jean-Marc Petit

LA DEMARCHE D’ETUDE STATISTIQUE 6. Les représentations graphiques 6.1 le caractère qualitatif Le graphique en secteur est moins adapté dès qu’il s’agit de comparer des séries. Ici les entreprises A et B Entreprise A i Catégories niA niB fiA fiB 1 ouvrier 20 30 0,4 0,3 2 Contremaître 15 0,2 3 Techniciens 10 4 Cadres 5 0,1 Total NA =50 NB=100 Entreprise B Jean-Marc Petit

LA DEMARCHE D’ETUDE STATISTIQUE 6. Les représentations graphiques 6.1 le caractère qualitatif Pour les comparaisons, le graphique à bandes est plus parlant En effectifs i Catégories niA niB fiA fiB 1 ouvrier 20 30 0,4 0,3 2 Contremaître 15 0,2 3 Techniciens 10 4 Cadres 5 0,1 Total NA =50 NB=100 En % Jean-Marc Petit

LA DEMARCHE D’ETUDE STATISTIQUE . 6. Les représentations graphiques 6.2 le caractère quantitatif discret 621. La distribution le graphique de distribution spécifique à ce caractère est le diagramme en bâtons ni i Nbre d’enfants : xi ni 1 10 2 20 3 40 4 5 6 xi Jean-Marc Petit

LA DEMARCHE D’ETUDE STATISTIQUE 621. La distribution On peut également reprendre le graphique en secteur comme pour le modèle quantitatif. 6. Les représentations graphiques 6.2 le caractère quantitatif discret i xi ni fi angle=fi*360 1 10 0,1000 36 2 20 0,2000 72 3 40 0,4000 144 4 5 6 0,0600 21,6 0,0400 14,4   Jean-Marc Petit

LA DEMARCHE D’ETUDE STATISTIQUE . Croissants au sens large Ni= Ni – 1 +ni: on lira 30 personnes Ont…………… 6. Les représentations graphiques 6.2 le caractère quantitatif discret 6.22 Les cumuls i xi ni Ni croiss (=<) 1 10 2 20 30 3 40 70 4 90 5 6 96 100 somme N= Jean-Marc Petit

LA DEMARCHE D’ETUDE STATISTIQUE On peut également calculer effectifs cumulés. décroissants par différence entre le total N et les effectifs cumulés décroissants ex : 2ème ligne 70=100-30 On lira : 70 ménages ont…………………. Large et Strict se complètent pour faire le total.. 6. Les représentations graphiques 6.2 le caractère quantitatif discret 6.22 Les cumuls i xi ni fi Ni croiss (=<) Ni décrois (>) 1 10 0,1000 90 2 20 0,2000 30 70 3 40 0,4000 4 5 6 0,0600 96 0,0400 100 somme N= Jean-Marc Petit

LA DEMARCHE D’ETUDE STATISTIQUE 6. Les représentations graphiques 6.2 le caractère quantitatif discret 6.22 Les cumuls Ni [ i xi ni fi Ni croiss (=<) 1 10 0,1000 2 20 0,2000 30 3 40 0,4000 70 4 90 5 6 0,0600 96 0,0400 100 somme N= [ [ [ [ xi La forme en escalier marque la discontinuité et la lecture se fait sur le point ainsi 10Ainsi en 1 on peut lire : que 30 personnes qui ont……………………. Jean-Marc Petit

LA DEMARCHE D’ETUDE STATISTIQUE le graphique spécifique à ce caractère est l’histogramme Si l’on part des données brutes on obtient le graphique suivant : 6. Les représentations graphiques 6.3 le caractère quantitatif continu 6.31 La distribution Classes de données ni   [ 4 32 ; 12 40 14 24 18 20 48 Jean-Marc Petit

LA DEMARCHE D’ETUDE STATISTIQUE Si l’on compare Avec le graphique Des données Individuelles On observe des différences de Mouvements Comme entre 4 et 12 ans où une baisse se traduit par une hausse 6. Les représentations graphiques 6.3 le caractère quantitatif continu 6.31 La distribution Jean-Marc Petit

LA DEMARCHE D’ETUDE STATISTIQUE 6. Les représentations graphiques 6.3 le caractère quantitatif continu 6.31 La distribution En fait en 8 ans, il est logique d’avoir plus de naissance qu’en 4 ans. Les données brutes comparent des données Non comparables qu’il faudra remettre sur une même Base : l’effectif par unité d’amplitude ou densité di Avec di= ni/ai L’amplitude ai étant calculée par extrêmité supérieure de la classe moins l’extrêmité inférieure : ei+1 - ei Jean-Marc Petit

LA DEMARCHE D’ETUDE STATISTIQUE ean-Marc Petit LA DEMARCHE D’ETUDE STATISTIQUE 6. Les représentations graphiques 6.3 le caractère quantitatif continu 6.31 La distribution Plus respectueux du mouvement original, ai Classes de données ni di= ni/ai   4 [ 32 8 ; 12 40 5 2 14 24 18 6 20 16 48 ei

LA DEMARCHE D’ETUDE STATISTIQUE 6. Les représentations graphiques 6.3 le caractère quantitatif continu 6.31 La distribution : l’histogramme Chaque rectangle de l’histogramme ayant pour base ai, aura une aire égale aux effectifs en effet : Aire = di x ai =(ni/ai) x ai = ni di 32 48 32 24 40 24 ei Jean-Marc Petit

LA DEMARCHE D’ETUDE STATISTIQUE 6. Les représentations graphiques 6.3 le caractère quantitatif continu 6.31 La distribution On pourra relier les centres de classes sur l’histogramme L’aire sous la courbe étant égale à celle des rectangles de l’histogramme. di 32 48 32 24 40 24 ei Jean-Marc Petit

LA DEMARCHE D’ETUDE STATISTIQUE 6.3 le caractère quantitatif continu On pourra, de la même manière construire un histogramme à l’échelle, en choisissant une amplitude de base : la plus petite, la plus grande ou la plus distribuée et en calculant di x ab ai Classes de données ni di x 4   4 [ 32 8 ; 12 40 20 2 14 24 48 18 64 Cette méthode permet d’éviter les valeurs difficiles à manipuler Elle réduit aussi le nombre des calculs. Lorsque l’amplitude de courante est égale à l’amplitude de base l’effectif corrigé = l’effectif Jean-Marc Petit

LA DEMARCHE D’ETUDE STATISTIQUE 6. Les représentations graphiques 6.3 le caractère quantitatif continu 6.32 La Répartition (cumul) Classes de données  ni   [ 4 32 ; 12 40 14 24 18 20 48 Classes de données  ni Ni crois   [ 4 32 ; 12 40 72 14 24 96 18 120 20 152 48 200 Jean-Marc Petit

LA DEMARCHE D’ETUDE STATISTIQUE 6. Les représentations graphiques 6.2 le caractère quantitatif continu 6.31 La Répartition (cumul) Pour une série continue, la différenciation entre strict et large ne s’impose pas en raison de la dimension infinitésimale des effectifs sur les valeurs ponctuelles de la variable. Qui a 20 ans ? Le temps de le dire on a déjà 20 ans et 10 secondes… Classes de données  ei ni Ni crois   [ 4 32 ; 12 40 72 14 24 96 18 120 20 152 48 200 Jean-Marc Petit

LA DEMARCHE D’ETUDE STATISTIQUE 6. Les représentations graphiques 6.3 le caractère quantitatif continu 6.31 La Répartition (cumul) Où chaque point a un sens, Exemple : ei = 6 Ni= Classes de données  ei ni Ni crois   [ 4 32 ; 12 40 72 14 24 96 18 120 20 152 48 200 Jean-Marc Petit

LA DEMARCHE D’ETUDE STATISTIQUE 6. Les représentations graphiques 6.3 le caractère quantitatif continu 6.31 La Répartition (cumul) On peut d’autant plus facilement passer des effectifs et fréquences cumulés croissants aux données cumulées décroissantes, qu’on ne différencie pas strict et large Nidécr= N - Nicrois Fidécr= 1 - Ficrois Classes de données  ei ni Ni crois décr Fi Crois Fi décroiss   200 1 [ 4 32 168 0,16 0,84 ; 12 40 72 128 0,36 0,64 14 24 96 104 0,48 0,52 18 120 80 0,6 0,4 20 152 48 0,76 0,24 Jean-Marc Petit

LA DEMARCHE D’ETUDE STATISTIQUE 6. Les représentations graphiques 6.3 le caractère quantitatif continu 6.31 La Répartition (cumul) Le point d’intersection a pour ordonnée? …………………………………………… ………………………………………………. Me Jean-Marc Petit

LA DEMARCHE D’ETUDE STATISTIQUE Le résumé des données 7.1 les paramètres de tendance centrale Il convient de noter que tous ces paramètres s’exprimeront dans les unités de la variable 7.11 Le mode C’est la valeur de la variable la plus distribuée. Pour une distribution discrète c’est le xi correspondant à l’effectif le plus élevé. Ici :………………………………….. i Nbre d’enfants : xi ni 1 10 2 20 3 40 4 5 6 Jean-Marc Petit

LA DEMARCHE D’ETUDE STATISTIQUE 7. Le résumé des données 7.1 les paramètres de tendance centrale 7.11 Le mode On parlera de classe modale et le mode sera déterminé À partir des effectifs corrigés ou densités, soit la bande d’histogramme la plus élevée. Ici,…………………………………………….;. ai Classes de données ei ni di= ni/ai   4 [ 32 8 ; 12 40 5 2 14 24 18 6 20 16 48 Jean-Marc Petit

LA DEMARCHE D’ETUDE STATISTIQUE 7. Le résumé des données 7.1 les paramètres de tendance centrale 7.112 La médiane C’est la valeur de la variable telle que l’effectif en deçà de la médiane égale l’effectif au-delà de la médiane. 7.111 le cas des variables discrètes: Pour cette distribution discrète, ce sera 2 enfants avec 30 familles en deçà e et autant au-delà, on ne trouve toutefois pas souvent des distributions aussi parfaites. i Nbre d’enfants : xi ni 1 10 2 20 3 40 4 5 6 Jean-Marc Petit

LA DEMARCHE D’ETUDE STATISTIQUE 7. Le résumé des données 7.1 les paramètres de tendance centrale 7.12 La médiane 7.121 le cas des variables discrètes: avec N impair Pour cette distribution discrète, L’effectif total est de 105 donc le pivot est N/2 + 0,5 soit la 53 éme famille qui a 52 familles avant elle et 52 après. Ce 53ème correspond à Me= Cela ne fonctionne que parce que N est impair i Nbre d’enfants : xi ni Ni 1 10 2 20 30 3 40 70 4 15 85 5 12 97 6 8 105 Jean-Marc Petit

LA DEMARCHE D’ETUDE STATISTIQUE 7. Le résumé des données 7.1 les paramètres de tendance centrale 7.12 La médiane 7.121 le cas des variables discrètes: avec N pair Ici le total de 110, il ne peut y avoir de valeur pivot. Si l’on retient 55 il a 54 familles avant et 55 après. Par convention on prend N/2 +1 soit 55+1=56 soit la 56ème famille, même si cela fait 55 avant et 54 après Ce qui correspond, ici à Me= i Nbre d’enfants : xi ni Ni 1 10 2 20 30 3 25 55 4 85 5 105 6 110 Jean-Marc Petit

LA DEMARCHE D’ETUDE STATISTIQUE 7.11 La médiane 7.122 le cas des variables continues On part du tableau des effectifs ou fréquences cumulées, pour repérer l’intervalle comprenant N/2 (Ni) ou 0,5 (Fi) et sa correspondance dans les ei. ici pour les Ni : 200/2 =100, compris entre 96 et 120 soit entre 0,48 et 0,6 pour Fi et donc entre 14 et 18 pour les ei Classes de données  ei ni Ni crois Fi Crois   [ 4 32 0,16 ; 12 40 72 0,36 14 24 96 0,48 18 120 0,6 20 152 0,76 48 200 1 Jean-Marc Petit

LA DEMARCHE D’ETUDE STATISTIQUE 7.12 La médiane 7.122 le cas des variables continues Pour plus de précision, il faut procéder à une interpolation linéaire a = 100-96 a’= Me-14 b=120-96 b’ = 18-14 Les classes étant homogènes la progression est linéaire, et donc Soit après calcul, en remplaçant a,a’,b et b’ par leurs valeurs : …… ei Ni crois 14 96 Me 100 18 120 a’ a b’ b Jean-Marc Petit

LA DEMARCHE D’ETUDE STATISTIQUE 7. Le résumé des données 7.1 les paramètres de tendance centrale 7.13 La moyenne arithmétique pondérée C’est la moyenne calculée en donnant à chaque valeur de la variable un poids différent selon sa part dans l’effectif, Elle répond à la formule suivante : Soit pour une série discrète : ……………………………………………………………………………. i xi ni 1 10 2 20 3 40 4 5 6 somme N= 100 somme/N   Moyenne = i xi ni 1 10 2 20 3 40 4 5 6 somme N= 100 somme/N   Moyenne = Jean-Marc Petit

LA DEMARCHE D’ETUDE STATISTIQUE 7. Le résumé des données 7.1 les paramètres de tendance centrale 7.13 La moyenne arithmétique pondérée Pour une série continue il faudra calculer les centres de classes qui constitueront les xi = enfants par famille ai Classes de données   ei xi ni xini 4 [ 2 32 8 ; 12 40 14 13 24 18 16 20 19 22 48 N = 200 ai Classes de données   ei ni 4 [ 32 8 ; 12 40 2 14 24 18 20 48 200 Jean-Marc Petit

LA DEMARCHE D’ETUDE STATISTIQUE 7. Le résumé des données 7.2 les paramètres de dispersion 7.21 L’étendue Soit un professeur A qui a donné 5 notes de 1 et 5 notes de 19 soit une moyenne de 10 Et un professeur B qui a donné 5 notes de 9 et 5 notes de 11 soit une moyenne de 10 Cette même moyenne de 10 ne rend pas compte des différences de notation. En notant sur une étendue de … A note de manière plus dispersée que B qui a une notation plus concentrée sur une étendue de …... Jean-Marc Petit

LA DEMARCHE D’ETUDE STATISTIQUE 7. Le résumé des données 7.2 les paramètres de dispersion 7.21 L’étendue L’étendue se calcule par = xn-x1 pour une série discrète soit ici : Et par en-e1 pour une série Continue, soit ici: Classes de données  ei ni Ni crois Fi Crois   [ 4 32 0,16 ; 12 40 72 0,36 14 24 96 0,48 18 120 0,6 20 152 0,76 48 200 1 i xi ni 1 10 2 20 3 40 4 5 6 somme N= 100 Jean-Marc Petit

LA DEMARCHE D’ETUDE STATISTIQUE 7. Le résumé des données 7.2 les paramètres de dispersion 7.22 Les intervalles inter-quartiles Si un professeur C a donné un 1 et un 19 puis neuf 9 et neuf 11, il obtient une moyenne de 10 avec une étendue de 18 comme A alors qu’il n’a pas noté de la même manière que lui. En effet l’étendue fausse l’analyse car elle ne s’intéresse qu’aux extrêmes. L’étendue ne dit rien des tendances intermédiaires, L’écart interquartile indique dans quelle amplitude se situent les 50% de la population les plus centrées. Plus cette amplitude sera importante, plus la population sera dispersée… Plus il sera réduit plus on la dira concentrée Jean-Marc Petit

LA DEMARCHE D’ETUDE STATISTIQUE 7. Le résumé des données 7.2 les paramètres de dispersion 7.22 Les intervalles inter-quartiles L’écart interquartile indique dans quelle amplitude se situent les 50% de la population les plus centrées. Pour le déterminer il faut calculer : Q1 : valeur de la variable telle que 25% des effectifs se situent en deçà et 75% au-delà Q3 : valeur de la variable, telle que 75% des effectifs se situent en deçà et 25% au-delà IQ = Q3- Q1 Pour mémoire, Q2 constitue la médiane. Q1 et Q3 sont également déterminés par interpolation linéaire. Jean-Marc Petit

LA DEMARCHE D’ETUDE STATISTIQUE 7. Le résumé des données 7.2 les paramètres de dispersion 7.22 Les intervalles inter-quartiles IQ = = ans ei ni Ni crois 32 4 Q1 40 50=N/4 12 72 24 14 96 18 120 Q3 150 = 3N/4 20 152 48 200 Jean-Marc Petit

LA DEMARCHE D’ETUDE STATISTIQUE IQ= 12,275 ans signifie que les 50% de la population les plus centrés s’inscrivent dans un intervalle de 12,275 ans. Si une autre série donne une valeur supérieure elle sera dite plus dispersée, donc moins concentrée. Si elle donne une valeur inférieure, elle sera dite moins dispersée donc plus concentrée. A condition que les données se situent dans des échelles comparables A défaut, Il faut rendre les données comparable en introduisant un élément de dimension qui sera la médiane. On calculera donc l’écart inter-quartile relatif = IQ/Me =12,275/………=…………….. Jean-Marc Petit

LA DEMARCHE D’ETUDE STATISTIQUE 7.2 les paramètres de dispersion 7.23 L’écart-type : L’intervalle interquartile indique dans quel intervalle se situent les 50% de la population les plus centrées mais ne dit rien des 25% en amont de Q1 et en aval de Q3. L’écart-type va viser à prendre en compte toutes les valeurs de la variable. Il se calcule dans la logique d’une moyenne pondérée des écarts à la moyenne : Pour éviter les questions de signes, on peut élever au carré et obtient la variance V(x)= Pour l’Ecart-type, on revient au premier degré par : = =

LA DEMARCHE D’ETUDE STATISTIQUE 7.2 les paramètres de dispersion 7.23 L’écart-type : = i xi ni xini 1 10 2 20 3 40 80 4 60 5 6 24 somme N= 100 204 somme/N   Moyenne = 2,04 Variance = Ecart type = Jean-Marc Petit

LA DEMARCHE D’ETUDE STATISTIQUE 7. Le résumé des données 7.2 les paramètres de dispersion 7.23 L’Ecart-type En développant et simplifiant V(x) = On obtient la formule V(x) = plus rapide à calculer en remultipliant la colonne des xini par xi: Exemple : =…………….. i xi ni xini 1 10 2 20 3 40 80 4 60 5 6 24 somme N= 100 204 somme/N   2,04 Jean-Marc Petit

LA DEMARCHE D’ETUDE STATISTIQUE 7. Le résumé des données 7.2 les paramètres de dispersion 7.23 L’Ecart-type Exemple pour une série continue Soit V(x) = V(x)= et = ei xi ni xini 2 32 64 128 4 8 40 320 2560 12 13 24 312 4056 14 16 384 6144 18 19 608 11552 20 22 48 1056 23232   N = 200 2744 47672 /200 13,72 238,36 Jean-Marc Petit

LA DEMARCHE D’ETUDE STATISTIQUE 7. Le résumé des données 7.2 les paramètres de dispersion 7.23 L’Ecart-type Comme pour l’interquartile relatif on intégrera un élément de dimension des données au moyen de la moyenne, en calculant le Coefficient de Variation : Pour le nombre d’enfants par famille CV=1,1825/ = Pour la répartition par âge CV=7,0797/ = Jean-Marc Petit

LA DEMARCHE D’ETUDE STATISTIQUE 7. Le résumé des données 7.2 les paramètres de dispersion 7.24 La courbe de Lorentz et l’indice de Gini: Ces éléments sont souvent utilisés afin de mettre en évidence des inégalités, puisqu’il s’agit de comparer les différentes parts de revenu ou de chiffre d’affaires détenu par différentes parts de la population. Soit ici, une population salariée répartie selon le niveau moyen de salaire. xi : salaire moyen ni: nbre de salariés fi = ni/N Fi : fi cumulés   1000 20 1500 30 2000 60 2500 40 3000 3500 4000 10 5 200 1 Jean-Marc Petit

LA DEMARCHE D’ETUDE STATISTIQUE 7.24 La courbe de Lorentz et l’indice de Gini: Ces éléments sont souvent utilisés afin de mettre en évidence des inégalités, puisqu’il s’agit de comparer les différentes parts de revenu ou de chiffre d’affaires détenu par différentes parts de la population. Ici xini représente la masse salariale perçue par la catégorie de salariés xi, pour une masse salariale globale de Ainsi les gens qui gagne 1000€ en moyenne se partagent 20 000€, sachant que la masse salariale globale est de 455 000€ xi : salaire moyen ni: nbre de salariés fi = ni/N Fi : fi cumulés xini   1000 20 0,1 1500 30 0,15 0,25 2000 60 0,3 0,55 2500 40 0,2 0,75 3000 0,85 3500 0,95 4000 10 0,05 1 200 Jean-Marc Petit

LA DEMARCHE D’ETUDE STATISTIQUE 7.24 La courbe de Lorentz et l’indice de Gini Ces éléments sont souvent utilisés afin de mettre en évidence des inégalités, puisqu’il s’agit de comparer les différentes parts de revenu ou de chiffre d’affaires détenu par différentes parts de la population. On peut donc calculer f’i qui est la part du total des ressources ressources perçue par la catégorie xi. Ainsi les gens qui gagnent 1000€ se partagent 4,4% (f’1) sachant qu’ils représentent 10% (f1)de la population.. xi : salaire moyen ni: nbre de salariés fi = ni/N Fi : fi cumulés xini f'i =xini/   1000 20 0,1 1500 30 0,15 0,25 2000 60 0,3 0,55 2500 40 0,2 0,75 3000 0,85 3500 0,95 4000 10 0,05 1 200

Ainsi les 30 salariés gagnant 1500€ moyenne se répartissent …… € LA DEMARCHE D’ETUDE STATISTIQUE 7.24 La courbe de Lorentz et l’indice de Gini. Ainsi les 30 salariés gagnant 1500€ moyenne se répartissent …… € au sein des ……….€ distribués par l’entreprise à l’ensemble des salariés. Ils représentent 15% des salariés mais ne se partagent que …..% de la masse salariale. 10% de la population gagne 3500€ en moyenne et se partage ……% de la masse salariale. xi : salaire moyen ni: nbre de salariés fi = ni/N Fi : fi cumulés xini f'i =xini/   1000 20 0,1 20000 0,0440 1500 30 0,15 0,25 45000 0,0989 2000 60 0,3 0,55 120000 0,2637 2500 40 0,2 0,75 100000 0,2198 3000 0,85 60000 0,1319 3500 0,95 70000 0,1538 4000 10 0,05 1 40000 0,0879 200 455000 Jean-Marc Petit

LA DEMARCHE D’ETUDE STATISTIQUE 724. La courbe de Lorentz et l’indice de Gini: Fi représente la part cumulée de salariés et Fi’ la part cumulée de la masse salariale qu’ils perçoivent. Ainsi …% des salariés percevant moins de 2000€ en moyenne représentent au total …..% de la masse salariale Et les ….%des salariés percevant moins de 3500€ en moyenne représentent au total ……% de la masse salariale xi : salaire moyen ni: nbre de salariés fi = ni/N Fi : fi cumulés xini f'i =xini/ F'i   1000 20 0,1 20000 0,0440 1500 30 0,15 0,25 45000 0,0989 0,1429 2000 60 0,3 0,55 120000 0,2637 0,4066 2500 40 0,2 0,75 100000 0,2198 0,6264 3000 0,85 60000 0,1319 0,7582 3500 0,95 70000 0,1538 0,9121 4000 10 0,05 1 40000 0,0879 1,0000 200 455000 Jean-Marc Petit

LA DEMARCHE D’ETUDE STATISTIQUE 7.24 La courbe de Lorentz et l’indice de Gini La courbe de Lorentz en bleu, indique le niveau de concentration par comparaison avec la bissectrice représentant l’égalité parfaite. On aura en abscisse la part Cumulée de population Fi Et en ordonnée la part cumulée de ressources(F’i) Attribuée à cette part de population xi fi = ni/N en% Fi : fi % f'i en % F'i en %   1000 10,00 4,40 1500 15,00 25,00 9,89 14,29 2000 30,00 55,00 26,37 40,66 2500 20,00 75,00 21,98 62,64 3000 85,00 13,19 75,82 3500 95,00 15,38 91,21 4000 5,00 100,00 8, 79 Jean-Marc Petit

LA DEMARCHE D’ETUDE STATISTIQUE 724 La courbe de Lorentz et l’indice de Gini: Plus la courbe s’éloigne de cette bissectrice, plus il y a de concentration dans le groupe supérieur, donc d’inégalités. Ainsi la courbe bleue reflète une plus grande dispersion sur les différents groupes Que la courbe verte, plus Inégalitaire. xi fi = ni/N en% Fi : fi % f'i en % F'i en %   1000 10,00 4,40 1500 15,00 25,00 9,89 14,29 2000 30,00 55,00 26,37 40,66 2500 20,00 75,00 21,98 62,64 3000 85,00 13,19 75,82 3500 95,00 15,38 91,21 4000 5,00 100,00 8, 79 Jean-Marc Petit

LA DEMARCHE D’ETUDE STATISTIQUE 724 La courbe de Lorentz et l’indice de Gini Cette écartement de la bissectrice est synthétisé par l’indice de Gini qui rapporte la surface ce concentration comprise entre la courbe de Lorentz et la bissectrice au triangle rectangle qui la comprend. Plus l’indice sera proche De 1 plus il y aura de Concentration (inégalités) de o plus il y aura de Dispersion (égalité) Jean-Marc Petit

LA DEMARCHE D’ETUDE STATISTIQUE 724 La courbe de Lorentz et l’indice de Gini Il se calcule par la formule : Donc ici l’indice de Gini = = xi : salaire moyen ni: nbre de salariés fi = ni/N Fi : fi cumulés xini f'i =xini/455000 F'i fi*(F'i-1+F'i) exemples de détail des calculs   - 1000 20 0,1 0,1000 20000 0,0440 1500 30 0,15 0,2500 45000 0,0989 0,1429 2000 60 0,3 0,5500 120000 0,2637 0,4066 2500 40 0,2 0,7500 100000 0,2198 0,6264 3000 0,8500 60000 0,1319 0,7582 3500 0,9500 70000 0,1538 0,9121 4000 10 0,05 1,0000 40000 0,0879 200 1 455000 Jean-Marc Petit

LA DEMARCHE D’ETUDE STATISTIQUE 724 La courbe de Lorentz et l’indice de Gini Il se calcule par la formule : Les seuils communément retenus sont : concentration nulle Concentration très faible à faible Concentration forte à très forte Autour de 0,5 on parlera de concentration moyenne. Jean-Marc Petit