La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

STATISTIQUES pour la Gestion JM. Petit M. Belkhadir JP Bouffenie

Présentations similaires


Présentation au sujet: "STATISTIQUES pour la Gestion JM. Petit M. Belkhadir JP Bouffenie"— Transcription de la présentation:

1 STATISTIQUES pour la Gestion JM. Petit M. Belkhadir JP Bouffenie
A. Moraglia JB Rudant A. Saïdane Premier ppt pour expliquer règles, déroulement du cours, le book…

2 Bienvenue dans ce cours Statistiques pour la Gestion
Sommaire de la première partie Présentation des objectifs de ce cours dans votre parcours de formation Les « Règles du jeu »: Modalités de travail et évaluation Les grandes parties qui structurent ce cours Premier Cours sur les Séries Statistiques Desriptives Univariées (SSDU) Annales corrigées sur la partie SSDU Premier Cours : Focus sur les étapes 1 et 2 cf. Chapitres 1 et 2 partie cours du book

3 En management d’entreprises, on utilise les statistiques et probabilités dans de multiples domaines : Economie, Gestion, Marketing, RH, Communication etc… Il s’agit avant tout d’ outils de traitement et d’analyse d’informations chiffrées et d’aide à la décision. Objectifs du cours Jean-Marc Petit

4 Objectifs du cours Analyser ? Prévoir ? Anticiper ? Piloter ?
Analyser ? Pour maîtriser la gestion Prévoir ? Pour anticiper le marché, les besoins logistiques (appro, livraisons, RH…) Anticiper ? Pour Piloter …. Piloter ? La bonne conduite d’une entreprise passe par la maîtrise des informations et donc par le traitement des données : statistiques mais aussi économique, de contrôle de gestion… Nous sommes un maillon de la chaîne du manager performant

5 Objectifs du cours Existant Contrôle Prévisions Prise de décision
Moyens Méthodologie d’analyse : étape après étape Maîtrise des outils : lesquels, quand, comment, pour quels résultats resitués dans la problématique managériale Existant Prise de décision Pilotage Données Information Traitement statistique Contrôle PB Situation managériale Anticipation Prévisions Les données de départ (ex ensemble de CA) sont transformées en informations pertinentes : CA moyen, 20% des produits concentre 80% du CA total …. Objectifs Répondre à un problème Apporter des informations pertinentes Aider à la prise de décision(s) La mise en œuvre d’études statistiques permet de collecter, classer, présenter, analyser des données pour déboucher sur une analyse de l’existant (SSDU); modéliser l’existant pour ensuite prévoir (SC) Moyens Méthodologie d’analyse : étape après étape Maîtrise des outils : Lesquels : connaître les outils pour avoir une idée des traitements possibles Quand : quand peut-on les utiliser (CHI2, par exemple, il n’est pas possible d’étudier les caractéristiques de variabilité si le caractère est qualitatifi …), comment (comprendre les formules et exploiter un tableur), pour quels résultats resitués dans la problématique managériale et des analyses prévisionnelles (dans tout le cours nous mettrons l’accent sur l’importance de l’interprétation)

6 E Objectifs du cours Et donc à l’issue de ce cours
Vous saurez élaborer un dossier professionnel En créant des enquêtes En mobilisant des données existantes En choisissant les méthodes et outils adéquats En déjouant les chausses trappes Afin de construire des interprétations pertinentes permettant d’éclairer le prises de décisions

7 II. Règles du jeu STATISTIQUES POUR LA GESTION
COURS = chaque CM est articulé avec 1 TD Vous aurez à votre disposition: -Des supports numériques pour retravailler le CM et préparer votre TD. -Des polys d’exercices pour travailler en TD des mini cas/exercices « maison » à préparer pour être évalué par votre professeur de TD Votre extranet SKEMA Knowledge est à consulter obligatoirement: (Supports de cours, doc de travail et ressources complémentaires) Leur montrer knwodge

8 II. Règles du jeu (suite)
STATISTIQUES POUR LA GESTION II. Règles du jeu (suite) Matériel : Calculatrice, book, polys d’exercices Et… …votre ordinateur pour QCM en ligne en début de TD et application EXCEL ou open Office des exercices. Si un étudiant l’utilise hors besoin du cours (mail, Facebook), il sera exclu du cours avec 5 points de pénalités sur la note de participation. Cette pénalité sera également appliquée en cas de comportement non éthique. Si un étudiant l’utilise hors besoin du cours (mail, Facebook), il sera exclu du cours A la discrétion du professeur, par exemple, la première fois exclu de la séance avec pénalité et la deuxième fois exclu du cours et donc automatiquement en rattrapage et l’ordinateur sera supprimé de la séance pour tous les étudiants Pour autodiscipline

9 Règles du jeu (suite) STATISTIQUES POUR LA GESTION Les évaluations !
Contrôle continu : 50% : Note de participation 10% : 20/20 (-3) retard ou absence excusée hors activités organisées par l’Ecole (ex: salon…) (-5) absence non excusée ou cas grave reconnu par le responsable du cours sur le campus. – usage inapproprié de l’ordinateur Bonus possibles sur cette note également en fonction de la participation : jusqu’à 25/20 ! Mini quizzs et Exercices de TD: 20% Cas d’invention Dossier+ Présentation: 20% Mais 2 absences maximum (excusées ou non) (et au-delà que décidons nous?) ? Pour SSDU/CHI2 1 à 2 notes par étudiant. Soit toutes les copies sont à remettre en début de cours et quelques copies sont choisies au hasard pour être notées à chaque séance y compris en amphi. Soit le professeur relève qq copies et note aléatoirement Soit le professeur demande qq copie pour vérifier que le travail est fait et met bonus/malus et relève VLJFree en fin de SSDU

10 Les notes Contrôle Continu!
STATISTIQUES POUR LA GESTION Les notes Contrôle Continu! Mini QCM début de TD + exercices de préparation pour évaluer la préparation du TD à partir du CM. Cas d’invention : Séries Chronologiques La dernière séance de TD est consacrée à finaliser un cas inventé et préparé par groupes de 4/5 étudiants sur la base d’un cahier des charges fourni (disponible sous knowledge). Le professeur échange avec chaque groupe afin d’&évaluer la contribution de chacun (d’où la présence en TD indispensable, sinon évaluation=0). Ce cas d’invention doit permettre un lien entre le cours et des situations réelles possibles avec également des applications des outils informatiques.

11 STATISTIQUES POUR LA GESTION
Les notes ! Examen final : 50% sous forme d’un QCM comportant : Des questions de cours Des exercices sous forme de mini cas Quelques questions porteront sur les lois de probabilités (traitées en RAN) et que vous pouvez réviser via les books sous knowledge et de tutoriels sous knowledge Ordinateur non autorisé pendant l’épreuve (en raison du caratère communiquant de ces appareils) Calculatrice autorisée (et vivement recommandée) Examen de rattrapage : QCM (100% de la note de rattrapage). Il portera sur l’ensemble du cours: parties 1, 2 et 3 Préciser que c’est le cas pour tous les examens de rattrapage (compteur remis à 0) Exam rattrapage question bonus ? Ou question ouverte qui peut examinée pour réajuster la note de quizz…. A décider ensemble

12 Cours en 3 grandes parties
Avec 2 remises à niveau pour les compétences nécessaires aux cours de SKEMA (marketing, économie, finance…) Séries Statistiques Descriptives Univariées Tests de CHI2, et analyse bivariée Séries Chronologiques et Variations Saisonnières 1. RAN MATHS 2. RAN probabilités SSDU Série Statistique Descriptive Univariée Exemple : étude du CA du panier moyen du nouveau site d’e-commerce d’une entreprise Tests, analyse bivariée Exemple CHI2: étude de la dépendance entre le CA du panier moyen et la catégorie socio-professionnelle ou l’âge ou la région… SC Série Chronologique Exemple : étude de l’évolution de ce CA dans le temps avec l’analyse de la saisonnalité pour aider au contrôle de gestion et pour mieux programmer les livraisons

13 STATISTIQUES DESCRIPTIVES
DE QUOI S’AGIT-IL ? Il s’agit bien d’un outil de description, support pour l’analyse, sans s’y substituer. Par exemple, Il ne faut pas confondre lien et interprétation causale : Les statistiques vont mettre en évidence un lien entre population hospitalisée et surmortalité comparée à la population générale Cela ne signifie pas que l’hospitalisation soit la cause de la surmortalité… Jean-Marc Petit

14 STATISTIQUES DESCRIPTIVES
Déjouer les résultats statistiques qui induisent une interprétation erronée… Par exemple étudions les naissances sur 6 périodes on obtient le graphique suivant : Qui montre une baisse puis une remontée Années 2004 2005 2006 2007 2008 2009 Nbre de naissances en Milliers 10 8 6 12 Jean-Marc Petit

15 STATISTIQUES DESCRIPTIVES
Déjouer les résultats statistiques qui induisent une interprétation erronée… Recommençons l’étude sur 2 périodes tri-annuelles Jean-Marc Petit

16 STATISTIQUES DESCRIPTIVES
Déjouer les résultats statistiques qui induisent une interprétation erronée… Recommençons l’étude sur 3 périodes bi-annuelles on obtient le graphique suivant : Plus proche du modèle original, ci-dessous On le verra plus loin les regroupements doivent être objet d’attention, Jean-Marc Petit

17 LA DEMARCHE D’ETUDE STATISTIQUE
Le Plan d’Etude d’une Série Statistique Descriptive Univariée 1 Définition du problème 2 Formalisation 3 Collecte 4 Dépouillement et tri 5 Regroupement 6 Graphiques 7 Résumé 8 Conclusion

18 LA DEMARCHE D’ETUDE STATISTIQUE
La démarche d’étude statistique. La définition du problème Au départ, on trouve un objectif qui demande un certain nombre de renseignements chiffrés afin d’adopter une stratégie adapté. Pour améliorer mes recettes locatives je souhaite mieux adapter mon parc de logement aux caractéristiques de la population locale Pour cela j’ai besoin de mieux connaître - , LA DEMARCHE D’ETUDE STATISTIQUE Jean-Marc Petit

19 LA DEMARCHE D’ETUDE STATISTIQUE
2. La Formalisation Qui? Pour quelles caractéristiques? 2.1 La Population. Il convient de bien cerner la population concernée par notre étude. Ici, on définira un périmètre de population concernée, susceptible de vouloir habiter dans la zone géographique où se situe le parc locatif. i Nbre d’enfants : xi ni 1 10 2 20 3 40 4 5 6 Jean-Marc Petit

20 LA DEMARCHE D’ETUDE STATISTIQUE
2. La Formalisation Qui? Pour quelles caractéristiques? 2.1 La Population. On pourra également créer des groupes de sous populations à des fins de comparaisons ou de segmentation du marché. Par exemple on pourrait étudier la population cadre d’une part et des employés d’autre part car on dispose d’immeubles de standings différents i Nbre d’enfants : xi ni 1 10 2 20 3 40 4 5 6 Jean-Marc Petit

21 LA DEMARCHE D’ETUDE STATISTIQUE 2. La Formalisation
Qui? Pour quelles caractéristiques? 2.1 La Population. On pourra également travailler sur des échantillons: - Totalement aléatoires. - Aléatoires et Représentatifs . Exemples pour un logement : En revanche couleur des cheveux, peu pertinent pour des logements, mais utile si on lance des lunettes… i Nbre d’enfants : xi ni 1 10 2 20 3 40 4 5 6 C’est-à-dire que dans l’échantillon, sur un certain nombre de critères, on retrouvera les mêmes pourcentages que dans la population mère. On parlera de Méthode des Quotas

22 LA DEMARCHE D’ETUDE STATISTIQUE 2. La Formalisation Qui?
2.1 La Population. Une population sera composée d’individus. Même s’il s’agit d’objets Chaque individu sera classé sur la base des caractéristiques étudiées. Le regroupement d’individus sur une même caractéristique constituera des effectifs, qualifiés de fréquences absolues: ni A différencier des fréquences relatives fi (part du tout) i Nbre d’enfants : xi ni 1 10 2 20 3 40 4 5 6

23 LA DEMARCHE D’ETUDE STATISTIQUE 2. La Formalisation Quoi?
2.1 Les Caractères. Il s’agit de la caractéristique étudiée pour laquelle des modalités ont été repérées. La population se répartira sur les différentes modalités du/des caractères étudiés ici i Nbre d’enfants : xi ni 1 10 2 20 3 40 4 5 6 Ages 26-30 30-35 nbre d'enfants 5 6 4 1 8 9 7 2 12 11 13 3 Deux caractères étudiés Simultanément Série bivariée Un seul caractères étudié: Série Univariée: SSDU

24 LA DEMARCHE D’ETUDE STATISTIQUE 2. La Formalisation
2.1 Les Caractères. (Quoi?) Classes ni [0;4[ 1500 [4;12[ 2500 [12;14[ 4500 [14;18[ 5500 [18;20[ 7000 Catégories Nbres agriculteurs 20 artisans 15 commerçants 10 cadres 5 Q……………… Q……………….; i xi ni 1 10 2 20 3 40 4 5 6 Catégories Nbres ouvrier 20 Contremaître 15 Techniciens 10 Cadres 5 Q……………………… Q………………………

25 LA DEMARCHE D’ETUDE STATISTIQUE
2. La Formalisation 2.1 Les Caractères. (Quoi?) Si lecractère est qualitatif nominal les cumuls n’ont pas de sens, on ne peut dire qu’il y a 35 personnes ayant un statut inférieur à commerçants Alors que pour un caractère qualitatif ordinal le cumul a du sens : ici 35 personnes ont un statut………………………. Catégories ni NI ouvrier 20 Contremaître 15 35 Techniciens 10 45 Cadres 5 50 Catégories Nbres agriculteurs 20 artisans 15 commerçants 10 cadres 5

26 LA DEMARCHE D’ETUDE STATISTIQUE 2. La Formalisation
2.1 Les Caractères quantitatifs. (Quoi?) Des élément non divisibles mais aux modalités multiples seront étudiées selon un caractère continu ex: des production de voitures : La caractère continu en statistiques est différent de la continuité mathématique car limité par l’observation: L’âge est connu dans la limite du relevé. (minute) âges ni [0;4[ 1500 [4;12[ 2500 [12;14[ 4500 [14;18[ 5500 [18;20[ 7000 Productions Nombre d’usines [1000;2000[ 5 [2000;2200[ 8 [2200;2400[ 10 [2400;2600[ 6 [2600;2800[ 4

27 LA DEMARCHE D’ETUDE STATISTIQUE
Une fois la problématique définie («étape 1 de la SSDU), la formalisation établie au travers du caractère et du choix de la population de référence (étape 2) il faut passer : A la collecte des données (étape 3) A leur dépouillement ,à leur étiquetage et au tri (étape 4) aux regroupements et présentation en tableaux de synthèse. (étape 5) A leur représentation graphique (étape 6) Aux calculs permettant de caractériser et résumer les données recensées (étape 7) Aux conclusions permises par les résultats obtenus, (étape 8) Jean-Marc Petit

28 LA DEMARCHE D’ETUDE STATISTIQUE
3. La collecte La collecte peut se faire à partir d’études existantes, libres ou payantes. Il peut être intéressant de s’informer sur l’existant, pour éviter de doubler la collecte, Il faudra alors vérifier l’actualité et la fiabilité de cet existant. A défaut, il conviendra d’engager une démarche d’enquête en direct ou via un organisme. Là encore fiabilité et confidentialité, devront être envisagées. Jean-Marc Petit

29 LA DEMARCHE D’ETUDE STATISTIQUE
La collecte des données, leur dépouillement 4. Le dépouillement, l’étiquetage et le tri Il s’agit de la phase où l’on reporte les données ponctuelles obtenues sur un support devant permettre leur traitement, C’est le temps de l’étiquetage qui doit permettre la traçabilité ex: date, heure, lieu, identité de l’enquêteur, L’étiquette sera unique et numérotée pour être retrouvée. Mais aussi l’anonymat. Non croisement des fichiers de données personnelles imposée par la CNIL Jean-Marc Petit

30 LA DEMARCHE D’ETUDE STATISTIQUE
A. La collecte des données, leur dépouillement et leur étiquetage. ii. Le dépouillement et le tri : étape 4 Exemple d’étiquette : Exemple de données dépouillées, avec tri croissant: Selon l’âge : Selon le nombre d’enfants? N°étiquette Enquêteur Date de l’enquête Adresse Qualité de l'enquêté Nbre d'enfant Age de l'aîné Etiquette 101 Jean Aymard 28/04/2011 26, rue du chat bossu, Paris 12ème Père de famille 1 enfant 8 ans i Etiquette Nbre d'enfants Age de l'aîné 1 103 4 2 102 7 3 101 8 104 12 i Etiquette Nbre d'enfants Age de l'aîné 1 101 2 103 3 102 4 104 Jean-Marc Petit

31 STATISTIQUES DESCRIPTIVES
5. Le regroupement des données et leur présentation en tableaux. 5.1 le caractère qualitatif Pour un caractère qualitatif, il suffit de bien repérer les différentes modalités possibles, repérer le nombre de fois où elles se sont présentées puis les présenter dans l’ordre hiérarchique lorsqu’il s’agit d’un caractère qualitatif ordinal pour pouvoir présenter les valeurs cumulées Exemple : i Catégories ni Ni 1 ouvrier 38 2 Contremaître 4 42 3 Techniciens 6 48 Cadres 50 Jean-Marc Petit

32 LA DEMARCHE D’ETUDE STATISTIQUE
5. Le regroupement des données et leur présentation en tableaux. 5.1 le caractère quantitatif est discret Pour tout caractère quantitatif, Il faut prendre garde à ne pas confondre variable (xi) et effectifs(ni) Par exemple si : 5 familles ont 5 enfants, 5 en ont 4, 10 en ont 0, 20 en ont 1, 20 en ont 3 et 40 en ont 2? Ce sont les familles (ni) qui se distribueront selon le nombres d’enfants (xi) Jean-Marc Petit

33 LA DEMARCHE D’ETUDE STATISTIQUE
5. Le regroupement des données et leur présentation en tableaux. 5.1 le caractère quantitatif discret Cela donnera le tableau suivant : xi nombre d’enfants ni :nombre de familles Une manière d’éviter toute erreur de repérage consiste à exprimer la moyenne en ses unités : exemple: ici, ce sera un nombre moyen d’enfants par famille et non un nombre moyen de familles par enfant. i xi ni 1 10 2 20 3 40 4 5 6 Jean-Marc Petit

34 LA DEMARCHE D’ETUDE STATISTIQUE
5. Le regroupement des données et leur présentation en tableaux. 5.1 le caractère quantitatif continu Ce caractère correspond à des situations où le nombre de modalités recensées de la variable est trop important avec des effectifs individuels trop faibles pour que cela ait du sens de les répertorier dans un tableau de type discret. Il faudra donc procéder à la constitution de classe de données, regroupant plusieurs valeurs de la variable dans une logique de continuité. Jean-Marc Petit

35 LA DEMARCHE D’ETUDE STATISTIQUE
5. Le regroupement des données et leur présentation en tableaux. 5.1 le caractère quantitatif continu AGES EFFECTIFS 8 12 13 1 9 11 2 7 14 3 15 5 4 16 6 17 18 19 20 21 10 22 23 Jean-Marc Petit

36 LA DEMARCHE D’ETUDE STATISTIQUE
5. Le regroupement des données et leur présentation en tableaux. 5.1 le caractère quantitatif continu a. Classes d’égales amplitudes On prend le nombre de données, et on divise par le nombre de classes voulu, Ici, cela fait 24/6 = 4 soit 6 classes d’amplitude 4. Soit : Classes ni Jean-Marc Petit

37 LA DEMARCHE D’ETUDE STATISTIQUE
Cette méthode est simple mais exposée aux risques en effet : Le graphique qui en découle a une forme différente de celui qu’on aurait obtenu en reportant chaque année individuellement. Par exemple, cette chute suivi de cette remontée. Jean-Marc Petit

38 LA DEMARCHE D’ETUDE STATISTIQUE
5. Le regroupement des données et leur présentation en tableaux. 5.1 le caractère quantitatif continu Si en (1), (2), (3) et (6) les effectifs individuels se situaient dans un même ordre de grandeur, en (4) et en( 5) on a regroupé des données aux effectifs trop disparates (5) (6) (4) (1) (3) (2) Jean-Marc Petit

39 LA DEMARCHE D’ETUDE STATISTIQUE
Cette méthode est simple mais exposée aux risques en effet : On retrouve ce problème dans le tableau suivant : En 4 et en 5 l’effectif moyen par unité d’amplitude est trop éloigné des valeurs réelles observées. ex: en (4) : 9 pour des valeurs qui vont de 5 à 13. modalités effectifs classes effectifs regroupés effectif/ amplitude 8 1 9 2 7 3 0-4 32 4 5 6 4 - 8_ 21 5,25 10 11 8-12 19 4,75 12 13 14 15 12-16 36 16 17 18 44 20 22 23 48 (1) (2) (3) (4) (5) (6) Jean-Marc Petit

40 LA DEMARCHE D’ETUDE STATISTIQUE
b. d’amplitudes différentes mais homogènes En redécoupant les classes disparates et en regroupant les classes homogènes on peut envisager le découpage suivant : Jean-Marc Petit

41 LA DEMARCHE D’ETUDE STATISTIQUE
5. Le regroupement des données et leur présentation en tableaux. 5.1 le caractère quantitatif continu b. d’amplitudes différentes mais homogènes En redécoupant les classes disparates et en regroupant les classes homogènes on peut envisager le tableau suivant : Classes ni [0;4[ 32 [4;12[ 40 [12;14[ 24 [14;18[ [18;20[ [20;24[ 48 Jean-Marc Petit

42 LA DEMARCHE D’ETUDE STATISTIQUE
b. d’amplitudes différentes mais homogènes Découpage offrant une certaine homogénéité entre les effectifs moyens par unité d’ amplitude et les valeurs réelles : modalités effectifs classes effectifs regroupés effectif/ amplitude 8 1 9 2 7 3 0-4 32 4 5 6 10 11 4-12 40 12 13 12-14 24 14 15 16 17 14-18 18 19 18-20 20 21 22 23 20-24 48 Jean-Marc Petit

43 LA DEMARCHE D’ETUDE STATISTIQUE
6. Les représentations graphiques 6.1 le caractère qualitatif Pour présenter graphiquement l’importance de chaque catégorie on peut calculer la part de chaque catégorie fi=ni/N en valeurs décimales ou en % puis lui affecter un angle proportionnel dans un graphique en secteurs i Catégories ni 1 ouvrier 20 2 Contremaître 15 3 Techniciens 10 4 Cadres 5 Total N =50 fi=ni/N 0,4 0,3 0,2 0,1 1 fi en % 40,00% 30,00% 20,00% 10,00% 100% Angles 360°x fi 144° 108° 72° 36° 360° Jean-Marc Petit

44 LA DEMARCHE D’ETUDE STATISTIQUE
6. Les représentations graphiques 6.1 le caractère qualitatif Le graphique en secteur est moins adapté dès qu’il s’agit de comparer des séries. Ici les entreprises A et B Entreprise A i Catégories niA niB fiA fiB 1 ouvrier 20 30 0,4 0,3 2 Contremaître 15 0,2 3 Techniciens 10 4 Cadres 5 0,1 Total NA =50 NB=100 Entreprise B Jean-Marc Petit

45 LA DEMARCHE D’ETUDE STATISTIQUE
6. Les représentations graphiques 6.1 le caractère qualitatif Pour les comparaisons, le graphique à bandes est plus parlant En effectifs i Catégories niA niB fiA fiB 1 ouvrier 20 30 0,4 0,3 2 Contremaître 15 0,2 3 Techniciens 10 4 Cadres 5 0,1 Total NA =50 NB=100 En % Jean-Marc Petit

46 LA DEMARCHE D’ETUDE STATISTIQUE
. 6. Les représentations graphiques 6.2 le caractère quantitatif discret 621. La distribution le graphique de distribution spécifique à ce caractère est le diagramme en bâtons ni i Nbre d’enfants : xi ni 1 10 2 20 3 40 4 5 6 xi Jean-Marc Petit

47 LA DEMARCHE D’ETUDE STATISTIQUE
621. La distribution On peut également reprendre le graphique en secteur comme pour le modèle quantitatif. 6. Les représentations graphiques 6.2 le caractère quantitatif discret i xi ni fi angle=fi*360 1 10 0,1000 36 2 20 0,2000 72 3 40 0,4000 144 4 5 6 0,0600 21,6 0,0400 14,4 Jean-Marc Petit

48 LA DEMARCHE D’ETUDE STATISTIQUE
. Croissants au sens large Ni= Ni – 1 +ni: on lira 30 personnes Ont…………… 6. Les représentations graphiques 6.2 le caractère quantitatif discret 6.22 Les cumuls i xi ni Ni croiss (=<) 1 10 2 20 30 3 40 70 4 90 5 6 96 100 somme N= Jean-Marc Petit

49 LA DEMARCHE D’ETUDE STATISTIQUE
On peut également calculer effectifs cumulés. décroissants par différence entre le total N et les effectifs cumulés décroissants ex : 2ème ligne 70=100-30 On lira : 70 ménages ont…………………. Large et Strict se complètent pour faire le total.. 6. Les représentations graphiques 6.2 le caractère quantitatif discret 6.22 Les cumuls i xi ni fi Ni croiss (=<) Ni décrois (>) 1 10 0,1000 90 2 20 0,2000 30 70 3 40 0,4000 4 5 6 0,0600 96 0,0400 100 somme N= Jean-Marc Petit

50 LA DEMARCHE D’ETUDE STATISTIQUE
6. Les représentations graphiques 6.2 le caractère quantitatif discret 6.22 Les cumuls Ni [ i xi ni fi Ni croiss (=<) 1 10 0,1000 2 20 0,2000 30 3 40 0,4000 70 4 90 5 6 0,0600 96 0,0400 100 somme N= [ [ [ [ xi La forme en escalier marque la discontinuité et la lecture se fait sur le point ainsi 10Ainsi en 1 on peut lire : que 30 personnes qui ont……………………. Jean-Marc Petit

51 LA DEMARCHE D’ETUDE STATISTIQUE
le graphique spécifique à ce caractère est l’histogramme Si l’on part des données brutes on obtient le graphique suivant : 6. Les représentations graphiques 6.3 le caractère quantitatif continu 6.31 La distribution Classes de données ni [ 4 32 ; 12 40 14 24 18 20 48 Jean-Marc Petit

52 LA DEMARCHE D’ETUDE STATISTIQUE
Si l’on compare Avec le graphique Des données Individuelles On observe des différences de Mouvements Comme entre 4 et 12 ans où une baisse se traduit par une hausse 6. Les représentations graphiques 6.3 le caractère quantitatif continu 6.31 La distribution Jean-Marc Petit

53 LA DEMARCHE D’ETUDE STATISTIQUE
6. Les représentations graphiques 6.3 le caractère quantitatif continu 6.31 La distribution En fait en 8 ans, il est logique d’avoir plus de naissance qu’en 4 ans. Les données brutes comparent des données Non comparables qu’il faudra remettre sur une même Base : l’effectif par unité d’amplitude ou densité di Avec di= ni/ai L’amplitude ai étant calculée par extrêmité supérieure de la classe moins l’extrêmité inférieure : ei+1 - ei Jean-Marc Petit

54 LA DEMARCHE D’ETUDE STATISTIQUE
ean-Marc Petit LA DEMARCHE D’ETUDE STATISTIQUE 6. Les représentations graphiques 6.3 le caractère quantitatif continu 6.31 La distribution Plus respectueux du mouvement original, ai Classes de données ni di= ni/ai 4 [ 32 8 ; 12 40 5 2 14 24 18 6 20 16 48 ei

55 LA DEMARCHE D’ETUDE STATISTIQUE
6. Les représentations graphiques 6.3 le caractère quantitatif continu 6.31 La distribution : l’histogramme Chaque rectangle de l’histogramme ayant pour base ai, aura une aire égale aux effectifs en effet : Aire = di x ai =(ni/ai) x ai = ni di 32 48 32 24 40 24 ei Jean-Marc Petit

56 LA DEMARCHE D’ETUDE STATISTIQUE
6. Les représentations graphiques 6.3 le caractère quantitatif continu 6.31 La distribution On pourra relier les centres de classes sur l’histogramme L’aire sous la courbe étant égale à celle des rectangles de l’histogramme. di 32 48 32 24 40 24 ei Jean-Marc Petit

57 LA DEMARCHE D’ETUDE STATISTIQUE
6.3 le caractère quantitatif continu On pourra, de la même manière construire un histogramme à l’échelle, en choisissant une amplitude de base : la plus petite, la plus grande ou la plus distribuée et en calculant di x ab ai Classes de données ni di x 4 4 [ 32 8 ; 12 40 20 2 14 24 48 18 64 Cette méthode permet d’éviter les valeurs difficiles à manipuler Elle réduit aussi le nombre des calculs. Lorsque l’amplitude de courante est égale à l’amplitude de base l’effectif corrigé = l’effectif Jean-Marc Petit

58 LA DEMARCHE D’ETUDE STATISTIQUE
6. Les représentations graphiques 6.3 le caractère quantitatif continu 6.32 La Répartition (cumul) Classes de données  ni [ 4 32 ; 12 40 14 24 18 20 48 Classes de données  ni Ni crois [ 4 32 ; 12 40 72 14 24 96 18 120 20 152 48 200 Jean-Marc Petit

59 LA DEMARCHE D’ETUDE STATISTIQUE
6. Les représentations graphiques 6.2 le caractère quantitatif continu 6.31 La Répartition (cumul) Pour une série continue, la différenciation entre strict et large ne s’impose pas en raison de la dimension infinitésimale des effectifs sur les valeurs ponctuelles de la variable. Qui a 20 ans ? Le temps de le dire on a déjà 20 ans et 10 secondes… Classes de données  ei ni Ni crois [ 4 32 ; 12 40 72 14 24 96 18 120 20 152 48 200 Jean-Marc Petit

60 LA DEMARCHE D’ETUDE STATISTIQUE
6. Les représentations graphiques 6.3 le caractère quantitatif continu 6.31 La Répartition (cumul) Où chaque point a un sens, Exemple : ei = Ni= Classes de données  ei ni Ni crois [ 4 32 ; 12 40 72 14 24 96 18 120 20 152 48 200 Jean-Marc Petit

61 LA DEMARCHE D’ETUDE STATISTIQUE
6. Les représentations graphiques 6.3 le caractère quantitatif continu 6.31 La Répartition (cumul) On peut d’autant plus facilement passer des effectifs et fréquences cumulés croissants aux données cumulées décroissantes, qu’on ne différencie pas strict et large Nidécr= N - Nicrois Fidécr= 1 - Ficrois Classes de données  ei ni Ni crois décr Fi Crois Fi décroiss 200 1 [ 4 32 168 0,16 0,84 ; 12 40 72 128 0,36 0,64 14 24 96 104 0,48 0,52 18 120 80 0,6 0,4 20 152 48 0,76 0,24 Jean-Marc Petit

62 LA DEMARCHE D’ETUDE STATISTIQUE
6. Les représentations graphiques 6.3 le caractère quantitatif continu 6.31 La Répartition (cumul) Le point d’intersection a pour ordonnée? …………………………………………… ………………………………………………. Me Jean-Marc Petit

63 LA DEMARCHE D’ETUDE STATISTIQUE
Le résumé des données 7.1 les paramètres de tendance centrale Il convient de noter que tous ces paramètres s’exprimeront dans les unités de la variable 7.11 Le mode C’est la valeur de la variable la plus distribuée. Pour une distribution discrète c’est le xi correspondant à l’effectif le plus élevé. Ici :………………………………….. i Nbre d’enfants : xi ni 1 10 2 20 3 40 4 5 6 Jean-Marc Petit

64 LA DEMARCHE D’ETUDE STATISTIQUE
7. Le résumé des données 7.1 les paramètres de tendance centrale 7.11 Le mode On parlera de classe modale et le mode sera déterminé À partir des effectifs corrigés ou densités, soit la bande d’histogramme la plus élevée. Ici,…………………………………………….;. ai Classes de données ei ni di= ni/ai 4 [ 32 8 ; 12 40 5 2 14 24 18 6 20 16 48 Jean-Marc Petit

65 LA DEMARCHE D’ETUDE STATISTIQUE
7. Le résumé des données 7.1 les paramètres de tendance centrale 7.112 La médiane C’est la valeur de la variable telle que l’effectif en deçà de la médiane égale l’effectif au-delà de la médiane. 7.111 le cas des variables discrètes: Pour cette distribution discrète, ce sera 2 enfants avec 30 familles en deçà e et autant au-delà, on ne trouve toutefois pas souvent des distributions aussi parfaites. i Nbre d’enfants : xi ni 1 10 2 20 3 40 4 5 6 Jean-Marc Petit

66 LA DEMARCHE D’ETUDE STATISTIQUE
7. Le résumé des données 7.1 les paramètres de tendance centrale 7.12 La médiane 7.121 le cas des variables discrètes: avec N impair Pour cette distribution discrète, L’effectif total est de 105 donc le pivot est N/2 + 0,5 soit la 53 éme famille qui a familles avant elle et 52 après. Ce 53ème correspond à Me= Cela ne fonctionne que parce que N est impair i Nbre d’enfants : xi ni Ni 1 10 2 20 30 3 40 70 4 15 85 5 12 97 6 8 105 Jean-Marc Petit

67 LA DEMARCHE D’ETUDE STATISTIQUE
7. Le résumé des données 7.1 les paramètres de tendance centrale 7.12 La médiane 7.121 le cas des variables discrètes: avec N pair Ici le total de 110, il ne peut y avoir de valeur pivot. Si l’on retient 55 il a 54 familles avant et 55 après. Par convention on prend N/2 +1 soit =56 soit la 56ème famille, même si cela fait 55 avant et 54 après Ce qui correspond, ici à Me= i Nbre d’enfants : xi ni Ni 1 10 2 20 30 3 25 55 4 85 5 105 6 110 Jean-Marc Petit

68 LA DEMARCHE D’ETUDE STATISTIQUE
7.11 La médiane 7.122 le cas des variables continues On part du tableau des effectifs ou fréquences cumulées, pour repérer l’intervalle comprenant N/2 (Ni) ou 0,5 (Fi) et sa correspondance dans les ei. ici pour les Ni : 200/2 =100, compris entre 96 et 120 soit entre 0,48 et 0,6 pour Fi et donc entre 14 et 18 pour les ei Classes de données  ei ni Ni crois Fi Crois [ 4 32 0,16 ; 12 40 72 0,36 14 24 96 0,48 18 120 0,6 20 152 0,76 48 200 1 Jean-Marc Petit

69 LA DEMARCHE D’ETUDE STATISTIQUE
7.12 La médiane le cas des variables continues Pour plus de précision, il faut procéder à une interpolation linéaire a = a’= Me-14 b=120-96 b’ = 18-14 Les classes étant homogènes la progression est linéaire, et donc Soit après calcul, en remplaçant a,a’,b et b’ par leurs valeurs : …… ei Ni crois 14 96 Me 100 18 120 a’ a b’ b Jean-Marc Petit

70 LA DEMARCHE D’ETUDE STATISTIQUE
7. Le résumé des données 7.1 les paramètres de tendance centrale 7.13 La moyenne arithmétique pondérée C’est la moyenne calculée en donnant à chaque valeur de la variable un poids différent selon sa part dans l’effectif, Elle répond à la formule suivante : Soit pour une série discrète : ……………………………………………………………………………. i xi ni 1 10 2 20 3 40 4 5 6 somme N= 100 somme/N Moyenne = i xi ni 1 10 2 20 3 40 4 5 6 somme N= 100 somme/N Moyenne = Jean-Marc Petit

71 LA DEMARCHE D’ETUDE STATISTIQUE
7. Le résumé des données 7.1 les paramètres de tendance centrale 7.13 La moyenne arithmétique pondérée Pour une série continue il faudra calculer les centres de classes qui constitueront les xi = enfants par famille ai Classes de données ei xi ni xini 4 [ 2 32 8 ; 12 40 14 13 24 18 16 20 19 22 48 N = 200 ai Classes de données ei ni 4 [ 32 8 ; 12 40 2 14 24 18 20 48 200 Jean-Marc Petit

72 LA DEMARCHE D’ETUDE STATISTIQUE
7. Le résumé des données 7.2 les paramètres de dispersion 7.21 L’étendue Soit un professeur A qui a donné 5 notes de 1 et 5 notes de 19 soit une moyenne de 10 Et un professeur B qui a donné 5 notes de 9 et 5 notes de 11 soit une moyenne de 10 Cette même moyenne de 10 ne rend pas compte des différences de notation. En notant sur une étendue de … A note de manière plus dispersée que B qui a une notation plus concentrée sur une étendue de …... Jean-Marc Petit

73 LA DEMARCHE D’ETUDE STATISTIQUE
7. Le résumé des données 7.2 les paramètres de dispersion 7.21 L’étendue L’étendue se calcule par = xn-x1 pour une série discrète soit ici : Et par en-e1 pour une série Continue, soit ici: Classes de données  ei ni Ni crois Fi Crois [ 4 32 0,16 ; 12 40 72 0,36 14 24 96 0,48 18 120 0,6 20 152 0,76 48 200 1 i xi ni 1 10 2 20 3 40 4 5 6 somme N= 100 Jean-Marc Petit

74 LA DEMARCHE D’ETUDE STATISTIQUE
7. Le résumé des données 7.2 les paramètres de dispersion 7.22 Les intervalles inter-quartiles Si un professeur C a donné un 1 et un 19 puis neuf 9 et neuf 11, il obtient une moyenne de 10 avec une étendue de 18 comme A alors qu’il n’a pas noté de la même manière que lui. En effet l’étendue fausse l’analyse car elle ne s’intéresse qu’aux extrêmes. L’étendue ne dit rien des tendances intermédiaires, L’écart interquartile indique dans quelle amplitude se situent les 50% de la population les plus centrées. Plus cette amplitude sera importante, plus la population sera dispersée… Plus il sera réduit plus on la dira concentrée Jean-Marc Petit

75 LA DEMARCHE D’ETUDE STATISTIQUE
7. Le résumé des données 7.2 les paramètres de dispersion 7.22 Les intervalles inter-quartiles L’écart interquartile indique dans quelle amplitude se situent les 50% de la population les plus centrées. Pour le déterminer il faut calculer : Q1 : valeur de la variable telle que 25% des effectifs se situent en deçà et 75% au-delà Q3 : valeur de la variable, telle que 75% des effectifs se situent en deçà et 25% au-delà IQ = Q3- Q1 Pour mémoire, Q2 constitue la médiane. Q1 et Q3 sont également déterminés par interpolation linéaire. Jean-Marc Petit

76 LA DEMARCHE D’ETUDE STATISTIQUE
7. Le résumé des données 7.2 les paramètres de dispersion 7.22 Les intervalles inter-quartiles IQ = = ans ei ni Ni crois 32 4 Q1 40 50=N/4 12 72 24 14 96 18 120 Q3 150 = 3N/4 20 152 48 200 Jean-Marc Petit

77 LA DEMARCHE D’ETUDE STATISTIQUE
IQ= 12,275 ans signifie que les 50% de la population les plus centrés s’inscrivent dans un intervalle de 12,275 ans. Si une autre série donne une valeur supérieure elle sera dite plus dispersée, donc moins concentrée. Si elle donne une valeur inférieure, elle sera dite moins dispersée donc plus concentrée. A condition que les données se situent dans des échelles comparables A défaut, Il faut rendre les données comparable en introduisant un élément de dimension qui sera la médiane. On calculera donc l’écart inter-quartile relatif = IQ/Me =12,275/………=…………….. Jean-Marc Petit

78 LA DEMARCHE D’ETUDE STATISTIQUE
7.2 les paramètres de dispersion 7.23 L’écart-type : L’intervalle interquartile indique dans quel intervalle se situent les 50% de la population les plus centrées mais ne dit rien des 25% en amont de Q1 et en aval de Q3. L’écart-type va viser à prendre en compte toutes les valeurs de la variable. Il se calcule dans la logique d’une moyenne pondérée des écarts à la moyenne : Pour éviter les questions de signes, on peut élever au carré et obtient la variance V(x)= Pour l’Ecart-type, on revient au premier degré par : = =

79 LA DEMARCHE D’ETUDE STATISTIQUE
7.2 les paramètres de dispersion 7.23 L’écart-type : = i xi ni xini 1 10 2 20 3 40 80 4 60 5 6 24 somme N= 100 204 somme/N Moyenne = 2,04 Variance = Ecart type = Jean-Marc Petit

80 LA DEMARCHE D’ETUDE STATISTIQUE
7. Le résumé des données 7.2 les paramètres de dispersion 7.23 L’Ecart-type En développant et simplifiant V(x) = On obtient la formule V(x) = plus rapide à calculer en remultipliant la colonne des xini par xi: Exemple : =…………….. i xi ni xini 1 10 2 20 3 40 80 4 60 5 6 24 somme N= 100 204 somme/N 2,04 Jean-Marc Petit

81 LA DEMARCHE D’ETUDE STATISTIQUE
7. Le résumé des données 7.2 les paramètres de dispersion 7.23 L’Ecart-type Exemple pour une série continue Soit V(x) = V(x)= et = ei xi ni xini 2 32 64 128 4 8 40 320 2560 12 13 24 312 4056 14 16 384 6144 18 19 608 11552 20 22 48 1056 23232 N = 200 2744 47672 /200 13,72 238,36 Jean-Marc Petit

82 LA DEMARCHE D’ETUDE STATISTIQUE
7. Le résumé des données 7.2 les paramètres de dispersion 7.23 L’Ecart-type Comme pour l’interquartile relatif on intégrera un élément de dimension des données au moyen de la moyenne, en calculant le Coefficient de Variation : Pour le nombre d’enfants par famille CV=1,1825/ = Pour la répartition par âge CV=7,0797/ = Jean-Marc Petit

83 LA DEMARCHE D’ETUDE STATISTIQUE
7. Le résumé des données 7.2 les paramètres de dispersion 7.24 La courbe de Lorentz et l’indice de Gini: Ces éléments sont souvent utilisés afin de mettre en évidence des inégalités, puisqu’il s’agit de comparer les différentes parts de revenu ou de chiffre d’affaires détenu par différentes parts de la population. Soit ici, une population salariée répartie selon le niveau moyen de salaire. xi : salaire moyen ni: nbre de salariés fi = ni/N Fi : fi cumulés 1000 20 1500 30 2000 60 2500 40 3000 3500 4000 10 5 200 1 Jean-Marc Petit

84 LA DEMARCHE D’ETUDE STATISTIQUE
7.24 La courbe de Lorentz et l’indice de Gini: Ces éléments sont souvent utilisés afin de mettre en évidence des inégalités, puisqu’il s’agit de comparer les différentes parts de revenu ou de chiffre d’affaires détenu par différentes parts de la population. Ici xini représente la masse salariale perçue par la catégorie de salariés xi, pour une masse salariale globale de Ainsi les gens qui gagne 1000€ en moyenne se partagent €, sachant que la masse salariale globale est de € xi : salaire moyen ni: nbre de salariés fi = ni/N Fi : fi cumulés xini 1000 20 0,1 1500 30 0,15 0,25 2000 60 0,3 0,55 2500 40 0,2 0,75 3000 0,85 3500 0,95 4000 10 0,05 1 200 Jean-Marc Petit

85 LA DEMARCHE D’ETUDE STATISTIQUE
7.24 La courbe de Lorentz et l’indice de Gini Ces éléments sont souvent utilisés afin de mettre en évidence des inégalités, puisqu’il s’agit de comparer les différentes parts de revenu ou de chiffre d’affaires détenu par différentes parts de la population. On peut donc calculer f’i qui est la part du total des ressources ressources perçue par la catégorie xi. Ainsi les gens qui gagnent 1000€ se partagent 4,4% (f’1) sachant qu’ils représentent 10% (f1)de la population.. xi : salaire moyen ni: nbre de salariés fi = ni/N Fi : fi cumulés xini f'i =xini/ 1000 20 0,1 1500 30 0,15 0,25 2000 60 0,3 0,55 2500 40 0,2 0,75 3000 0,85 3500 0,95 4000 10 0,05 1 200

86 Ainsi les 30 salariés gagnant 1500€ moyenne se répartissent …… €
LA DEMARCHE D’ETUDE STATISTIQUE 7.24 La courbe de Lorentz et l’indice de Gini. Ainsi les 30 salariés gagnant 1500€ moyenne se répartissent …… € au sein des ……….€ distribués par l’entreprise à l’ensemble des salariés. Ils représentent 15% des salariés mais ne se partagent que …..% de la masse salariale. 10% de la population gagne 3500€ en moyenne et se partage ……% de la masse salariale. xi : salaire moyen ni: nbre de salariés fi = ni/N Fi : fi cumulés xini f'i =xini/ 1000 20 0,1 20000 0,0440 1500 30 0,15 0,25 45000 0,0989 2000 60 0,3 0,55 120000 0,2637 2500 40 0,2 0,75 100000 0,2198 3000 0,85 60000 0,1319 3500 0,95 70000 0,1538 4000 10 0,05 1 40000 0,0879 200 455000 Jean-Marc Petit

87 LA DEMARCHE D’ETUDE STATISTIQUE
724. La courbe de Lorentz et l’indice de Gini: Fi représente la part cumulée de salariés et Fi’ la part cumulée de la masse salariale qu’ils perçoivent. Ainsi …% des salariés percevant moins de 2000€ en moyenne représentent au total …..% de la masse salariale Et les ….%des salariés percevant moins de 3500€ en moyenne représentent au total ……% de la masse salariale xi : salaire moyen ni: nbre de salariés fi = ni/N Fi : fi cumulés xini f'i =xini/ F'i 1000 20 0,1 20000 0,0440 1500 30 0,15 0,25 45000 0,0989 0,1429 2000 60 0,3 0,55 120000 0,2637 0,4066 2500 40 0,2 0,75 100000 0,2198 0,6264 3000 0,85 60000 0,1319 0,7582 3500 0,95 70000 0,1538 0,9121 4000 10 0,05 1 40000 0,0879 1,0000 200 455000 Jean-Marc Petit

88 LA DEMARCHE D’ETUDE STATISTIQUE
7.24 La courbe de Lorentz et l’indice de Gini La courbe de Lorentz en bleu, indique le niveau de concentration par comparaison avec la bissectrice représentant l’égalité parfaite. On aura en abscisse la part Cumulée de population Fi Et en ordonnée la part cumulée de ressources(F’i) Attribuée à cette part de population xi fi = ni/N en% Fi : fi % f'i en % F'i en % 1000 10,00 4,40 1500 15,00 25,00 9,89 14,29 2000 30,00 55,00 26,37 40,66 2500 20,00 75,00 21,98 62,64 3000 85,00 13,19 75,82 3500 95,00 15,38 91,21 4000 5,00 100,00 8, 79 Jean-Marc Petit

89 LA DEMARCHE D’ETUDE STATISTIQUE
724 La courbe de Lorentz et l’indice de Gini: Plus la courbe s’éloigne de cette bissectrice, plus il y a de concentration dans le groupe supérieur, donc d’inégalités. Ainsi la courbe bleue reflète une plus grande dispersion sur les différents groupes Que la courbe verte, plus Inégalitaire. xi fi = ni/N en% Fi : fi % f'i en % F'i en % 1000 10,00 4,40 1500 15,00 25,00 9,89 14,29 2000 30,00 55,00 26,37 40,66 2500 20,00 75,00 21,98 62,64 3000 85,00 13,19 75,82 3500 95,00 15,38 91,21 4000 5,00 100,00 8, 79 Jean-Marc Petit

90 LA DEMARCHE D’ETUDE STATISTIQUE
724 La courbe de Lorentz et l’indice de Gini Cette écartement de la bissectrice est synthétisé par l’indice de Gini qui rapporte la surface ce concentration comprise entre la courbe de Lorentz et la bissectrice au triangle rectangle qui la comprend. Plus l’indice sera proche De 1 plus il y aura de Concentration (inégalités) de o plus il y aura de Dispersion (égalité) Jean-Marc Petit

91 LA DEMARCHE D’ETUDE STATISTIQUE
724 La courbe de Lorentz et l’indice de Gini Il se calcule par la formule : Donc ici l’indice de Gini = = xi : salaire moyen ni: nbre de salariés fi = ni/N Fi : fi cumulés xini f'i =xini/455000 F'i fi*(F'i-1+F'i) exemples de détail des calculs - 1000 20 0,1 0,1000 20000 0,0440 1500 30 0,15 0,2500 45000 0,0989 0,1429 2000 60 0,3 0,5500 120000 0,2637 0,4066 2500 40 0,2 0,7500 100000 0,2198 0,6264 3000 0,8500 60000 0,1319 0,7582 3500 0,9500 70000 0,1538 0,9121 4000 10 0,05 1,0000 40000 0,0879 200 1 455000 Jean-Marc Petit

92 LA DEMARCHE D’ETUDE STATISTIQUE
724 La courbe de Lorentz et l’indice de Gini Il se calcule par la formule : Les seuils communément retenus sont : concentration nulle Concentration très faible à faible Concentration forte à très forte Autour de 0,5 on parlera de concentration moyenne. Jean-Marc Petit


Télécharger ppt "STATISTIQUES pour la Gestion JM. Petit M. Belkhadir JP Bouffenie"

Présentations similaires


Annonces Google