La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

2- 15 : Variance. Ecart type. La variance est la moyenne arithmétique des carrés des écarts des valeurs de la variable à leur moyenne arithmétique. On.

Présentations similaires


Présentation au sujet: "2- 15 : Variance. Ecart type. La variance est la moyenne arithmétique des carrés des écarts des valeurs de la variable à leur moyenne arithmétique. On."— Transcription de la présentation:

1 2- 15 : Variance. Ecart type. La variance est la moyenne arithmétique des carrés des écarts des valeurs de la variable à leur moyenne arithmétique. On la désigne par : L’écart type, désigné par  est la racine carré positive de la variance V X : Trouver l’étendue, la variance et l’écart type des nombres :12, 6, 7, 3, 15, 10, 18, 5. Exemple 1 : variable discrète : Définition.

2 Exemple 2 : variable continue. Age (années) Centre des classes Effectifs n i |x i -m|(x i -m) 2 (x i -m) 2 n i [20, 25[ [25, 30[ [30, 35[ [35, 40[ [40, 45[ [45, 50[ [50, 55[ [55, 60[  n i = N = Calculer la variance et l’écart type. Rappelons que m = 35.5 ans. A partir de la définition : On déduit : : Autre forme de calcul de la variance et de l’écart type.

3 Age (années) Centre des classes Effectifs n i xi2xi2 x i 2 n i [20, 25[ [25, 30[ [30, 35[ [35, 40[ [40, 45[ [45, 50[ [50, 55[ [55, 60[ Exemples de calcul de la variance par application de cette seconde formule. Trouver la variance et l’écart type des nombres :12, 6, 7, 3, 15, 10, 18, 5. Exemple 1 : variable discrète. Exemple 2 : variable continue.

4 : Intérêt de ce second procédé. La formule de définition de la variance la moyenne arithmétique (qui est peut être un nombre décimal) n’intervient qu’une fois en fin de calcul, et aucun écart à la moyenne arithmétique n’est à calculer. Le fait que les écarts | x i – m | soient décimaux ne présente aucune gêne dans les calculs, ce qui ne serait pas le cas si la variance était calculée au moyen de la formule de définition. entraîne le calcul des écarts de valeurs de la variable statistique à leur moyenne arithmétique, puis l’élévation au carré des résultats obtenus. Généralement la moyenne arithmétique d’une distribution statistique se présente sous la forme d’un nombre décimal ; les écarts | x i – m | sont eux-mêmes décimaux (ce n’était cependant pas le cas dans l’exemple numérique retenu) et bien entendu leurs carrés le sont également. Les calculs sont alors longs et fastidieux. Dans le calcul par la formule

5 : Troisième formule de calcul de la variance et de l’écart-type. La différence (x i -m) peut s’écrire (x i -x 0 )-(m-x o ) ; x 0 étant une valeur quelconque de la variable statistique. Dans ce cas, on montre que la variance peut être écrite sous la forme suivante : L’avantage de cette formule tient surtout dans un choix judicieux de x 0 qui rende les calculs moins lourds. On peut interpréter x 0 comme une moyenne provisoire. On déduit : Propriété 1 de la moyenne. Propriété 2 de la moyenne. Si l’on prend x 0 = m : Si x 0 diffère de m : Cette inégalité traduit une propriété de la moyenne arithmétique déjà annoncée.

6 Retranchons à cette moyenne arithmétique un nombre égal à deux fois la mesure de l’écart type : 35,5 - (7,4 * 2) = 20,7 ans. Nous obtenons les bornes : 20,7 et 50,3 d’un intervalle d’amplitude égale à quatre fois la mesure de l’écart type, intervalle centré sur la valeur moyenne. On voit sans mal par le graphique (ou par le calcul) que cet intervalle contient environ 95% de la population : Utilisation de l’écart type comme caractéristique de dispersion. Ajoutons que, quelle que soit la distribution statistique étudiée, un intervalle dont les bornes sont égales à m – 2  et m + 2  contient toujours au moins 75 % des unités constituant la population étudiée. 95% La distribution statistique portant sur les âges des ouvriers de l’entreprise que nous avons déjà d’étudié a pour moyenne arithmétique m = 35,5 ans et pour écart type  =7,4 ans. Ajoutons à la moyenne arithmétique un nombre égal à deux fois la mesure de l’écart type : 35,5 + (7,4 * 2) = 50,3 ans. D’une façon plus générale un intervalle dont les bornes sont égale à m – t  et m + t , contient toujours une proportion des effectifs de la population au moins égale à :

7 : Coefficient de variation. Rapport appelé coefficient de variation, et confronter les deux résultats obtenus. On obtiendrait : Coefficient de variation de la première population : Coefficient de variation de la seconde population : Supposons qu’une population statistique ait une moyenne arithmétique égale à m, et un écart type égal à . Reprenons la même population statistique, mais en prenant des valeurs égales k fois les valeurs de la série de départ. La nouvelle population aurait une moyenne arithmétique égale à km ; son écart type serait égale k . Il serait cependant anormal, puisqu’il s’agit dans les deux cas de la même série, de prétendre que la seconde population est k fois plus dispersée que la première. On peut toutefois, pour les deux populations, faire le rapport : Les deux populations (en réalité deux fois la même) ont même coefficient de variation. On peut conclure – ce qui ne surprend pas- qu’elles ont même dispersion. On peut donc recommander, dans la comparaison des séries statistiques du point de vue de leur dispersion, d’utiliser le coefficient de variation, et de ne pas se limiter à la comparaison de leurs seuls écarts types.

8 2- 16 : Quelques conseils pour l’étude de séries statistiques simples. Ce paragraphe n’ajoute rien de nouveau aux précédents. Mais, en fonction des difficultés et des erreurs qui gênent souvent, il visent à proposer quelques idées simples. 1°) Il est nécessaire de séparer clairement deux types de calculs : - moyenne, écart-type…, à réaliser à partir des centres de classes et des effectifs de classe ; -médiane, quartile, intervalles interquartiles…, à réaliser à partir des extrémités de classes et des effectifs cumulés. 2°) Il est important, devant chaque résultat, de préciser en quelle unité il est exprimé et de le confronter aux données. On évite alors de trouver des moyennes ou des médianes qui ne sont même pas comprises contre les valeurs extrêmes, ou qui sont dépourvues de sens. L’écart type se mesure dans la même unité que les données ; pour vérifier son ordre de grandeur, on peut retenir que pour une population assez bien centré, 4  est du même ordre de grandeur que l’étendue. 3°) pour éviter les erreurs dans l’élaboration des tableaux d’effectifs cumulés, il est recommandé de se référer à la signification de ces effectifs. 4°) Il est souvent utile de contrôler des calculs algébriques par une méthode graphique ou réciproquement (calcul de la médiane et des autres caractéristiques de position). 5°) Pour effectuer des graphiques, il ne faut pas hésiter à passer du temps à choisir les échelles et à graduer les axes. Ce temps n’est pas « perdu », il donne au contraire une grande sécurité au tracé qui suit. 6°) Un tableau ou un graphique ne doivent jamais être présentés sans titre, ni sans précision concernant la population, les unités etc. La statistique n’est pas seulement un exercice scolaire et, dans le travail, un tableau sur feuille volante sans référence est inutilisable. 7°) Les définitions de ce chapitre et du précédent sont destinées à l’étude d’une série statistique simple ou à la comparaison de plusieurs séries simples. Le choix des caractéristiques à utiliser dépend des séries à étudier.

9 Chapitre 3 : Etude des séries statistiques doubles : Position du problème. Dans les deux premiers chapitres, les séries statistiques étudiées étaient des séries statistiques simples ; on étudiait une population selon un seul caractère. Cependant, il est souvent utile de considérer à la fois plusieurs caractères de la même population : la taille, l’âge et le poids d’un groupe d’enfants ; le salaire et la qualification d’un ensemble de salariés ; le format et le nombre de pages de publications ; la température et la pression d’un milieu à différentes heures etc. Nous nous limiterons ici à l’étude simultanée de deux caractères ; l’analyse des données permet d’en étudier un grand nombre.

10 Unités statistiquesVariable 1 désigné par xVariable 2 désignée par y Enfants d’une école Mariages célébrés dans un pays Année Mois Taille Age de l’époux (au moment du mariage) Production française d’acier Tonnage transporté (entreprise) Poids Moyenne des notes scolaire Age de l’épouse Nombre de wagons chargés Consommation de carburant Il est intuitif que se présenteront les situations suivantes : a- les variations des deux caractères n’ont aucun lien entre elles ; par exemple les tailles respectives des N enfants d’une école, et les moyennes arithmétiques respectives des notes obtenues par ces N enfants, au cours de l’année scolaire. On dira dans ce cas que les deux variables sont indépendantes. b- les deux caractères sont liés l’un à l’autre de façon telle que la connaissance de la mesure, pour chaque unité statistique, de l’une des deux variables entraîne la connaissance rigoureuse de la mesure, pour la même unité, de l’autre variable. Par exemple, le montant de l’impôt sur les revenus annuels déclarés par les N contribuables d’un pays, et le montant de l’impôt sur le revenu payé par chacun de ces N contribuables. On dira alors que les deux variables sont en liaison fonctionnelle, l’une des deux pouvant être fonction de l’autre.

11 c- sans être liées rigoureusement les deux variables sont en dépendance, plus ou moins marquée. On dira alors que les deux variables sont en corrélation. Exemple : Le poids et la taille des enfants d’une école sont deux variables en corrélation. C’est sur la situation c) entre deux variables, c'est-à-dire sur la corrélation entre deux variables, que portera le présent chapitre : Exemple de tableau à double entrée. Age (X) en années Poids (Y) en kg [3,4[[4,5[[5,6[Effectifs n y [10,15[ [15,20[ [20,25[ [25,30[ Effectifs n x  n x =  n y = 142 Statistique portant sur les enfants de sexe masculin d’une école maternelle, étudiés d’après leur âge et leur poids. Dans ce tableau on lit facilement que : - 19 enfants ont un âge compris entre 3 et 4 ans, et pèsent entre 10 et 15 kg. -12 enfants ont un âge compris entre 5 et 6 ans, et pèsent entre 15 et 20 kg. -1 enfant a un âge compris entre 5 et 6 ans et pèse entre 25 et 30 kg. -18 enfants ont un âge compris entre 4 et 5 ans, et pèsent entre 20 et 25 kg.

12 3 - 3 : Notations et représentations des séries statistiques doubles. Il est nécessaire d’employer des notations précises pour représenter les tableaux à double entrée. Soient X et Y les deux caractères (quantitatifs ou non). Les classes du caractère X sont désignées par les indices 1, 2, ……., j, ……, p, celles du caractère Y par les indices 1, 2, ………., i, ……., q. n ij est le nombre d’unités présentant la modalité y i de Y et la modalité x j de X. X Y x1x1 x2x2 …..xjxj xpxp Total y1y1 n 11 n 12 …..n 1j …..n 1p n 1. y2y2 n 21 n 22 …..n 2j …..n 2p n 2. ….. …...….. yiyi n i1 n i2 …..n ij …..n ip n i. ….. yqyq n q1 n q2 …..n qj …..n qp n q. Totaln.1 n.2 …..n.j …..n.p n.. Les sommes des effectifs de la ligne i, de la colonne j et de l’ensemble sont notées respectivement : La dernière ligne et la dernière colonne du tableau représentent respectivement la distribution de X sans tenir compte du caractère Y ou celle de Y sans tenir compte de X. Si l’on désire élaborer un tel tableau, le premier travail à effectuer est de vérifier que la même somme n.. se retrouve soit comme somme des n i. (addition des lignes, puis de la dernière colonne) soit comme somme des n.j (addition des colonnes, puis de la dernière ligne).


Télécharger ppt "2- 15 : Variance. Ecart type. La variance est la moyenne arithmétique des carrés des écarts des valeurs de la variable à leur moyenne arithmétique. On."

Présentations similaires


Annonces Google