La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Licence 3 ème année de sociologie Semestre 1 Analyse de données quantitatives Séance 2 Enseignant: F. Lebaron.

Présentations similaires


Présentation au sujet: "Licence 3 ème année de sociologie Semestre 1 Analyse de données quantitatives Séance 2 Enseignant: F. Lebaron."— Transcription de la présentation:

1 Licence 3 ème année de sociologie Semestre 1 Analyse de données quantitatives Séance 2 Enseignant: F. Lebaron

2 Séance 2: Les variables numériques. Indices de tendance centrale. Idée générale: on veut résumer la distribution observée par une valeur « centrale » qui la représente bien. Exemple: les notes dun élève au Bac. Première réponse: on prend la valeur observée la plus fréquente. Exemple: lélève a eu deux fois 11, et une seule fois toutes ses autres notes. Cette valeur sappelle le mode.

3 Séance 2: Les variables numériques. Indices de tendance centrale. Autre réponse: on calcule la moyenne pondérée du protocole des notes. Exemple: les « coefficients » des différentes matières sont les pondérations retenues. Autre réponse: on cherche une modalité qui « sépare » les notes en deux groupes deffectifs égaux ou quasi-égaux. Cest la problématique de la médiane, cas particulier des quantiles (protocoles ordinaux).

4 Notations I support du protocole : ensemble dindividus. À lélément i de I on associe sa valeur x i Le protocole est noté x I et leffectif n I. Fréquence

5 Définitions Total Moyenne Par définition, un protocole centré est de moyenne nulle

6 Somme des carrés (SC) Somme des carrés bruts (SCB): Somme des carrés centrés Identité de Huyghens:

7 Les limites de la moyenne La moyenne nest pas toujours un « bon » indice de tendance centrale. Soit un pays à la population stable où le revenu annuel moyen est de dollars. En 5 ans, les revenus des 1% les plus riches, qui disposent de 20% du total de tous les revenus, augmentent de +50%, alors que tous les autres revenus restent stables. Le total des revenus augmente de +10% sans variation de population: le revenu annuel moyen est désormais de dollars. Pourtant la situation de 99% de la population na pas changé ! Doù le recours à la médiane.

8 Structure déchelle ordinale On appelle échelle ordinale un ensemble dobservables muni dun ordre total noté < ; les modalités (échelons) sont notées u1, u2,…, ul, … uL, avec u1 < u2 … < ul… < uL. Deux échelons successifs dune échelle ordinale déterminent une coupure : la coupure entre u1 et u2 est notée 1|2, … celle entre ul et u(l+1) est notée l|l+1, etc.

9 Effectifs des modalités La distribution dun protocole ordinal (protocole à valeur dans une échelle ordinale) est définie par leffectif de chaque échelon : n 1 (effectif de u1 ), n 2 (effectif de u2 ), … n l (effectif de ul ), avec

10 Effectifs cumulés A la coupure l|l+1, on associe leffectif cumulé à gauche: Et leffectif cumulé à droite:

11 La médiane Un protocole ordinal peut admettre : Une coupure médiane si cette coupure a autant dobservations ( n/2 ) à gauche quà droite ; plus généralement, un intervalle médian sil existe un ensemble déchelons compris entre deux coupures, tels que le nombre dobservations à gauche de la coupure de gauche et le nombre dobservations à droite de la coupure de droite sont tous deux égaux à n/2 ; Un échelon médian, sil existe un échelon observé pour lequel on a autant dobservations à droite quà gauche ; Sinon, le protocole admet un échelon quasi-médian, défini comme léchelon pour lequel leffectif cumulé à gauche et leffectif cumulé à droite de cet échelon sont tous deux (strictement) inférieurs à n/2 ; parmi les deux coupures encadrant léchelon quasi-médian, la coupure quasi-médiane est la coupure de gauche si leffectif cumulé à gauche de léchelon quasi-médian est supérieur à leffectif cumulé à droite ; dans le cas contraire, cest la coupure de droite. Protocoles numériques regroupés en classes : on calcule la médiane interpolée.


Télécharger ppt "Licence 3 ème année de sociologie Semestre 1 Analyse de données quantitatives Séance 2 Enseignant: F. Lebaron."

Présentations similaires


Annonces Google