Licence 3ème année de sociologie Semestre 1

Slides:



Advertisements
Présentations similaires
5. Statistiques.
Advertisements

Pr. Abdelkrim EL MOUATASIM EST de Guelmim Maroc
Présentation des données
La mesure des inégalités
Statistique descriptive
Chapitre 5. Description numérique d’une variable statistique.
Les Variables statistiques continues
Comparaison de plusieurs moyennes observées
CHAPITRE 6 Fonctions numériques.
1. Les caractéristiques de dispersion. 11. Utilité.
Notions de variable aléatoire et de probabilité d’un événement
Statistique et probabilités au collège
Probabilités au collège
Répondre aux questions suivantes :
L’OUTIL STATISTIQUE.
Statistiques descriptives
INF L14 Initiation aux statistiques
Mesurer les inégalités
Les principaux résumés de la statistique
L’inférence statistique
Opération et systèmes de décision Faculté des Sciences de l administration MQT Probabilités et statistique Mesures caractéristiques.
Tableaux de distributions
Tendance centrale Ex: Examen de philo. La moyenne était de 34%. Permet de caractériser une série statistique au moyen dune valeur ou modalité typique.
Tableaux de distributions
Comprendre la variation dans les données: Notions de base
La statistique descriptive
Université dOttawa - Bio Biostatistiques appliquées © Antoine Morin et Scott Findlay :47 1 Concepts fondamentaux: statistiques et distributions.
Les mesures de la tendance centrale
Objectifs du chapitre 2 d’Howell sur les statistiques descriptives
Loutil statistique les mesures de tendance centrale Auto-évaluation.
Séries chronologiques et prévision
Mesures de position Ils s’expriment dans la même unité que les observations Moyenne et moyenne pondérée Exemple : on dispose du nombre moyen d’enfants.
Thème: statistiques et probabilités Séquence 3: Statistique descriptive Utiliser un logiciel (par exemple, un tableur) ou une calculatrice pour étudier.
Rappels de statistiques descriptives
Comment mesurer les inégalités ?
STATISTIQUE DESCRIPTIVE ÉLÉMENTAIRE
Présentation du marché obligataire
STATISTIQUES DESCRIPTIVES
Micro-intro aux stats.
Seconde partie Cours de seconde
STATISTIQUE DESCRIPTIVE Dr LEMDAOUI MOHAMED CHERIF
Introduction à une analyse statistique de données
Les fonctions de référence
Distribution symétrique
1 Licence Stat-info CM1 b 2004Christophe Genolini 2.1. Vocabulaire Individu : objet étudié Population : Ensemble des individus Variable : nom donné à ce.
Comment mesurer les inégalités ?
Méthodologie de l’observation
PARAMETRES STATISTIQUES
STATISTIQUES DESCRIPTIVES
STATISTIQUE DESCRIPTIVE Dr LEMDAOUI MOHAMED CHERIF
Statistique Descriptive Les Paramètres de Tendance Centrale
Seconde 8 Chapitre 4: Les statistiques
Statistiques Première partie Cours de première S.
5.5 Les application de la moyenne, de la médiane et du mode
Opération et systèmes de décision Faculté des Sciences de l ’administration MQT Probabilités et statistique Les statistiques descriptives.
BIOSTATISTIQUES Définitions.
BIOSTATISTIQUES Définitions.
Paramètres de position et de dispersion
ECHANTILLONAGE ET ESTIMATION
Mesures de description des valeurs des variables
1. Tri rapide ou Quicksort Principe : La méthode du Quicksort due au C.A. Hoare (1962) utilise les principes généraux de division et équilibrage. 2.
Les mesures de tendance centrale
Nature de la statistique La statistique est la science qui étudie la collecte, la présentation, l’analyse et l’utilisation des données numériques en vue.
 Champ des mathématiques  Ensemble de méthodes et de techniques  Permet une analyse objective  Facilitées aujourd’hui par les tableurs.
Chapitre 4 Statistique descriptive 1. Echantillonnage statistique population On appelle population, un ensemble d’individus auquel on s’intéresse échantillon.
LE CHOIX DE LA FORMULE  Reprise du cours du 09 au 12 décembre (GR 1 à 5, même si redites) o Question : vitesse moyenne du cycliste A sur l’ensemble de.
TP1: Statistique application chapitre 2. Le tableau suivant reprend le taux d'intérêt (en %) payé par 20 banques sur les dépôts d'épargne de leurs clients.
Notions de statistiques et d’analyse de données Master 1 MGS – Sarah MISCHLER –
 Comparaison des résultats sur 20 dans 2 classes de 4 élèves  Moyennes identiques  Situation identique dans les 2 classes ?  Pourquoi ?   paramètres.
STATISTIQUE DESCRIPTIVE
Transcription de la présentation:

Licence 3ème année de sociologie Semestre 1 Analyse de données quantitatives Séance 2 Enseignant: F. Lebaron

Séance 2: Les variables numériques. Indices de tendance centrale. Idée générale: on veut résumer la distribution observée par une valeur « centrale » qui la représente bien. Exemple: les notes d’un élève au Bac. Première réponse: on prend la valeur observée la plus fréquente. Exemple: l’élève a eu deux fois 11, et une seule fois toutes ses autres notes. Cette valeur s’appelle le mode.

Séance 2: Les variables numériques. Indices de tendance centrale. Autre réponse: on calcule la moyenne pondérée du protocole des notes. Exemple: les « coefficients » des différentes matières sont les pondérations retenues. Autre réponse: on cherche une modalité qui « sépare » les notes en deux groupes d’effectifs égaux ou quasi-égaux. C’est la problématique de la médiane, cas particulier des quantiles (protocoles ordinaux).

Notations I support du protocole : ensemble d’individus. À l’élément i de I on associe sa valeur xi Le protocole est noté xI et l’effectif nI. Fréquence

Définitions Total Moyenne Par définition, un protocole centré est de moyenne nulle

Somme des carrés (SC) Somme des carrés bruts (SCB): Somme des carrés centrés Identité de Huyghens:

Les limites de la moyenne La moyenne n’est pas toujours un « bon » indice de tendance centrale. Soit un pays à la population stable où le revenu annuel moyen est de 30000 dollars. En 5 ans, les revenus des 1% les plus riches, qui disposent de 20% du total de tous les revenus, augmentent de +50%, alors que tous les autres revenus restent stables. Le total des revenus augmente de +10% sans variation de population: le revenu annuel moyen est désormais de 33000 dollars. Pourtant la situation de 99% de la population n’a pas changé ! D’où le recours à la médiane.

Structure d’échelle ordinale On appelle échelle ordinale un ensemble d’observables muni d’un ordre total noté < ; les modalités (échelons) sont notées u1, u2,…, ul, … uL, avec u1 < u2 … < ul… < uL. Deux échelons successifs d’une échelle ordinale déterminent une coupure : la coupure entre u1 et u2 est notée 1|2, … celle entre ul et u(l+1) est notée l|l+1, etc.

Effectifs des modalités La distribution d’un protocole ordinal (protocole à valeur dans une échelle ordinale) est définie par l’effectif de chaque échelon : n1 (effectif de u1), n2 (effectif de u2), … nl (effectif de ul), avec

Effectifs cumulés A la coupure l|l+1, on associe l’effectif cumulé à gauche: Et l’effectif cumulé à droite:

La médiane Un protocole ordinal peut admettre : Une coupure médiane si cette coupure a autant d’observations (n/2) à gauche qu’à droite ; plus généralement, un intervalle médian s’il existe un ensemble d’échelons compris entre deux coupures, tels que le nombre d’observations à gauche de la coupure de gauche et le nombre d’observations à droite de la coupure de droite sont tous deux égaux à n/2 ; Un échelon médian, s’il existe un échelon observé pour lequel on a autant d’observations à droite qu’à gauche ; Sinon, le protocole admet un échelon quasi-médian, défini comme l’échelon pour lequel l’effectif cumulé à gauche et l’effectif cumulé à droite de cet échelon sont tous deux (strictement) inférieurs à n/2 ; parmi les deux coupures encadrant l’échelon quasi-médian, la coupure quasi-médiane est la coupure de gauche si l’effectif cumulé à gauche de l’échelon quasi-médian est supérieur à l’effectif cumulé à droite ; dans le cas contraire, c’est la coupure de droite. Protocoles numériques regroupés en classes : on calcule la médiane interpolée.