Notions de statistiques et d’analyse de données Master 1 MGS – Sarah MISCHLER –
a) Le mode Définition : Modalité observée la plus fréquente Nombre d’enfantsEffectifs = le mode = modalité la plus fréquente
a) Le mode Le mode n’est pas forcément unique Nombre d’enfantsEffectifs = le mode = modalité la plus fréquente = le mode = modalité la plus fréquente
b) La médiane Définition : Les n observations sont rangées de manière croissante, la médiane est la valeur qui permet de partager la suite ordonnées en 2 parties d’égale importance (50/50)
b) La médiane 1 er cas : n est impair n=2k Médiane = observation centrale Médiane = 2 k=5 observations
b) La médiane 2 ème cas : n est pair n=2k Médiane = observation encadrante Médiane = (1+2)/2 = 1,5 k=5 observations
c) La moyenne arithmétique Exercice : Calculer la puissance moyenne Puissance CVEffectifs
c) La moyenne arithmétique Corrigé : Puissance CVEffectifs niProduit ni*xi Total Moyenne = 1366/200 = 6,83 CV
c) La moyenne arithmétique Formule de la moyenne : Pour un échantillon de n observations notées x1, x2, x3,...,xn, la moyenne arithmétique est égale à : (n1*x1+…+nn*xn)/N M= 1/N ∑ ni Xi
Les tris à plats c) La moyenne arithmétique Dans le cas d’une variable continue Moyenne = 7000/40 = 175 cm
Les tris à plats 2. Les paramètres de dispersion L’étendue, la variance et l’écart-type
Notions préliminaires
a) L’étendue Définition : On appelle étendue ou intervalle de variation d’une série la différence entre la plus grande et la plus petite des valeurs de la variable figurant dans cette série.
b) La variance et l’écart type Calcul de la variance
b) La variance et l’écart type
Tris à plat sur une variable nominale Tris à plat sur une variable nominale On calcule la fréquence d'apparition de chacune des modalités (ou réponse) au sein d'une population
Tris à plat sur une variable nominale Les questions à réponses multiples Tris à plat sur une variable nominale Les questions à réponses multiples
1. Fréquences et profil
Pour chaque type de pratique quelle est la proportion d’hommes et de femmes ? Tableau des profils lignes
1. Fréquences et profil Quel est le type de pratique en fonction du sexe ? Tableau profil colonne :
Les tris croisés 2. Le Khi2
2. Le khi2 Test statistique : khi2 d’ajustement. Utilisé pour comparer une répartition à une NORME Combien de réponses d’étudiants de chaque niveau devrait on avoir si la répartition était équilibrée ? L1L2L3 Somme Observé Théorique
2. Le khi2 H0 : Il y a ajustement entre la répartition observée et la répartition théorique Seuil fixé : p=.05 Formule du Khi²: Soit ici khi2 = (( ,3) 2 /223,3) + (( ,3) 2 /223,3) + (( ,3) 2 /223,3) Le résultat se présente de la façon suivante: DDL = 2 ; Khi² = 53.9; p=.05
Si khi2 calc < khi2 lu donc H0 conservée Si khi2 calc > khi2 lu donc H0 rejetée
2. Le khi2 On utilise la table du Khi2 A 2 DDL Khi² lu dans la table vaut (au seuil p=.05) 5.99 Khi² calculé = 53,9 > Khi² lu = 5,99 Ho rejetée : Il n’y a pas ajustement DONC il y a une différence significative (au seuil p=.05) entre répartition observée et répartition théorique
2. Le khi2 La question qui se pose est de savoir s’il y a un lien entre le niveau d’étude et la réponse à la question. ObservésTESTSTTTotal H. Ford F. Taylor A. Smith Total
2. Le khi2