Les traitements à plat Cette partie du cours abordera les traitements élémentaires d’une enquête. Les analyses uni-variées, ou tris à plat, sont en fait le dépouillement des réponses à une seule question.
Préambule sur les traitements Les traitements statistiques sont assez différents selon que l'on s'intéresse à : une question fermée (ou nominale) 49. Quelle est votre situation en matière de logement? Chez mes parents J'habite seul(e) J'habite en couple J'habite avec d'autres étudiants une question numérique 12. Mon objectif de salaire à l'âge de 40 ans (en net mensuel)
Tris à plat des questions fermées Il s'agit de ne dépouiller qu'une seule question (ou variable) en même temps. On parle aussi d'analyse uni-variée. La présentation du tableau peut varier. On peut présenter les effectifs, avec ou sans les non-réponses, les fréquences (%) sont calculées alors sur les observations ou sur les citations.
Options de présentation On peut ordonner les réponses… ou présenter les intervalles de confiance des %. Ceux-ci tiennent compte du taux d'erreur qui dépend notamment de la taille de l'échantillon. (cf. chapitre sur l'échantillonnage)
Tris à plat sur une strate Le dépouillement peut se faire sur l'échantillon total ou sur une sous-population qui nous intéresse particulièrement (strate), définie sur un ou plusieurs critères.
Tris à plat des questions numériques Le traitement à plat d'une question numérique peut être présenté de différentes manières : On peut se contenter des principaux paramètres de position et de dispersion (moyenne et écart-type en général) et de leur représentation graphique. On préfère en général une mise en classes et celle-ci peut obéir à plusieurs logiques.
Mise en classes personnalisée Les classes peuvent être personnalisées, on en détermine librement les bornes :
Le cas particulier des questions échelles Les questions "échelle" ont la particularité de pouvoir être traitées comme des questions fermées ou numériques. En effet, à chaque échelon correspond un nombre, de 1 à n. On les traite ensuite, soit comme des questions fermées avec un tableau de fréquence, soit comme une question numérique, avec la moyenne des échelons.
Tableaux de groupes Des questions successives dont les modalités de réponse sont identiques peuvent être présentées sous la forme d'un tableau synthétique. Un groupe de 3 variables échelles, illustré par un graphique. Le même groupe de variables échelles traité en numérique, avec moyenne, écart-type et somme.
Tris à plat des questions-textes Pour dépouiller une question texte, il est possible de faire apparaître le lexique, la liste des mots les plus cités. On a exclu ici les mots outils (mots grammaticaux sans contenu). La liste a été limitée aux 18 mots les plus cités. Le cas échéant, on peut présenter la liste des réponses, si leur diversité n'est pas trop grande. Ici, les réponses sont très diversifiées.
Passons maintenant aux exercices… Les exercices qui suivent concernent la partie du cours sur les tris à plat. Ils sont simples et portent sur des notions de base. Les questions se rapportent au questionnaire sur les valeurs des étudiants. Dans un exercice, le lien réponses vous amène à la correction. Quand vous êtes dans un corrigé d'exercice, le symbole vous permet de revenir à l'énoncé de l'exercice.
Exercice 1 Dans le questionnaire sur les valeurs, veuillez indiquer si les questions suivantes sont fermées (nominales) ou numériques : - question 12 ? - question 17 ? - question 21 ? - question 40 ? - question 43 ? - question 50 ? réponses
Exercice 2 A partir des résultats à plat, indiquez le pourcentage de non-réponses à la question sur le salaire escompté à 40 ans (question n°12). Accès aux résultats de l'étude réponses
Exercice 3 Les résultats des questions 25 à 33 sont-ils complètement cohérents ? Pour quelles raisons ? Accès aux résultats de l'étude réponses
Exercice 4 Sur la strate des filles, quel est le pourcentage des passionnées d’informatique ? Même question pour la strate des garçons. Accès aux résultats de l'étude réponses
Exercice 5 Dans la question « réussir sa vie » (n°24), quel est le thème qui arrive en tête ? Accès aux résultats de l'étude réponses
Voici les corrigés des exercices Corrigé de l’exercice 1 Corrigé de l’exercice 2 Corrigé de l’exercice 3 Corrigé de l’exercice 4 Corrigé de l’exercice 5
donc fermée ou numérique Corrigé de l’exercice 1 Question Type 12 : objectif de salaire numérique 17 : 3 sports pratiqués fermée 21 : activités nocturnes 40 : importance de l’honnêteté échelle donc fermée ou numérique 43 : âge en question ouverte 50 : type de logement
Corrigé de l’exercice 2 Il y a 171 réponses sur 186 répondants, soit 15 non-réponses. Ces non-réponses représentent donc un pourcentage de 8%.
Corrigé de l’exercice 3 Les résultats ne sont pas complètement cohérents car le classement des valeurs dans la question fermée est un peu différent du classement construit à partir des moyennes des huit questions échelles. Par exemple, dans la question fermée, l’amitié n’arrive qu’en 6ème position alors qu’elle se classe 3ème dans le groupe de questions échelles.
Corrigé de l’exercice 4 Les passionnés d’informatique représentent : 32% chez les filles 52% chez les garçons On additionne les réponses aux modalités « plutôt oui » et « tout à fait » sur la question 20.
Corrigé de l’exercice 5 Le thème le plus cité est le travail (55 citations). Les mots les plus cités sont « réussir » et « vie » mais ils ne sont pas pris en compte dans l’analyse car ils ne font que reprendre l’énoncé de la question.