3.3. Indices et échelles
1. Par différence à une typologie, un indice consiste en l’addition des scores obtenus sur un nombre variable d’indicateurs. On a donc affaire à une variable ordinale ou métrique plutôt qu’à une variable nominale. Un score donné peut être atteint par des « chemins » très différents: fort score sur un indicateur ou score moyens sur plusieurs, etc. 2. Phases: a) Sélection des indicateurs b) Choix des états sur chaque indicateur c) Choix d'une méthode de sommation: équi-pondération ou non d) Choix de l’étalement des scores e) Remplacement des données manquantes 3. Ex: Participation des conjoints aux tâches domestiques: Repas, Rangements, Lessives, Courses, Administration, Agenda, Réparations; 4 états, par quarts; Pondération éventuelle par les heures ouvrées; regroupement éventuel par 1/5èmes; remplacement par moyenne dans le secteur 4. Ex. Répartition du pouvoir de décision: Achats importants, Vacances, Budget, Invitations et sorties, Agencement du domicile, Routines quotidiennes; 3 états: Ego, autrui, Egal; Equi-pondération ou constitution d’une pondération par pré-test; Remplacement par valeur modale
Par différences aux indices, les échelles ajoutent en principe à cette sommation l'idée de hiérarchisation des indicateurs compris dans la mesure. Si la scalabilité est vérifiée, on n’a donc en principe qu’un chemin pour parvenir à un score donné. Les échelles dites d’attitudes concernent des opinions croyances, normes, valeurs dont on estime qu’elles sont sous-tendue spar une dimension sous-jacente, allant d’un pôle de rejet à un pôle d’acceptation totale. La création de telles échelles obéit aux mêmes phases que les indices, avec deux étapes additionnelles: - l’examen des corrélations inter-indicateurs avec rejet des situations extrêmes: redondance et pluridimensionnalité; - si possible, validation par des comportements-critères On connaît différents genres d’échelles. La plus simple est celle du modèle de Bogardus: ici, la scalabilité est tenue pour « évidente ». P.ex. Xénophobie : « Accepteriez-vous un …..comme 1) gendre, 2) membre de votre club; 3) voisin; 4) collaborateur; 5) citoyen; 6) visiteur dans la région; 7) Exclusion totale. Attention aux intervalles arbitraires et à une sensibilité variable aux stimuli proposés
L’approche de Thurstone date des années 1927, en suite aux travaux de Weber et Fechner Elle consiste d’abord en la réunion d’un ensemble important de « propositions » supposées correspondre au continuum recherché Ces propositions sont soumises à des « juges » ( en fait des sujets érigés en experts) : une centaine selon Duverger, 20-40 selon Grawitz. Chaque proposition est classée par chaque juge dans des « cases » (de 7 à 11) correspondant à des sortes de notes de positivité ou de négativité (sévérité, hostilité,etc) croissante. Les propositions dont la dispersion est grande sont éliminées Chaque proposition retenue est affectée d’une note équivalant à la valeur médiane de ses classements par les juges. Les propositions, mélangées sont présentées aux « sujets » de l’enquête ou de l’expérience, qui ont pour consigne de les accepter ou de les refuser La position d’un sujet est donnée par la médiane des valeurs d’échelle des propositions que le sujet a retenues.
L’approche de Guttman se donne pour but de tester explicitement la « scalabilité ». Le principe est simple: il y a scalabilité si l’acceptation d’un item donné implique l’acceptation des précédents, et que le rejet d’un item donné implique celui des suivants. Analogie avec les niveaux scolaires. Les phases: sélection d’items « pertinents », avec réponse de préférence dichotomique; éliminer les items qui reçoivent plus de 80% d’acceptation ou de rejet par une population-test; ordonner les items retenus de gauche à droite par ordre croissant de réponses positives et en ordonnant les répondants de haut en bas par ordre de réponse positive aux items les plus élevés S’il y a stricte scalabilité, on obtient alors une sorte de parallélogramme; les « erreurs » apparaissent comme des « trous » dans une séquence » ou comme des points isolés. Mesurer la valeur de l’échelle, c’est mesurer la distance entre la forme parfaite et la forme obtenue. La reproductibilité est calculée comme suit : R = 1 – (Nombre d’erreurs / (Nombre d’items x Nombre de sujets)) On estime que la limite de fiabilité est de R = min.0,9 On peut évidemment améliorer la scalabilité en éliminant des items particulièrement « perturbateurs » ou en éliminant du calcul les sujets – s’ils sont rares – dont les réponses paraissent non fiables ou aberrantes. Notons que la reproductibilité varie avec chaque échantillon.
Les échelles de Likert sont en fait une sorte d’intermédiaire entre un indice et une échelle, car la scalabilité y est bien moins validée que dans les cas précédents. Il s’agit de rassembler nombre de propositions, qui sont en fait des opinions ( éviter les faits…!), sur le thème envisagé. Ces propositions sont soumises aux sujets, qui les acceptent ou les refusent en indiquant leur avis sur une échelle en 5 positions (p.ex. tàf. d’accord, assez…, ni/ni…,plutôt pas.., pas du tout d’accord) Notons que les items doivent être clairement favorables ou clairement défavorables à l’objet visé On retient els items qui différencient le mieux et qui montrent la meilleure corrélation entre le score global et le score sur l’item.
La technique des différenciateurs sémantiques d’Osgood part de l’idée que l’ « attitude » vis-à-vis de l’objet considéré comprend trois dimensions : - cognitive : propriétés attribuées à l’objet - évaluative: sympathie ou antipathie pour l’objet - active: intentions d’action par rapport à l’objet On apparie alors à un « objet » donné ( p.ex. Mariage, Démocratie, Divorce, Université…) un ensemble d’adjectifs à significations clairement opposées (p.ex. bon marché/luxueux; fort/faible; agréable/déagréable; bruyant/silencieux….) Ces adjectifs sont séparés par sept cases numérotées de 1 à 7