L’analyse qualitative de données assistée par ordinateur (CAQDAS). Méthodologies, applications, chausses-trapes. Clément VIKTOROVITCH Docteur en science politique Laboratoire Communication et Politique (IRISSO - CNRS)
I- Les méthodes informatisées d’analyse de données qualitatives II- Une tension méthodologique intrinsèque III- Le logiciel : une affaire de goût… et de méthodologie
I- Les méthodes informatisées d’analyse de données qualitatives Deux méthodes principales : La lexicométrie Le codage informatique de données D’autres options disponibles, davantage marginales ou expérimentales : l’analyse statistique par dictionnaires préconstitués (Tropes), le machine-learning…
I- Les méthodes informatisées d’analyse de données qualitatives 1- La lexicométrie Logiciel courant : Alceste Technique : Lemmatisation du corpus textuel Découpage en « unités de contexte élémentaires » (UCE) Classification descendante hiérarchique : dissociation des UCE en « classes » dont les vocabulaires sont les plus différents possibles. Le logiciel fait émerger des « univers de sens » au sein du corpus, identifiés par une série de mots caractéristiques
I- Les méthodes informatisées d’analyse de données qualitatives 1- La lexicométrie Avantages : Caractère exploratoire de l’analyse Automatisation : gain de temps, objectivation Grande communicabilité des résultats Inconvénients : Analyse fondée uniquement sur les unités lexicales : pas de prise en compte des polysémies, des connotations, des expressions Impossibilité d’utiliser une grille de lecture analytique Le logiciel reste une « boite noire » Risques : Confirmation des intuitions Création d’artefacts
I- Les méthodes informatisées d’analyse de données qualitatives 2- Le codage de données par CAQDAS Logiciels courants : Atlas.ti / NVivo CAQDAS : « Computer Assisted Qualitative Data Analysis Software » Les fonctions : Codage des données Recherche de contenu Mise en liaison des données Requêtes et tris entre codes Mise en réseau des codes Outils d’annotation et d’écriture
I- Les méthodes informatisées d’analyse de données qualitatives 2- Le codage de données par CAQDAS Avantages : Liberté totale du chercheur : choix des grilles, des indicateurs… Grande flexibilité méthodologique Aucune automatisation : contrôle total sur le procédé Inconvénients : Aucune automatisation : travail chronophage Communicabilité minimale Risques : Confusion méthodologique Se perdre dans le codage
II- Une tension méthodologique intrinsèque Au sein des CAQDAS, deux orientations méthodologiques en tension : Une analyse inductive, héritière de la grounded theory Une analyse déductive de contenu
II- Une tension méthodologique intrinsèque 1- La méthode inductive, héritière de la grounded theory Deux ouvrages fondamentaux : Barney Glaser, Anselm Strauss, La découverte de la théorie ancrée, 1967 Anselm Strauss, Juliet Corbin, Les fondements de la recherche qualitative, 1990 Les principes : Rompre avec l’approche déductive, analysant la réalité sociale au prisme de théories élaborées dans l’abstraction. Partir de l’analyse de données empiriques, pour dégager une théorisation fondée empiriquement. Replacer le « plaisir » et la « création » au centre de la recherche.
II- Une tension méthodologique intrinsèque 1- La méthode inductive, héritière de la grounded theory Les CAQDAS, des outils forgés pour l’analyse inductive : Ces logiciels sont faits pour permettre au chercheur d’avoir une relation im-médiate à ses données : Fonctionnement simplifié Objectif de structuration des données Codes flexibles pouvant être renommés / découpés / regroupés Larges possibilités d’annotation Larges possibilités de rédaction Le travail de catégorisation / mise en relation / théorisation est fluidifié et simplifié, en permettant au chercheur de ne jamais perdre contact avec ses données.
II- Une tension méthodologique intrinsèque 2- L’analyse déductive de contenu Laurence Bardin, L’analyse de contenu, 1977 Les principes : Sélection a priori d’une grille de lecture (analyse thématique, analyse de récit…) Traduction de la grille en une série de codes Structuration du corpus selon une série de variables Codage systématique de l’ensemble du corpus Analyse statistique (répartition et cooccurrence des codes notamment) Analyse quantitative d’un matériau qualitatif selon une démarche hypothético-déductive, visant généralement à tester des hypothèses de départ.
II- Une tension méthodologique intrinsèque 3- Des méthodologies incompatibles ? Ces deux méthodologies sont centrées sur une même opération (le codage) et un même outil (les CAQDAS). Pourtant, il existe entre elles trois tensions fondamentales : Place du codage dans la méthodologie : Déduction : le codage est une étape avant l’analyse des données Induction : le codage est le moment de l’analyse des données Nature des codes : Déduction : unidimensionnels et homogènes (pour être statistiquement significatifs) Induction : par définition, ils restent longtemps pluridimensionnels et hétérogènes Déroulement pratique du codage : Déduction : codage méthodique et intégral ; nombre de codes limité Induction : microanalyse de moments pertinents ; codes nombreux puis resserrés
II- Une tension méthodologique intrinsèque 3- Des méthodologies incompatibles ? Ces deux méthodes sont ainsi structurellement incompatibles. Néanmoins, en pratique, frontière ténue entre ces deux démarches. Lors d’une analyse déductive, tentation d’ajouter des codes à mesure que l’on identifie de nouveaux éléments dans les données. Menace la cohérence de la grille initiale, particulièrement si elle a été dérivée d’un modèle théorique. Lors d’une analyse inductive, tentation de quantifier les catégories émergeantes. Conduit à une inflation de l’opération de codage. Dans les deux cas : Obligation de recoder l’intégralité du corpus.
II- Une tension méthodologique intrinsèque 3- Des méthodologies incompatibles ? Les méthodologies mixtes sont donc à la fois instinctivement séduisantes et méthodologiquement problématiques. Une possibilité de combinaison entre démarches inductive et déductive existe néanmoins : l’analyse séquentielle. Premier codage inductif pour identifier les catégories pertinentes Second codage déductif pour évaluer leur distribution au sein du corpus C’est la méthode de l’analyse de contenu, au sens large du terme.
II- Une tension méthodologique intrinsèque 4- Dans tous les cas : structurer l’information Quelle que soit la méthodologie utilisée, in fine, les CAQDAS permettent de structurer, indexer, référencer et commenter des corpus très étendus. Il s’agit peut-être, au fond, de leur utilité principale. En ce sens, presque toute recherche qualitative peut tirer les plus grands bénéfices d’un traitement par CAQDAS.
III- Le logiciel : une affaire de goût… et de méthodologie Deux logiciels principaux : NVivo Atlas.ti
III- Le logiciel : une affaire de goût… et de méthodologie 1- Atlas.ti Logiciel développé avec l’aide d’Anselm Strauss et Juliet Corbin. Atlas.ti a été originellement conçu dans la perspective de la grounded theory (même si, aujourd’hui, les développeurs s’en défendent). Avantages : Fonctionnement simple, intuitif et facile d’accès Affichage du codage clair et exhaustif, adapté au travail inductif Très grandes possibilités d’annotation Peu gourmand en ressources Inconvénients : Peu de possibilités de structuration de l’information Faiblesse des outils de quantification intégrés L’interface est laide…
III- Le logiciel : une affaire de goût… et de méthodologie 2- NVivo Avantages : L’interface est belle… Inconvénients :
III- Le logiciel : une affaire de goût… et de méthodologie 2- NVivo Avantages : L’interface est belle… Très grande structuration de l’information De nombreuses données quantitatives intégrées Inconvénients : Visualisation du codage très limitée Plus difficile à prendre en main Très gourmand en ressources Un outil moins adapté à une analyse purement inductive, mais parfait pour l’analyse de contenu.
L’analyse qualitative de données assistée par ordinateur (CAQDAS). Méthodologies, applications, chausses-trapes. Clément VIKTOROVITCH Docteur en science politique Laboratoire Communication et Politique (IRISSO - CNRS)