Claire Gélinas-Chebat

Slides:

Advertisements

Présentations similaires

Mais vous comprenez qu’il s’agit d’une « tromperie ».

Advertisements

Le Nom L’adjectif Le verbe Objectif: Orthogram

ORTHOGRAM PM 3 ou 4 Ecrire: « a » ou « à » Référentiel page 6

Licence pro MPCQ : Cours

Additions soustractions

Distance inter-locuteur

1 Plus loin dans lutilisation de Windows Vista ©Yves Roger Cornil - 2 août

1. ami 2. compagnon 3. amant 4. frère 5. père 6. maître 7. éducateur 8

Réseau ATB du CClin Paris-Nord – résultats 2011 LL, 22/11/ Réseau antibiotiques du CClin Paris-Nord : Résultats 2011 Coordination: Dr François LHÉRITEAU.

Les numéros 70 –

Les identités remarquables

Le, la, les words Possessive Adjectives MINE!!. 2 My in french is mon, ma,mes... Le word/ begins with a vowel: Mon La word: Ma Les word: Mes.

1. Les caractéristiques de dispersion. 11. Utilité.

LES TRIANGLES 1. Définitions 2. Constructions 3. Propriétés.

Sondage sur les préjugés Ensemble et l’association d'études canadiennes 20 mars, 2013 Une recherche novatrice sur le lieu, la fréquence et les différents.

La législation formation, les aides des pouvoirs publics

1 7 Langues niveaux débutant à avancé. 2 Allemand.

COTE DIVOIRE IMAGES DES ATROCITES COMMISES PAR ALASSANE DRAMANE OUATARA, SORO GUILAUMES ET LEURS HOMMES 1.

SERABEC Simulation sauvetage aérien avec un Hercule C130. Départ de St-Honoré le 4 octobre Durée de vol 3 heures. Premier vol en Hercule pour les.

1 5 octobre 2011 / paw Présentation du 7 octobre 2011.

La méthodologie………………………………………………………….. p3 Les résultats

Le Concours de Conaissance III Francais I fevrier 2013.

Jack Jedwab Association détudes canadiennes Le 27 septembre 2008 Sondage post-Olympique.

Le soccer & les turbans Sondage mené par lAssociation détudes canadiennes 14 juin 2013.

1 Choisir une catégorie. Vous recevrez la réponse, vous devez donner la question. Cliquez pour commencer.

Présentation générale

1 Guide de lenseignant-concepteur Vincent Riff 27 mai 2003.

GRAM 1 CE2 Je sais transformer une phrase affirmative en phrase négative.

Le drapeau canadien comme symbole de fierté nationale : une question de valeurs partagées Jack Jedwab Association détudes canadiennes 28 novembre 2012.

Session 7 1 IST/VIH/SIDA.

Le Concours de Conaissance Francais I novembre 2012.

Si le Diaporama ne s'ouvre pas en plein écran Faites F5 sur votre clavier.

Titre : Implémentation des éléments finis sous Matlab

Les quartiers Villeray – La Petite-Patrie et les voisinages

1 Journée de regroupement des correspondants "Egalité et genre" - 21 novembre 2011 Rectorat de Rouen - SAIO - CD-HD Résultats scolaires, appréciations.

Projet poker 1/56. Introduction Présentation de léquipe Cadre du projet Enjeux Choix du sujet 2.

LES NOMBRES PREMIERS ET COMPOSÉS

VOC 1 CE2 Je sais utiliser des mots de la vie quotidienne.

Comment rendre une femme heureuse…

Logiciel gratuit à télécharger à cette adresse :

Les chiffres & les nombres

Claire Gélinas-Chebat

RACINES CARREES Définition Développer avec la distributivité Produit 1

DUMP GAUCHE INTERFERENCES AVEC BOITIERS IFS D.G. – Le – 1/56.

La statistique descriptive

Année universitaire Réalisé par: Dr. Aymen Ayari Cours Réseaux étendus LATRI 3 1.

Jean-Marc Léger Président Léger Marketing Léger Marketing Les élections présidentielles américaines.

MAGIE Réalisé par Mons. RITTER J-P Le 24 octobre 2004.

Aire d’une figure par encadrement

Écart moyen et écart type

Comment rendre une femme heureuse…

P.A. MARQUES S.A.S Z.I. de la Moussière F DROUE Tél.: + 33 (0) Fax + 33 (0)

Les fondements constitutionnels

MAGIE Réalisé par Mons. RITTER J-P Le 24 octobre 2004.

Traitement de différentes préoccupations Le 28 octobre et 4 novembre 2010.

1/65 微距摄影美丽的微距摄影 Encore une belle leçon de Macrophotographies venant du Soleil Levant Louis.

Comenius 1 Projet européen Analyse de film euroculturelle Humanisme dans le nouveau cinéma européen.

Nom:____________ Prénom: ___________

Est-ce que les Canadiens sont des animaux politiques : Élections 2008, Intérêt et Engagement dans la politique canadienne Jack Jedwab Directeur général.

Christelle Pouaraoupoepoe

Annexe Résultats provinciaux comparés à la moyenne canadienne

EGALITE PROFESSIONNELLE ENTRE LES FEMMES ET LES HOMMES

Commission paritaire de suivi des opérations de reclassement repositionnement dans le cadre du droit d’option Statistiques novembre 2010.

Rappels de statistiques descriptives

La formation des maîtres et la manifestation de la compétence professionnelle à intégrer les technologies de l'information et des communications (TIC)

Analyse exploratoire d’entrevues de groupe : les jeunes français et le tabac Claire Gélinas-Chebat François Daoust Monique Dufresne Karine Gallopel Marie-

Transcription de la présentation:

Claire Gélinas-Chebat Analyse exploratoire d’entrevues de groupe : quand ALCESTE, DTM, LEXICO et SATO se donnent la main François Daoust Gaëlle Dobrowolski Monique Dufresne Claire Gélinas-Chebat JADT 2006 – Besançon

Claire Gélinas-Chebat Analyse exploratoire d’entrevues de groupe : les jeunes français et le tabac Claire Gélinas-Chebat François Daoust Monique Dufresne Karine Gallopel Marie- Élaine Lebel JADT 2004 – Louvain-la-Neuve

OBJECTIFS

1 : Montrer comment on peut combiner plusieurs logiciels de lexicométrie (ALCESTE, DTM et LEXICO3) pour valider et compléter une analyse SATO.

2 : Mettre à l'épreuve des chaînes de traitement qui font appel à des passerelles de conversion développées dans le contexte du réseau ATONET.

CORPUS

Corpus Gallopel Entrevues enregistrées de neuf groupes de jeunes rencontrés à Rennes en 2000 (48 jeunes Français)‏

Chacun des 9 groupes comprend 5 à 6 jeunes et un intervenant : âgés entre 15 à 25 ans fumeurs et non fumeurs hommes et femmes

Entrevues semi dirigées 1 Discussion précédée d’une période de familiarisation avec le tabagisme 2 Discussion suite à l’introduction d’une brochure

ANALYSE AVEC SATO Nature

Analyse sémantico statistique basée sur une construction itérative d’une grille catégorielle

ANALYSE AVEC SATO Démarche

Démarche (1)‏ Comparaison de lexiques associés à des sous-textes établis selon : sexe fumeur / non-fumeur avant / après message anti-tabac

Démarche (2)‏ Indices statistiques simples : Distance du Chi2 Mesure d'écart à la moyenne (score Z)‏

Démarche (3)‏ L’Algorithme de distance lexicale (basée sur la distance du Chi2) - évalue l’écart dans l’utilisation d’un vocabulaire donné entre deux lexiques - peut être appliqué aux formes lexicales ou aux valeurs de propriétés catégorielles Approche dichotomique de comparaison de sous-textes via les lexiques respectifs

Démarche (4)‏ L’Algorithme de participation calcule les moyennes normalisées d’un ensemble de formes lexicales qui peuvent être définies par les propriétés catégorielles

ANALYSE AVEC SATO Étapes

Étapes (1)‏ Va et vient entre les données lexicales brutes et leurs contextes d’utilisation (Kwic)‏ - Approche univariée : saisir la spécificité de la stratification induite par chacune des variables sociologiques - Approche multivariée : tenir compte de l’interaction de ces variables

Étapes (2)‏ Émergence d'une grille catégorielle sémantique : apparence, arrêt, négation, concret, danger, dépendance, soc-je*, maladie, mort, plaisir, … soc-ami, soc-famille, soc-gens, soc-jeune, liberté, envie, conscience, volonté, … *(Le préfixe soc- renvoie à un ensemble de catégories référant aux rapports sociaux identifiés par les jeunes.)‏

ANALYSE AVEC SATO Résultats

Analyse de distance sur les formes lexicales brutes avant\après l’introduction de la brochure (Résultats 1)‏ Les mots qui caractérisent le plus le discours AVANT l’introduction de la brochure sont suivis d’un astérisque. AVANT: Clair, aussi, plaisir, dépendance, 3e, doigt, primaire, ils, santé APRÈS: témoignage, “, risques, j’, concret, cinq. etc. Si on s’attarde aux mots “pleins” (noms, adj., verbes), Avant: On constate que les mots qui émergent du discours avant l’introduction des brochures semblent être en lien avec l’apparence physique, la santé, le plaisir, On parle de plaisir et des effets sur la santé, et de l’apparence physique. Après : , on semble d’avantage parler de risque et de mort. Les analyses subséquentes (des lexiques catégorisés) devraient nous permettre de découvrir si les hommes et les femmes, les fumeurs et non fumeurs réagissent de manière homogène. Quel est l’impact de l’introduction des brochures plus ou moins menaçantes et proposant des suggestions plus ou moins fortes pour inciter à arrêter de fumer. Nous y reviendrons. Nous voulons ici attirer votre attention sur des éléments particuliers de notre analyse, d’intérêt dans l’analyse textuelle. 1. Vérification en contexte : L’élément lexical“clair” après vérification du mot en contexte (KWIC), nous a permis de l’associer non pas à l’apparence (teint clair par exemple), mais à une marque évaluative, “C’est clair, c’est évident”. Attention aux fausses pistes. 2. Rejet malheureux de certaines catégories de mots : Normalement, les pronoms qui ne sont pas des mots pleins, sont exclus des analyses lexicales. Le «ils » et le «j’». Or, ces mots peuvent marquer l’implication du locuteur ou justement sa non-implication dans le discours. Dans un modèle cognitif de profondeur du traitement de l’information, cette intériorisation du message est très importante. Nous avons procédé à d’autres analyses pour mieux comprendre ce phénomène. Ce qui nous amène à notre 2e tableau.

Analyse de distance sur les formes de la catégorie sujet avant\après l’introduction de la brochure Nous avons créé une catégorie lexicale dite “sujet” par un procédé itératif d’analyse de distances de nos données. Ce procédé permet de construire des univers potentiellement structurant du discours. Nous avons déterminé 28 catégories “sujets”. Dans ces catégories lexicales, nous avons intégrés les variantes flexionnelles d’une même unité, mais aussi, les mots renvoyant à un même univers pragmatique. Il s’agit d’un processus d’observation des objets descriptifs puis de construction interactive par le chercheur. Par rapport à nos données, Nous avons remarqué que les jeunes évoquaient les conséquences du tabagisme, sur eux ou sur des relations plus ou moins intimes, des parents, des amis, des connaissances, etc. L’émergence d’un certain nombre de lexèmes nous renvoyait à ces éléments d’un espace social, des rapports sociaux que nous avons pû prendre en considération. Des catégories soc- du plus près au plus loin ont été créées : soc-je, soc-ami, soc-famille, soc-jeune, soc-gens. Son-ami, soc-famille est très présent dans le discours des jeunes avant l’introduction de la brochure. Après on voit apparaître soc-gens. Pour vérifier l’hypothèse du lexème «j’» comme marque d’implication. Nous avons construit une catégorie «soc-je», en combinant, les «j’» et les «je». On constate que soc-je est tout à fait marginal et alors que le «j’» dans l’analyse précédente est significativement mieux classé. Notre hypothèse sur l’implication ne se confirme pas. La catégorie “apparence” est l’élément qui caractérise le plus le discours des jeunes avant l’introduction de la brochure : ici ce terme comprend les mots dents, doigts, teint, odeur…ce qui nous considérons des effets superficiels du tabagisme. Les termes de plaisir, dépendance, santé, éducation apparaissent également AVANT l’introduction de la brochure. Après avoir vu la brochure, les jeunes parlent d’éléments que nous avons catégorisés sous le terme “concret”, c-à-dire: des éléments liés à l’ impact et aux solutions proposées pour arrêter de fumer.. Nous voyons apparaître APRÈS l’introduction de la brochure, les termes liés aux catégories “volonté, mort et maladie”.

Analyse de distance avant\après pour les fumeurs et les non-fumeurs (tableau III) Ce tableau permet de catégoriser le discours des jeunes, fumeurs et non fumeurs, avant et après l’introduction des brochures. L’analyse de nos résultats semblent mettre en évidence que les non fumeurs sont plus sensibles aux brochures et que les concepts de “maladie” et de “mort” sont plus présents dans le discours des non fumeurs que dans celui des fumeurs. Nous avons également procédé à d’autres analyses pour comparer le discours des jeunes fumeurs/ non fumeurs, hommes/ femmes, avant / après. Nous présentons ici deux tableaux.

Analyseur PARTICIPATION (sujet = apparence)‏ L’algorithme de “participation permet de caractériser le concept que nous avons construit et intitulé ”apparence”. A et B pour avant et après l’introduction de la brochure, le concept d’apparence est très présent avant. Fu/ nf pour fumeur, non fumeur ce concept est plus évoqué chez les fumeurs que les non fumeurs et beaucoup plus avant l’introduction de la brochure. Ho et fe pour homme et femme. les femmes sont beaucoup plus soucieuses de leur apparence que les hommes et en parlent plus avant qu’on introduise les brochures.

Analyseur PARTICIPATION (sujet = mort)‏ L’analyse du concept “mort” fait ressortir que les brochures ont un impact dans le discours des jeunes, que les non fumeurs en parlent plus et que plus de femmes que d’hommes évoquent ce concept. Nous avons constaté par d’autres analyses, que la présence de menaces fortes provoque un débat sur la liberté et ce débat est particulièrement présent chez les fumeurs.

ANALYSES AVEC SATO Conclusions

Conclusions (1)‏ Construction d'une grille catégorielle transparente et respectueuse de la spécificité du contexte d'énonciation.

Conclusions (2)‏ Démarche itérative combinant : une approche inductive (qualitative) une utilisation d'outils simples de statistique lexicale une approche plus sensible à la pragmatique textuelle.

Conclusions (3)‏ Production de données qualifiées (catégories) qui traduisent la démarche interprétative de l’analyste

VALIDATION

Validation de notre démarche et de nos résultats par divers logiciels de statistique textuelle : ALCESTE (Reinert)‏ LEXICO 3 (Salem)‏ DTM (Lebart)

Chaîne de traitement (1)‏ Format initial des données : balises SATO (propriétés)‏ identification du locuteur et des caractéristiques sociologiques identification des sections pré ou post «brochure».

Chaîne de traitement (2)‏ *page=gallo02/11 *pub=brochure *locuteur=s36 *fumeur=non *sexe=h Bah, la brochure là, elle nous présente ce qui nous attend si on fume. Mais c ’est très… quoi, moi j ’ai lu ça, mais je ne sais pas je ne suis pas fumeur, donc je ne ressens peut-être pas ça de la même façon..

Chaîne de traitement (3)‏ Exportation par SATO en XML-TEI de diverses éditions du corpus Conversion de la version TEI vers les formats propriétaires ALCESTE, LEXICO et DTM

ANALYSE AVEC ALCESTE

ALCESTE (1)‏ méthode complètement automatique qui vise à faire émerger des mondes lexicaux s'appuie sur des régularités statistiques pour faire émerger la structure du discours à partir des énoncés (Avec SATO, nous étions partis d'hypothèses structurantes du discours pour faire parler les données)‏

ALCESTE (2)‏ Résultats corpus Initial* : deux classes Classe 1 (1/3 des UCE) : surtout les interventions exprimées après l'exposition au message antitabac (Chi2=33.82). plus faiblement une présence significative des UCE des non-fumeurs *(transcription des entrevues dans leur découpage original en interventions; sont exclues les interventions des intervenants)‏

ALCESTE (3)‏ Classe 2 (2/3 des UCE) : surtout des interventions précédant la présentation du message antitabac (Chi2=33.82)‏ aussi, mais plus faiblement, une présence significative des UCE des fumeurs (Chi2=8.81)

ALCESTE (4)‏

ALCESTE (5)‏ CONCLUSIONS : ALCESTE confirme que la variable avant/après le message antitabac représente le premier élément de structuration du corpus, ce qui constitue pour nous le résultat le plus significatif. ALCESTE relève la présence de l’opposition fumeur/non-fumeur, deuxième variable prise en compte dans l'analyse SATO.

ALCESTE (6)‏ ALCESTE a donc retrouvé ce que nous avions observé lors de la comparaison de lexiques construits sur la base d’un découpage global du corpus. Ce point de rencontre entre les approches ascendantes et descendantes est un outil important de validation de l’interprétation.

ANALYSE AVEC LEXICO O

LEXICO (1)‏ LEXICO : calcule les spécificités lexicométriques de parties d'un corpus d'après un modèle probabiliste basé sur la loi hypergéométrique (cf. Lebart, Salem 1994) rend possibles des analyses factorielles de correspondances (AFC) sur un corpus partitionné

LEXICO (2)‏ Première approche : Analyse du corpus Participant* : découpage du corpus selon le profil des répondants * ensemble des interventions de chaque participant identifié par un nom résumant son profil et suffixé par a ou b pour identifier le discours du participant avant et après le message antitabac; Élimination des participants dont le profil sociologique est incomplet

Corpus Participant : individus sur le plan des 2 premiers axes de l'AFC

LEXICO (4)‏ Deuxième approche : calcul des spécificités reportées sur la sortie de l'analyseur DISTANCE de SATO appliqué au lexique avant et après la brochure.

LEXICO (5)‏

LEXICO (6)‏ Conclusion : Très large recouvrement entre les formes lexicales qui contribuent le plus à la distance et les spécificités calculées par LEXICO : parmi les mots manquants, il y a les ponctuations qui, apparemment, ne sont pas prises en compte par LEXICO, de même que les formes absentes dans le corpus Avant la mesure de spécificité de LEXICO fournit un bon complément à la DISTANCE du Chi2 par l'ajout d'un seuil statistique

ANALYSE AVEC DTM

DTM (1)‏ DTM : Outil dédié à l’analyse exploratoire de données numériques multivariées et de données textuelles (par exemple un sondage avec questions ouvertes et fermées)‏ Comptage des mots du texte brut produisant des variables représentant le nombre d’occurrences du mot

DTM (2)‏ Expérimentation # 1 : Analyse du corpus Participant : le corpus est vu comme un ensemble de 87 individus. Le profil sociologique est enregistré comme autant de réponses catégorielles à des questions fermées : pub (nil, brochure), sexe (homme, femme) et fumeur (non, oui). Les interventions avant et après le message antitabac donnent lieu à deux questionnaires distincts. L'ensemble des interventions d'un individu pour chaque questionnaire constitue la réponse à une question ouverte unique.

Corpus Participant : variables catégorielles sur le plan des 2 premiers axes de l'AFC

DTM (4)‏ Confirmation de l'influence du message antitabac et des variables catégorielles sur la structure du discours

DTM (5)‏ Expérimentation # 2 : Production d'un corpus artificiel (Participant catégorisé) par substitution des catégories aux unités lexicales catégorisées

DTM (6)‏ Calcul de l'AFC en croisant : les 87 participants avec 702 variables textuelles, soit les formes lexicales non catégorisées et catégorisées sémantiquement (propriété thème). Cette substitution recouvre 12,26 % des occurrences.

Corpus Participant catégorisé: variables catégorielles sur le plan des 2 premiers axes de l'AFC

DTM (8)‏ La projection des variables sociologiques sur le plan factoriel suit le même jeu d'oppositions

DTM (9)‏ Expérimentation # 3 : Production d'un autre corpus artificiel (Participant réduit) par substitution des catégories à toutes les unités lexicales

DTM (10)‏ Calcul de l'AFC en croisant : les 87 participants avec 29 variables textuelles, soit l’ensemble des occurrences du corpus Initial Les 28 catégories utiles représentent un peu plus de 12% des occurrences.

Corpus Participant réduit : variables catégorielles et lexique sur le plan des 2 premiers axes de l'AFC

DTM (12)‏ Visualisation simultanée du lexique des catégories et les modalités des questions fermées: répartition aux quatre points cardinaux des catégories les plus excentriques : apparence, dépendance, coûts, éducation, mort et soc-ami concentration des catégories banales (qui constituent les référents communs du discours) au centre du plan

DTM (13)‏ Outil de validation de la construction de la grille de catégories lexicales La visualisation des catégories sémantiques dans le plan factoriel ouvre aussi de nouvelles fenêtres d'investigation pour revenir aux contextes et affiner la grille si nécessaire

CONCLUSIONS

Cette première utilisation combinée de logiciels d'analyse textuelle a été grandement facilitée par les protocoles d'échange de données réalisées par le réseau ATONET.

Il est possible de créer de multiples chaînes de traitement qui permettent de reconfigurer les données et de faire appel aux points forts de chaque logiciel.

Par la combinaison des méthodes d'analyse : plus grande fiabilité des conclusions en fournissant des moyens de corroborer ou d'infirmer des hypothèses et des conclusions aller au-delà des impressions et des commentaires descriptifs pour produire des représentations de discours sociaux susceptibles d'agir comme modèles

Merci de votre attention.