La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Genres et sous-domaines scientifiques dans un corpus d’articles de linguistique Céline Poudat CORAL – Orléans

Présentations similaires


Présentation au sujet: "Genres et sous-domaines scientifiques dans un corpus d’articles de linguistique Céline Poudat CORAL – Orléans"— Transcription de la présentation:

1 Genres et sous-domaines scientifiques dans un corpus d’articles de linguistique Céline Poudat CORAL – Orléans

2 Objectif Exploration en corpus des revues de linguistique française et de leurs genres et objets spécifiques

3 Corpus d’articles de revues linguistiques (ASL)  Représentation par année de publication  Représentation par revue et numéro

4 ASL: années de publication

5 ASL: répartition des revues

6 Méthodologie d’analyse générale...  1. Première exploration par  Analyse en Composantes Principales (ACP)  Classification Ascendante Hiérarchique (CAH)  2. Exploration des spécificités et caractérisation différentielle  Analyse des spécificités (des correspondances)  3. Exploration conceptuelle  ACP sur co-occurrents (S. Loiseau) avec corpus Reader

7 et jeux de descripteurs utilisés  Descripteurs lexicaux  Mots non vides  140 descripteurs morphosyntaxiques  Parties du discours traditionnelles  Descripteurs spécifiques au discours scientifique linguistique  IL impersonnel vs. anaphorique, ON, modaux, connecteurs (opposition, causalité, conséquence, etc.), marqueurs de structuration textuelle, éléments étrangers (non français), etc.  Marqueurs de formalisation linguistique (SN, SV, ? et *, morphèmes, etc.)

8 Les trois genres de la revue de linguistique française  L’article de recherche  La présentation  Le compte rendu

9 Corpus

10 Exploration et caractérisation différentielle des trois genres  Corpus d’articles  Textes entiers  Textes sans exemples  Textes sans exemples ni citations  Première exploration  Analyse en Composantes Principales (ACP) + Classification Ascendante Hiérarchique (CAH)  Caractérisation  Analyse des spécificités  Lexicales  Morphosyntaxiques

11 CAH en 12 classes: répartition des trois genres

12

13 Caractérisation lexicale des 3 genres: en positif ArticlesComptes rendus Présentations Chiffres 1 et 2 > 12ouvrage, chapitre > 23.5numéro> 19 Pronoms ON, JE et NOUS > 11auteur> 16.5articles> 15 Symbole x > 11.5et> 15linguistique> 11 p> 13.5réflexion> 9

14 Caractérisation lexicale des 3 genres: en négatif ArticlesComptes rendus Présentations Chapitre, ouvrage < -19nous< -11Chiffres 1, 2 et 3 < -9 auteur< -18Pronoms ON et JE < -9Symbole x< -8 Articles, numéro < -16Chiffres 1 et 2 < -8est< -8 peut< -8

15 Synthèse  Articles vs. présentations  P: ‘articles’ et ‘numéro’  A: symboles et chiffres  Articles vs. comptes rendus  A: pronoms NOUS, ON et JE + chiffres  CR: ‘chapitre’, ‘ouvrage’ et ‘auteur’

16 Spécificités morphosyntaxiques  Articles vs. CR et présentations  A: longueur, structuration, modaux présent, deux points, connecteurs de conséquence...  CR et P: noms propres, connecteurs d’addition, numéraux ordinaux...  Articles vs. présentations  A: symboles, négations  Articles vs. comptes rendus  CR: déterminants définis

17 Sous-domaines et thématique scientifique linguistique Corpus: 224 articles

18 Comment caractériser la thématique et les sous-domaines du corpus?  Exploration par ACP  Descripteurs morphosyntaxiques  Descripteurs épistémiques  Analyse des exemples et des citations  Analyse des spécificités des revues et des numéros thématiques  Analyse des concepts linguistiques  Exemple de LINGUISTIQUE

19 Première exploration du corpus d’articles ACP 140 descripteurs morphosyntaxiques Examen des deux premiers axes factoriels

20

21 La parole intérieure Genres et intertexte Histoire, Epistémologie, Langage La langue des signes

22 Spécificités lexicales du corpus

23

24

25 Exemples et citations  Typologie des exemples  Répartition par revue et numéro

26 Répartition des exemples dans l’ensemble du corpus

27 Répartition des exemples par numéro de revue PRAXRSPLF SCOLIA VERBUM HEL CIEL LANG LINX SEMIO SYNT

28 Répartition des citations par numéro de revue PRAX RSP LFSCOLIA VERBUM HEL CIEL LANG LINX SEMIOSYNT

29 Rapport exemples/citations par numéro HEL LF PRAX

30 Spécificités des numéros et des revues

31 Intérêt  Évaluation de l’homogénéité des articles d’un même numéro/d’une même revue  Détermination des concepts et objets caractéristiques des numéros/des revues

32 Numéros lexicalement homogènes  17 numéros thématiques sur 30  Spécificités positives  Objets:  intertexte, dénomination, prépositions, dialogue, participe, parole intérieure, langues des signes, hypothétique, contexte(s), impossible, futur, référence discursive, référence pronominale plurielle, relations de discours, sémantique des verbes, syntaxe au-delà de la phrase, sémantique verbale

33 Gain en précision Autour du futur Verbum Futur 37.9 Visée Présent Linguistique de la dénomination Cahiers de Praxématique Dénomination 44.3 Dénominations 23.9 Famille Nom 14.7 Verbe -7.6 Verbes -6.5 Préposition -6,49 Texte -6.54

34 Gain en précision L’hypothétique LINX q et p 26.7 si 23,24 condition énonciateur (17,8) Référence discursive et accessibilité cognitive Verbum CR 26.6 segment 25.6 référent 24 centrage 22.2 énoncé 18.1 langue -9.9 verbe -8.4 verbes -7,8 sens -7.5

35 Numéros moins homogènes  Causes:  Hétérogénéité du numéro  Spécificités d’un ou deux textes Horizons de la grammaire Alexandrine HEL Surface 28.5 Côté 7.9 Nombre 7.5 Commun 7.4 Quatre 6.5 contexte -4.6 français interprétation -3,6 langues -3.4 MAIS

36 Analyse des concepts linguistiques Deux exemples d’analyse avec CR (S. Loiseau) Exemple de LINGUISTIQUE

37 Fréquence de linguistique par revue PRAX HEL dialogue LF lexique ScoliaSémiotiques RSP NT

38 ACP  Individus: 50 premiers co-occurrents de LINGUISTIQUE  Variables: fréquences dans les segments des textes délimités par la variable ‘indice de structuration’

39 50 premiers co-occurrents de ‘linguistique’ num | lemme | rate | freq | subfreq 1 | système | | 727 | | sponsoring | | 37 | 37 3 | sens | | 2368 | | mots | | 1296 | | mot | | 958 | | linguistiques | | 660 | | linguistique | | 1331 | | langue | | 2037 | | langage | | 1184 | | idiome | | 74 | | grammaire | | 308 | | discours | | 1830 | | des | | 21203| | Saussure | | 97 | | Jakobson | | 44 | | ' | | 2688 | | terminologie | | 185 | | conception | | 309 | | Vygotskij | | 72 | | contexte | | 1568 | | texte | | 1313 | | traducteur | | 120 | | Jakubinskij | | 48 | | représentations | | 312 | | extra- | | 65 | | recherches | | 188 | | analyse | | 1302 | | relations | | 960 | | la | | | | études | | 259 | | sélection- | | 21 | | linguistes | | 179 | | habere | | 24 | | sémiotique | | 81 | | traduction | | 242 | | théorie | | 625 | | unité | | 547 | | les | | | | [ | | 1287 | | ] | | 1287 | | scientifique | | 128 | | dialogue | | 338 | | traitement | | 344 | | communauté | | 109 | | phonèmes | | 72 | | WordNet | | 77 | | concepts | | 223 | | intérieur | | 519 | | unités | | 669 | | sciences | | 91 | 53

40

41 Histoire, Epistémologie, Langage La parole intérieure Genres et intertexte Contexte(s)

42 Conclusion et perspectives (1/2)  Intérêt des méthodes statistiques pour cartographier le champ linguistique français  Détermination des propriétés formelles et différentielles des genres de la revue  Détermination de potentiels mots-clés  Expérimentations complémentaires (analyse plus précise des thèmes des numéros de revue et des concepts les plus discriminants)

43 Conclusion et perspectives (1/2)  Analyse plus précise des exemples selon la cartographie obtenue  Analyse contrastive interlangue  Comparaison avec un corpus de 200 articles de revues linguistiques anglo- saxonnes

44 Genres et sous-domaines scientifiques dans un corpus d’articles de linguistique Céline Poudat CORAL – Orléans


Télécharger ppt "Genres et sous-domaines scientifiques dans un corpus d’articles de linguistique Céline Poudat CORAL – Orléans"

Présentations similaires


Annonces Google