Céline Poudat CORAL – Orléans

Slides:



Advertisements
Présentations similaires
Mais vous comprenez qu’il s’agit d’une « tromperie ».
Advertisements

Le Nom L’adjectif Le verbe Objectif: Orthogram
ORTHOGRAM PM 3 ou 4 Ecrire: « a » ou « à » Référentiel page 6
LES NOMBRES PREMIERS ET COMPOSÉS
Ma surprise du Zoo.
[number 1-100].
Qualité du Premier Billot. 2 3 Défauts reliés à labattage.
Licence pro MPCQ : Cours
Additions soustractions
Distance inter-locuteur
1 Plus loin dans lutilisation de Windows Vista ©Yves Roger Cornil - 2 août
ACTIVITES NUMERIQUES Ranger les nombres Trouver le nombre manquant
Les nombres.
Les numéros 70 –
Les numéros
ACTIVITES Les fractions (10).
Sud Ouest Est Nord Individuel 36 joueurs
Les identités remarquables
Sirop de Liège « industriel »
LES TRIANGLES 1. Définitions 2. Constructions 3. Propriétés.
Ecriture simplifiée d'une somme de relatifs
Nom du module Date Lieu de la formation. 2 Genèse du projet Historique, partenaires, publics Pour qui ? Pourquoi ? Qui ? Comment ? Quand ?
La législation formation, les aides des pouvoirs publics
1 7 Langues niveaux débutant à avancé. 2 Allemand.
ORTH 1 CE2 Je sais écrire sans erreur les pluriels des noms se terminant par s, x, z.
Mr: Lamloum Med LES NOMBRES PREMIERS ET COMPOSÉS Mr: Lamloum Med.
La méthodologie………………………………………………………….. p3 Les résultats
Interagir avec un objet mixte Propriétés physiques et numériques Céline Coutrix, Laurence Nigay Équipe Ingénierie de lInteraction Homme-Machine (IIHM)
Jack Jedwab Association détudes canadiennes Le 27 septembre 2008 Sondage post-Olympique.
Le soccer & les turbans Sondage mené par lAssociation détudes canadiennes 14 juin 2013.
Présentation générale
Cours de physique générale I Ph 11
1 Guide de lenseignant-concepteur Vincent Riff 27 mai 2003.
GRAM 1 CE2 Je sais transformer une phrase affirmative en phrase négative.
Le drapeau canadien comme symbole de fierté nationale : une question de valeurs partagées Jack Jedwab Association détudes canadiennes 28 novembre 2012.
PM18 MONTAGE DU BLINDAGE AUTOUR DE LA QRL F. DELSAUX - 25 JAN 2005
Le Concours de Conaissance Francais I novembre 2012.
Titre : Implémentation des éléments finis sous Matlab
Les nombres.
1 Journée de regroupement des correspondants "Egalité et genre" - 21 novembre 2011 Rectorat de Rouen - SAIO - CD-HD Résultats scolaires, appréciations.
Projet poker 1/56. Introduction Présentation de léquipe Cadre du projet Enjeux Choix du sujet 2.
LES NOMBRES PREMIERS ET COMPOSÉS
VOC 1 CE2 Je sais utiliser des mots de la vie quotidienne.
CLL11 : chlorambucil (CLB) versus CLB + rituximab (R)
Les chiffres & les nombres
1 INETOP
RACINES CARREES Définition Développer avec la distributivité Produit 1
Représentation des systèmes dynamiques dans l’espace d’état
DUMP GAUCHE INTERFERENCES AVEC BOITIERS IFS D.G. – Le – 1/56.
Année universitaire Réalisé par: Dr. Aymen Ayari Cours Réseaux étendus LATRI 3 1.
Titre : Implémentation des éléments finis en Matlab
Jean-Marc Léger Président Léger Marketing Léger Marketing Les élections présidentielles américaines.
MAGIE Réalisé par Mons. RITTER J-P Le 24 octobre 2004.
1 INETOP
Les Nombres 0 – 100 en français.
Aire d’une figure par encadrement
P.A. MARQUES S.A.S Z.I. de la Moussière F DROUE Tél.: + 33 (0) Fax + 33 (0)
Les fondements constitutionnels
MAGIE Réalisé par Mons. RITTER J-P Le 24 octobre 2004.
Traitement de différentes préoccupations Le 28 octobre et 4 novembre 2010.
1/65 微距摄影 美丽的微距摄影 Encore une belle leçon de Macrophotographies venant du Soleil Levant Louis.
Certains droits réservés pour plus d’infos, cliquer sur l’icône.
Nom:____________ Prénom: ___________
Direction de santé publique de la Montérégie PORTFOLIO THÉMATIQUE EXPÉRIENCE DE SOINS DES ANGLOPHONES DE LA MONTÉRÉGIE Direction de santé publique Surveillance.
Exercice de vérification 1 p
Annexe Résultats provinciaux comparés à la moyenne canadienne
Commission paritaire de suivi des opérations de reclassement repositionnement dans le cadre du droit d’option Statistiques novembre 2010.
Les Chiffres Prêts?
La formation des maîtres et la manifestation de la compétence professionnelle à intégrer les technologies de l'information et des communications (TIC)
Transcription de la présentation:

Céline Poudat CORAL – Orléans celine.poudat@univ-orleans.fr Genres et sous-domaines scientifiques dans un corpus d’articles de linguistique Céline Poudat CORAL – Orléans celine.poudat@univ-orleans.fr

Objectif Exploration en corpus des revues de linguistique française et de leurs genres et objets spécifiques

Corpus d’articles de revues linguistiques (ASL) Représentation par année de publication Représentation par revue et numéro

ASL: années de publication

ASL: répartition des revues

Méthodologie d’analyse générale... 1. Première exploration par Analyse en Composantes Principales (ACP) Classification Ascendante Hiérarchique (CAH) 2. Exploration des spécificités et caractérisation différentielle Analyse des spécificités (des correspondances) 3. Exploration conceptuelle ACP sur co-occurrents (S. Loiseau) avec corpus Reader

et jeux de descripteurs utilisés Descripteurs lexicaux Mots non vides 140 descripteurs morphosyntaxiques Parties du discours traditionnelles Descripteurs spécifiques au discours scientifique linguistique IL impersonnel vs. anaphorique, ON, modaux, connecteurs (opposition, causalité, conséquence, etc.), marqueurs de structuration textuelle, éléments étrangers (non français), etc. Marqueurs de formalisation linguistique (SN, SV, ? et *, morphèmes, etc.)

Les trois genres de la revue de linguistique française L’article de recherche La présentation Le compte rendu

Corpus

Exploration et caractérisation différentielle des trois genres Corpus d’articles Textes entiers Textes sans exemples Textes sans exemples ni citations Première exploration Analyse en Composantes Principales (ACP) + Classification Ascendante Hiérarchique (CAH) Caractérisation Analyse des spécificités Lexicales Morphosyntaxiques

CAH en 12 classes: répartition des trois genres

Caractérisation lexicale des 3 genres: en positif Articles Comptes rendus Présentations Chiffres 1 et 2 > 12 ouvrage, chapitre > 23.5 numéro > 19 Pronoms ON, JE et NOUS > 11 auteur > 16.5 articles > 15 Symbole x > 11.5 et linguistique p > 13.5 réflexion > 9

Caractérisation lexicale des 3 genres: en négatif Articles Comptes rendus Présentations Chapitre, ouvrage < -19 nous < -11 Chiffres 1, 2 et 3 < -9 auteur < -18 Pronoms ON et JE Symbole x < -8 Articles, numéro < -16 Chiffres 1 et 2 est peut

Synthèse Articles vs. présentations Articles vs. comptes rendus P: ‘articles’ et ‘numéro’ A: symboles et chiffres Articles vs. comptes rendus A: pronoms NOUS, ON et JE + chiffres CR: ‘chapitre’, ‘ouvrage’ et ‘auteur’

Spécificités morphosyntaxiques Articles vs. CR et présentations A: longueur, structuration, modaux présent, deux points, connecteurs de conséquence... CR et P: noms propres, connecteurs d’addition, numéraux ordinaux... Articles vs. présentations A: symboles, négations Articles vs. comptes rendus CR: déterminants définis

Sous-domaines et thématique scientifique linguistique Corpus: 224 articles

Comment caractériser la thématique et les sous-domaines du corpus? Exploration par ACP Descripteurs morphosyntaxiques Descripteurs épistémiques Analyse des exemples et des citations Analyse des spécificités des revues et des numéros thématiques Analyse des concepts linguistiques Exemple de LINGUISTIQUE

Première exploration du corpus d’articles ACP 140 descripteurs morphosyntaxiques Examen des deux premiers axes factoriels

La parole intérieure Genres et intertexte La langue des signes Histoire, Epistémologie, Langage

Spécificités lexicales du corpus

Typologie des exemples Répartition par revue et numéro Exemples et citations Typologie des exemples Répartition par revue et numéro

Répartition des exemples dans l’ensemble du corpus

Répartition des exemples par numéro de revue PRAX RSP LF VERBUM SCOLIA LANG CIEL LINX SYNT SEMIO HEL

Répartition des citations par numéro de revue LF SCOLIA PRAX CIEL VERBUM HEL SEMIO SYNT LINX RSP LANG

Rapport exemples/citations par numéro HEL LF PRAX

Spécificités des numéros et des revues

Intérêt Évaluation de l’homogénéité des articles d’un même numéro/d’une même revue Détermination des concepts et objets caractéristiques des numéros/des revues

Numéros lexicalement homogènes 17 numéros thématiques sur 30 Spécificités positives Objets: intertexte, dénomination, prépositions, dialogue, participe, parole intérieure, langues des signes, hypothétique, contexte(s), impossible, futur, référence discursive, référence pronominale plurielle, relations de discours, sémantique des verbes, syntaxe au-delà de la phrase, sémantique verbale

Gain en précision Futur 37.9 Visée 17.37 Présent 16.88 Autour du futur Verbum Linguistique de la dénomination Cahiers de Praxématique Dénomination 44.3 Dénominations 23.9 Famille 18.44 Nom 14.7 Verbe -7.6 Verbes -6.5 Préposition -6,49 Texte -6.54

Référence discursive et accessibilité cognitive Gain en précision q et p 26.7 si 23,24 condition 18.62 énonciateur (17,8) L’hypothétique LINX Référence discursive et accessibilité cognitive Verbum CR 26.6 segment 25.6 référent 24 centrage 22.2 énoncé 18.1 langue -9.9 verbe -8.4 verbes -7,8 sens -7.5

Numéros moins homogènes Causes: Hétérogénéité du numéro Spécificités d’un ou deux textes Surface 28.5 Côté 7.9 Nombre 7.5 Commun 7.4 Quatre 6.5 Horizons de la grammaire Alexandrine HEL contexte -4.6 français -4.07 interprétation -3,6 langues -3.4 MAIS

Analyse des concepts linguistiques Deux exemples d’analyse avec CR (S. Loiseau) Exemple de LINGUISTIQUE

Fréquence de linguistique par revue PRAX Scolia Sémiotiques LF lexique HEL dialogue RSP NT

ACP Individus: 50 premiers co-occurrents de LINGUISTIQUE Variables: fréquences dans les segments des textes délimités par la variable ‘indice de structuration’

50 premiers co-occurrents de ‘linguistique’ num | lemme | rate | freq | subfreq 1 | système | 1.00000000000000000 | 727 | 296 2 | sponsoring | 1.00000000000000000 | 37 | 37 3 | sens | 1.00000000000000000 | 2368 | 822 4 | mots | 1.00000000000000000 | 1296 | 495 5 | mot | 1.00000000000000000 | 958 | 391 6 | linguistiques | 1.00000000000000000 | 660 | 353 7 | linguistique | 1.00000000000000000 | 1331 | 1206 8 | langue | 1.00000000000000000 | 2037 | 835 9 | langage | 1.00000000000000000 | 1184 | 563 10 | idiome | 1.00000000000000000 | 74 | 59 11 | grammaire | 1.00000000000000000 | 308 | 161 12 | discours | 1.00000000000000000 | 1830 | 672 13 | des | 1.00000000000000000 | 21203| 6343 14 | Saussure | 1.00000000000000000 | 97 | 76 15 | Jakobson | 1.00000000000000000 | 44 | 40 16 | ' | 1.00000000000000000 | 2688 | 905 17 | terminologie | 0.99999999999999989 | 185 | 102 18 | conception | 0.99999999999999989 | 309 | 150 19 | Vygotskij | 0.99999999999999989 | 72 | 53 20 | contexte | 0.99999999999999967 | 1568 | 559 21 | texte | 0.99999999999999956 | 1313 | 479 22 | traducteur | 0.99999999999999944 | 120 | 74 23 | Jakubinskij | 0.99999999999999667 | 48 | 39 24 | représentations | 0.99999999999999256 | 312 | 146 25 | extra- | 0.99999999999998512 | 65 | 47 26 | recherches | 0.99999999999998324 | 188 | 99 27 | analyse | 0.99999999999994549 | 1302 | 465 28 | relations | 0.99999999999993983 | 960 | 358 29 | la | 0.99999999999950795 | 35232 | 9889 30 | études | 0.99999999999941214 | 259 | 122 31 | sélection- | 0.99999999999923739 | 21 | 21 32 | linguistes | 0.99999999999917411 | 179 | 92 33 | habere | 0.99999999999905631 | 24 | 23 34 | sémiotique | 0.99999999999893030 | 81 | 52 35 | traduction | 0.99999999999873723 | 242 | 115 36 | théorie | 0.99999999999761136 | 625 | 244 37 | unité | 0.99999999999664757 | 547 | 218 38 | les | 0.99999999999640732 | 19686 | 5618 39 | [ | 0.99999999999580502 | 1287 | 450 40 | ] | 0.99999999999374434 | 1287 | 449 41 | scientifique | 0.99999999999013101 | 128 | 70 42 | dialogue | 0.99999999998670397 | 338 | 146 43 | traitement | 0.99999999998612410 | 344 | 148 44 | communauté | 0.99999999998441302 | 109 | 62 45 | phonèmes | 0.99999999997350364 | 72 | 46 46 | WordNet | 0.99999999996460620 | 77 | 48 47 | concepts | 0.99999999994672506 | 223 | 104 48 | intérieur | 0.99999999988978017 | 519 | 203 49 | unités | 0.99999999988648036 | 669 | 251 50 | sciences | 0.99999999986778498 | 91 | 53

Histoire, Epistémologie, Langage Genres et intertexte La parole intérieure Contexte(s)

Conclusion et perspectives (1/2) Intérêt des méthodes statistiques pour cartographier le champ linguistique français Détermination des propriétés formelles et différentielles des genres de la revue Détermination de potentiels mots-clés Expérimentations complémentaires (analyse plus précise des thèmes des numéros de revue et des concepts les plus discriminants)

Conclusion et perspectives (1/2) Analyse plus précise des exemples selon la cartographie obtenue Analyse contrastive interlangue Comparaison avec un corpus de 200 articles de revues linguistiques anglo-saxonnes

Céline Poudat CORAL – Orléans celine.poudat@univ-orleans.fr Genres et sous-domaines scientifiques dans un corpus d’articles de linguistique Céline Poudat CORAL – Orléans celine.poudat@univ-orleans.fr