WesConVa (Web, Suffixation, Concurrence de déVerbaux d’Action)

Slides:



Advertisements
Présentations similaires
Un environnement de développement éducatif
Advertisements

Chap. 4 Recherche en Table
M. SAILLOUR Lycée Notre Dame du Kreisker St Pol de Léon
Google Analytics Eléments à retenir.
Le 10/07/2001Présentation de l'étude statistique sur les entreprises électriques européennes Caractérisation et dynamique des principales entreprises électriques.
Présentation de lapplication Livret personnel de compétences.
Fiche de cours sur les coupes verticales
Classe : …………… Nom : …………………………………… Date : ………………..
Olivier Kraif, Agnès Tutin LIDILEM
Cours n°2M2. IST-IE (S. Sidhom) UE 303 Promo. M2 IST-IE 2005/06 Conception dun système d'information multimédia Architecture trois-tiers : PHP/MySQL &
1. Les caractéristiques de dispersion. 11. Utilité.
Epidémiologie des cancers digestifs en France
Dr DEVILLE Emmanuelle J D V 12/07/2006
Les outils du TAL Par RIGAUD Anaïs RALLIER Armelle SANTIAGO Gwendoline
Problématiques de genre en orientation Quelques indicateurs (J1)
PRESENTE PREVEN VERSION 2
Développer Son Flair Pour Les Analyses De Fumier et Compost
La formation continue au service de lindividu et de la société Professeur Yves Flückiger Département déconomie politique et Observatoire Universitaire.
2 - Les résultats de l'étude
Initiation aux bases de données et à la programmation événementielle
1 LENT, an X Quelques observations issues du dispositif national de mesure daudience des ENT Educatice 2013, Sylvie Le Loup.
Une plate-forme publicitaire exclusive pour les partenaires de la campagne!
1 5 octobre 2011 / paw Présentation du 7 octobre 2011.
L’observation réfléchie de la langue au cycle 3
Les requêtes La Requête est une méthode pour afficher les enregistrements qui répondent à des conditions spécifiques. La requête est donc un filtre.
Lecture de plans du bâtiment TD1
Méthodes pour Estimer et Améliorer les Paramètres
SECURITE DU SYSTEME D’INFORMATION (SSI)
1 Comment utiliser votre Extranet Se connecter 2.My Site 3.Documentation 3.1 Documents dintégration 3.2 Documents types 4.Vos informations privées.
Créer une animation simple Gif avec ImageReady.
Exemple d’utilisation d’un album
جامعــــــة محمد خيضــــــــــــر بــســكــــــــــــرة
La création de sinistre, la sélection à des fins de consultation, modification ou impression sont accessibles grâce à la barre de menu à gauche de l'écran.
1 Sécurité Informatique : Proxy Présenter par : Mounir GRARI.
Chapitre 2 : Qu’est ce qu’un atome ?
1 SITLOR Nouvelle fonctionnalité logicielle à venir ! Modification de la saisie et de lexploitation des Horaires 1 Nouveau !!
Département fédéral de lintérieur DFI Office fédéral de la statistique OFS La qualité de lemploi en Suisse Silvia Perrenoud Journées suisses de la statistique.
Guide d'utilisation de Microsoft Weft Il s'agit de convertir un ou des fichiers Police de caractères (font) généralement de type.ttf en un ou des fichiers.eot.
1 CLUB DES UTILISATEURS SAS DE QUÉBEC COMMENT TRANSFORMER UN PROGRAMME SAS EN TÂCHE PLANIFIÉE SOUS WINDOWS Présentation de Jacques Pagé STRiCT Technologies.
Tableaux de distributions
Tableaux de distributions
Introduction au langage PHP Réfs : Chap 3 p 49. Présentation PHP (Hypertext PreProcessor) est un langage de développement Web créé en 1994 par Rasmus.
1 Séminaire « Définition de Produits » : méthodologie de définition dune pièce GREC INITIALES Formation reconversion de professeurs STI / Juin 2011 – ACADEMIE.
Logiciel gratuit à télécharger à cette adresse :
Projet Génie Logiciel & UML, Bases de Données & Interfaces
Échéancier # E) Bilan réflexif /rapport individuel (cours # 15 individuel disponible sur le site section travaux (Attention : rédiger votre travail.
Des indicateurs de performance pertinents et adéquats
Ingrid Geretschläger and Jocelyne Jerdelet/CERN ETT-SIS-DM1 La litterature grise : importation et gestion au SIS u Dans le passé, échange entre.
Le registre européen d émissions polluantes EPER Mise en œuvre en Région wallonne par Ir Michel AMAND Premier attaché DGRNE 11 Déc 01 DGRNE 11 Déc 01.
Titre de la diapositive Unité mixte de recherche 7118 Accueil diaporama.
Forum des Industries de la Langue, 17 mars 2010
Introduction à lutilisation des corpus 2. Comment constituer un corpus?
COLLÈGE BOURGET         Titre du laboratoire souligné         Par: Nom 1 Nom 2 Nom 3 20_         Travail présenté à: Mme Bussières Sciences et technologies.
Distinguer la production du produit (Va différent de Ca) 3 approches approches par la valeur de la production finale (cas du bûcheron jusqu'à la vente.
F L T R Université catholique de Louvain-la-Neuve Faculté de philosophie et lettres FLTR Faculté de Philosophie et Lettres Présentation décembre 2002 Réalisation:
Université du Québec à Montréal Juin 2014 Accueil Baccalauréat en psychologie.
Conférence de presse du 21 août 2014 Perspectives démographiques à horizon 2040 Le Valais et ses régions Maurice Tornay Chef du Département des finances.
Création et présentation d’un tableau avec Word 2007
Initiation MS Access 2010 Requêtes - Sélection (travail en autonomie)
ELECTIONS DES REPRESENTANTS DES PARENTS D’ELEVES AU CONSEIL D’ECOLE
UN OUTIL UTILISE EN SOCIOLOGIE : L’ENQUÊTE
Master 1 – Sciences du Langage –
Département fédéral de l’intérieur DFI Office fédéral de la statistique OFS Rapport sur le développement durable 2012 – Le système d’indicateurs MONET.
Rappels de statistiques descriptives
Dominique LAURENT Patrick SEGUELA
Thibault ROY Université de Caen / Basse-Normandie Laboratoire GREYC – Equipe ISLanD Apport d’outils d’informatique documentaire à l’analyse de forums de.
Le Traitement Automatique des Langues (TAL)
Présentation nouveau site marchand
Scénario Les scénarios permettent de modifier la position, taille … des calques au cours du temps. Son fonctionnement est très proche de celui de Macromedia.
STRUCTURE D ’ UN ARTICLE ORIGINAL Pr Ganry.
Transcription de la présentation:

TOILE CONTRE DICTIONNAIRES : ANALYSE MORPHOLOGIQUE EN CORPUS DE NOMS DÉVERBAUX CONCURRENTS WesConVa (Web, Suffixation, Concurrence de déVerbaux d’Action) Projet soutenu par l’Institut de Linguistique Française Georgette DAL (SILEX - Université Lille 3) Fiammetta NAMER (ATILF CNRS-Université Nancy 2) Stéphanie LIGNON (ERSS - Université de Haute-Alsace) Ludovic TANGUY (ERSS - Université Toulouse-Le Mirail) Objectifs : Étude des phénomènes constructionnels concurrents susceptibles de former des déverbaux d’action (conversion, -age, -ment, -tion, -ure, etc.) avec une approche quantitative et contextuelle des données. Comparaison entre lexique attesté dans corpus de référence (nomenclatures du TLFi et du Robert Électronique) et sur le Web. Comprendre les raisons motivant une nouvelle création de déverbal. Déterminer les paramètres qui conditionnent le choix de la (des) forme(s) du (des) déverbal(aux), notamment en ce qui concerne la concurrence -age/-ment qui constitue la concurrence la plus fréquente et, de ce fait, la plus étudiée en testant diverses hypothèses : Existence d'une distinction sémantique entre –age et –ment ; Influence du domaine et du type d'emploi ; Impact de la structure argumentale de la base verbale et proto-rôle de ces mêmes arguments. Méthode : TLFi + Robert Électronique (Nomenclatures) 400 000 formes fléchies Extractage des verbes Liste des verbes 10 200 verbes ... encuistrer encuver encyclopédier Données Classes de Verbes : DériF Suffixement à base de règles : -ade, -age, -ance, -ence, -ment, -tion Le premier chiffre correspond au nombre de déverbaux attestés dans le corpus dictionnairique et dans le Web, le deuxième chiffre au nombre de déverbaux attestés dans le corpus dictionnairique encuvade encuvage encuvance encuvence encuvement encuvation Liste de déverbaux-candidats 64 000 candidats Répartition des différentes classes de verbes … encuirasser encuistrer encuver endauber endenter 00 10 21 11 encuvage endaubage endentement encuirassement encuvement WALIM/Webaffix/ Cherchage sur Web + filtrement Cherchage sur TLFi/RE Encuver : encuvage (dico) encuvement (nouveau) Données : Liste de déverbaux attestés 9 939 déverbaux dont 5 023 non-attestés dans TLF/RE Pages Web (contexte) 166 000 pages Web analysées Deux déverbaux attestés dans dico+Web Un seul déverbal dans dico « La vinification en rouge est très classique, avec un encuvage de raisins foulés. » http://www.vinsdubugey.net/vinifications.htm Liste des déverbaux récupérés sur le Web Liste des déverbaux récupérés dans le TLFi + RE encuvement 243 Documents référencés sur Google SUFFIXE : -ment 27 Pages analysées … http://6juin.omaha.free.fr/allem/al-def.htm : batteries d'artillerie dont les canons, seront en " encuvement " ou à l'abri dans des "casemates" en béton. Les http://monsite.wanadoo.fr/batteries_cotentin/page5.html : Voici le canon de 155 mm dans un encuvement à Gatteville en 1944 (USIS) ses canons furent sortis des casemates et mis en encuvement au moment des combats. http://perso.club-internet.fr/guijp/loire.htm : de l'Atlantique. On y trouve un 8,8 cm Flak 18 en encuvement , une casemate H611 en défense de plage, un très http://musee-batiment.pays-allier.com/glossaire%20detaille.htm : Pièce horizontale qui, dans une ferme à encuvement , relie la sablière à la jambe de force. portant le faux entrait dans le cas d'un comble à encuvement . 61 Occurrences au total --- VOISINS: Mot Fréquence 1 17 Pièce 12 2 10 Canon 9 Tobrouk 9 Batterie 8 Flak 7 Wn 7 Char 7 Assemblage 6 encuvage 198 Documents référencés sur Google SUFFIXE : -age 32 Pages analysées … http://perso.wanadoo.fr/domainedeleyre-loup/LaVinification.htm : grappes, complété par un tri systématique lors de l’ encuvage (le remplissage des cuves), afin de garantir la http://www.ampelidae.com/les_savoirs.htm : est nécessaire ils peuvent être refroidis avant encuvage . Une partie des raisins rouges sont coupés en http://www.charlesjoguet.com/fr/les-vins/accueil.php3 : La vendange est égrappée au dernier moment avant l' encuvage , pour limiter le plus possible l'oxydation des http://www.beaujolais.net/pages/vinsDuB/sav_faire/FR/vinification.asp : L'intégrité des grappes est maintenue grâce à un encuvage par gravité ou par tapis roulant. 47 Occurrences au total --- VOISINS: Mot Fréquence Macération 8 Raisins 7 Vinification 6 Grappes 5 Vendange 5 Chai 5 Fermentation 5 Deg 5 Afin 4 Lors 4 Froid 4 Fiches générées automatiquement : NOM encuvage encuvement Suffixe age ment Attesté TLF+RE OUI NON Autres déverbaux repérés Statut Lexical correct Statut Morphologique déverbal Verbe encuver Type d'emploi technique Domaines viticulture maçonnerie Pages Référencées 198 243 Pages Analysées 32 27 Occurrences Analysées 47 61 Champs remplis manuellement. Permettent vérifier la validité des occurrences trouvées : Statut lexical = correct, faute d'orthographe, autre catégorie, autre langue, archaïsme, etc. Statut morphologique = déverbal ou non Champs remplis manuellement. Permettent d'évaluer la sélection affixale en fonction de la répartition en domaines et en types d'utilisation des différents déverbaux

Répartition quantitative –age/-ment Résultats Répartition quantitative –age/-ment Statistiques établies sur des données massives mais brutes (Tableaux 1 et 2) : -ment et –age sont les deux suffixes qui entrent le plus souvent en concurrence puisqu'il s'agit du couple d'opposition affixale le plus représenté ; quantitativement, ils sont représentés de façon équivalente au sein des déverbaux (Tableau 1); Ils sont tout autant disponibles dans la formation de néologismes (Tableau 2). Il semble donc qu'il n'y ait pas de dominance nette de l'un ou l'autre de ces deux affixes dans la formation de déverbaux. A partir de données brutes (tableaux 1 et 2) Tableau 2 : Répartition des couples -age/-ment Tableau 1 : Nombre de déverbaux obtenus Pour près d'un tiers des néologismes, le domaine d'emploi ne recouvre pas le domaine d'emploi du dérivé attesté dans notre référentiel dictionnairique (Tableaux 3 et 4). Domaines d'emploi Sur un échantillon de données : 80 verbes examinés manuellement (tableaux 3 et 4) NOM amincissage amincissement Suffixe age ment Attesté TLF+RE Non Oui Statut Lexical correct Statut Morphologique déverbal Verbe amincir Type d'emploi technique général Domaine tannerie, textile médecine, santé, météorologie, zoologie, philatélie... Pages Référencées 10 17410 Pages Analysées 8 27 Occurrences Analysées 9 150 RELATIONS DOMAINES Disjoints Contextes Aminicissage des coutures centre d'aminicissement techniques d'aminicissage cure d'aminicissement système d'aminicissage des coutures amincissement de la couche d'ozone aminicissement de la lithosphère institut de beauté et d'amincissement produit d'amincissement Amincir : amincissage/amincissement Amincissage : "Gamme abrasifs pour le cuir : travail à sec ou travail, nettoyage chair, amincissage, veloutage, finitions, gamme complète en stock." http://www.azemar.fr/htfr/0002.htm Amincissement : "Dîtes adieu aux kilos qui vous obsèdent et gâchent votre quotidien. Cathy, spécialiste de l'amincissement vous proposera des programmes de soins sur mesure après un bilan personnalisé complet (alimentaire, corporel, mode de vie, impédance métrie). Cliquez pour agrandir." Rissoler : rissolement/rissolage Rissolement : "Faites les fondre lentement dans le beurre jusqu'à ce que, l'eau des champignons totalement évaporée, le rissolement s'amorce." http://www.sucrezsalez.com/r/m4/11/php Rissolage : "En fin de rissolage, augmenter le feu et ajouter les petits lardons et les laisser grésiller quelques instants. Ajouter les moules." http://www.cadour.net/cuisine/moules.htm Tableau 3 : Répartition des domaines d'emploi des nouveaux déverbaux en -age Tableau 4 : Répartition des domaines d'emploi des nouveaux déverbaux en -ment DOMAINES Pourcentage Domaines identiques 25,86 Restriction de domaines 24,14 Domaines disjoints 22,41 Domaines en recouvrement partiel 15,52 Extension de domaines 12,07 DOMAINES Pourcentage Domaines identiques 36,36 Restriction de domaines 27,27 Domaines disjoints 18,18 Domaines en recouvrement partiel 13,64 Extension de domaines 4,55 Jeux de langage Poésie : "[...] tout enfui enfoui recouvert scellé, oh toi, saleté, contre l'angoisse de la page blanche idéale panacée, fauve enragé radical épitomé, massacrage, capitulation désespérée, bousillage, épilogue goguenard (épinard!), anéantissage saboté..., bah... sabotage!" (http://home.inter.net/berlol/feu.htm) Rafales : "Thomas DANZEISEN: saxophones, objets divers, Christophe RYSER: contrebasse, objets divers. Duo né de l'envie de sortir de leurs contextes musicaux individuels et à la recherche du terrain propice à l'expérimentation. Trifouillage, grinçage, soufflage, pinçage, grattage,....et ceterage." (http://www.amr-geneve.ch/prog2000/aout/overground%20detail.htm) Blagues et calembours divers "On a passé la nuit sous tente, et le lendemain à 7h, autrement dit aux aurores, on s'est tiré du sac d'accouchage (HAHA) tant bien que mal ! Le week-end à pris fin après un bon petit  déjeuner. Un très chouette WE malheureusement "entaché" par le mauvais temps." (http://www.membres.lycos.fr/flambls/chron/3_00/chronique2eme2000.htm) Dans les "jeux de langage", le suffixe –age est presque exclusivement le seul suffixe utilisé pour former des déverbaux d'action ludiques (ce qui tendrait à corroborer l'hypothèse que le suffixe –age est le suffixe par défaut) NOM rissolage rissolement Suffixe age ment Attesté TLF+RE Non Oui Statut Lexical correct Statut Morphologique déverbal Verbe rissoler Type d'emploi technique Domaine culinaire Pages Référencées 256 33 Pages Analysées 32 4 Occurrences Analysées 45 RELATIONS DOMAINES Identité   Contextes Phase de rissolage rissolement du lard Début de rissolage rissolement des oignons rissolage des lardons rissolement dans la poêle poêlage et rissolage le rissolement s'amorce concentration par rissolage huile de rissolage

Proto-rôles Calcul des N en position de complément du nom Encuver Méthode : Recherche systématique des occurrences sur le web Analyse syntaxique automatique des contextes Calcul des N apparaissant en position" Xage de N"/"Xment de N" De façon à observer la distribution des N en position de complément du nom par rapport à la forme du dérivé. Exemples : Proto-rôles Un de nos objectifs de départ était de valider l'hypothèse de C. Kelling (2001) selon laquelle la répartition -age/-ment serait motivée par les proto-rôles des arguments des verbes servant de base aux dérivés : C. Kelling (2001) -ment premier argument de la base verbale = proto-agent -age premier argument de la base verbale = proto-patient Nos résultats % de déverbaux agentifs -ment -age Total TLFi+RE 41,25 42,50 83,75 WEB 18,18 31,03 27,50 TOTAL 46,25 65,00 55,62 Encuver Débroussailler Encuvement de N centre (3) béton (2) flak (2) transformateur (2) canon (2) pièce (1) tir (1) marine (1) station (1) Encuvage de N raisin (9) grappe (4) vendange (3) baie (2) cépage (2) moût (2) carignan (1) pinot (1) sauvignon (1) Débroussaillement de N bande (4) totalité (3) arrêté (2) maintien (2) propriété (2) reste (2) sol (2) fossé (1) portage (1) Débroussaillage de N coteau (3) sentier (3) taillis (3) marais (2) motte (2) piste (2) question (2) sommet (2) secteur (2) La répartition observée est beaucoup moins systématique que celle proposée par Kelling. On n'observe, pour l'instant, que des tendances. CONCLUSIONS PROVISOIRES Cette étude à large spectre est toujours en cours, mais elle donne accès à un très grand nombre de données sur les déverbaux en –age et –ment Les hypothèses classiques sur les distinctions ne sont pas vérifiées de façon significative sur les plans de : - la fréquence d'apparition : les déverbaux attestés dans les dictionnaires, ainsi que ceux nouvellement créés le sont dans les mêmes proportions ; - la thématique : plus de la moitié des déverbaux concurrents apparaissent dans les mêmes domaines ; - la complémentation du nom (et donc, pour une part, la signification) : plus d'un quart des couples de déverbaux présentent un recouvrement des compléments ; - le statut des proto-rôles : l'hypothèse de C. Kelling n'est pas vérifiée. Une étude basée sur les attestations du Web est bien entendu à prendre avec précaution, les données étant parfois peu fiables (locuteurs non natifs, erreurs typographiques, etc.). Toutefois, la variété et la spontanéité des productions permet une approche nouvelle, notamment sur les jeux de langage, pour lesquels une distinction se fait nettement avec l'emploi quasi-exclusif de –age pour atteindre des effets comiques. Encuvage/encuvement Ø Débroussaillage / débroussaillement de N terrain (18) zone (14) site (11) abord (10) chemin (10) habitation (8) forêt (5) parcelle (5) partie (5) Répartition des verbes en fonction des compléments de leurs déverbaux Un quart des couples de déverbaux ont des compléments en commun, ce qui semble indiquer que les deux déverbaux ont les mêmes emplois et le même sens. La méthode ayant permis d'effectuer ces calculs est très restrictive. Les tests effectués manuellement ont montré que les cas de synonymie sont plus nombreux que ceux obtenus automatiquement. Le taux de synonymie réel doit être supérieur à 25%. BIBLIOGRAPHIE Dowty D. R. (1991), “Thematic Proto-Roles and Argument Selection”, Language 67, pp. 547–619. Grimshaw J. (1990), Argument Structure, Cambridge, Mass., MIT Press. Kelling C.(2001), “Agentivity and Suffix Selection”, in Proceedings of the LFG ’01 Conference, Stanford, CA, CSLI, pp. 147–162. Kelling C. (2003), “The Role of Agentivity for Suffix Selection”, in G. Booij, J. De Cesaris, A. Ralli & S. Scalise eds, Acts of the Third Mediterranean Meeting on Morphology. Namer F.(2003), “Valider les unités morphologiques par le Web”, in B. Fradin, G. Dal, N. Hathout, F. Kerleroux, M. Plénat & M. Roché éds, Les unités morphologiques, Silexicales 3, Un. de Lille 3, pp. 142-150. Plag I. (1999), Morphological productivity. Structural constraints in English derivation, Berlin/New York, Mouton de Gruyter. Tanguy L. & Hathout N. (2002), “Webaffix : un outil d'acquisition morphologique dérivationnelle à partir du Web”, in Actes de la 9e conférence annuelle sur le Traitement Automatique des Langues Naturelles (TALN’02), Nancy, 24-27 juin 2002, pp. 245-254. Tasmowski-de Ryck L. (1977), « Tours ‑ment/‑age et génération morphologique », SCL XXVIII-4, pp. 405-416.