La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

WesConVa (Web, Suffixation, Concurrence de déVerbaux d’Action)

Présentations similaires


Présentation au sujet: "WesConVa (Web, Suffixation, Concurrence de déVerbaux d’Action)"— Transcription de la présentation:

1 TOILE CONTRE DICTIONNAIRES : ANALYSE MORPHOLOGIQUE EN CORPUS DE NOMS DÉVERBAUX CONCURRENTS
WesConVa (Web, Suffixation, Concurrence de déVerbaux d’Action) Projet soutenu par l’Institut de Linguistique Française Georgette DAL (SILEX - Université Lille 3) Fiammetta NAMER (ATILF CNRS-Université Nancy 2) Stéphanie LIGNON (ERSS - Université de Haute-Alsace) Ludovic TANGUY (ERSS - Université Toulouse-Le Mirail) Objectifs : Étude des phénomènes constructionnels concurrents susceptibles de former des déverbaux d’action (conversion, -age, -ment, -tion, -ure, etc.) avec une approche quantitative et contextuelle des données. Comparaison entre lexique attesté dans corpus de référence (nomenclatures du TLFi et du Robert Électronique) et sur le Web. Comprendre les raisons motivant une nouvelle création de déverbal. Déterminer les paramètres qui conditionnent le choix de la (des) forme(s) du (des) déverbal(aux), notamment en ce qui concerne la concurrence -age/-ment qui constitue la concurrence la plus fréquente et, de ce fait, la plus étudiée en testant diverses hypothèses : Existence d'une distinction sémantique entre –age et –ment ; Influence du domaine et du type d'emploi ; Impact de la structure argumentale de la base verbale et proto-rôle de ces mêmes arguments. Méthode : TLFi + Robert Électronique (Nomenclatures) formes fléchies Extractage des verbes Liste des verbes verbes ... encuistrer encuver encyclopédier Données Classes de Verbes : DériF Suffixement à base de règles : -ade, -age, -ance, -ence, -ment, -tion Le premier chiffre correspond au nombre de déverbaux attestés dans le corpus dictionnairique et dans le Web, le deuxième chiffre au nombre de déverbaux attestés dans le corpus dictionnairique encuvade encuvage encuvance encuvence encuvement encuvation Liste de déverbaux-candidats candidats Répartition des différentes classes de verbes encuirasser encuistrer encuver endauber endenter 00 10 21 11 encuvage endaubage endentement encuirassement encuvement WALIM/Webaffix/ Cherchage sur Web + filtrement Cherchage sur TLFi/RE Encuver : encuvage (dico) encuvement (nouveau) Données : Liste de déverbaux attestés 9 939 déverbaux dont non-attestés dans TLF/RE Pages Web (contexte) pages Web analysées Deux déverbaux attestés dans dico+Web Un seul déverbal dans dico « La vinification en rouge est très classique, avec un encuvage de raisins foulés. » Liste des déverbaux récupérés sur le Web Liste des déverbaux récupérés dans le TLFi + RE encuvement Documents référencés sur Google SUFFIXE : -ment 27 Pages analysées : batteries d'artillerie dont les canons, seront en " encuvement " ou à l'abri dans des "casemates" en béton. Les : Voici le canon de 155 mm dans un encuvement à Gatteville en 1944 (USIS) ses canons furent sortis des casemates et mis en encuvement au moment des combats. : de l'Atlantique. On y trouve un 8,8 cm Flak 18 en encuvement , une casemate H611 en défense de plage, un très : Pièce horizontale qui, dans une ferme à encuvement , relie la sablière à la jambe de force. portant le faux entrait dans le cas d'un comble à encuvement . 61 Occurrences au total --- VOISINS: Mot Fréquence 1 17 Pièce 12 2 10 Canon 9 Tobrouk 9 Batterie 8 Flak 7 Wn 7 Char 7 Assemblage 6 encuvage Documents référencés sur Google SUFFIXE : -age 32 Pages analysées : grappes, complété par un tri systématique lors de l’ encuvage (le remplissage des cuves), afin de garantir la : est nécessaire ils peuvent être refroidis avant encuvage . Une partie des raisins rouges sont coupés en : La vendange est égrappée au dernier moment avant l' encuvage , pour limiter le plus possible l'oxydation des : L'intégrité des grappes est maintenue grâce à un encuvage par gravité ou par tapis roulant. 47 Occurrences au total --- VOISINS: Mot Fréquence Macération 8 Raisins 7 Vinification 6 Grappes 5 Vendange 5 Chai 5 Fermentation 5 Deg 5 Afin 4 Lors 4 Froid 4 Fiches générées automatiquement : NOM encuvage encuvement Suffixe age ment Attesté TLF+RE OUI NON Autres déverbaux repérés Statut Lexical correct Statut Morphologique déverbal Verbe encuver Type d'emploi technique Domaines viticulture maçonnerie Pages Référencées 198 243 Pages Analysées 32 27 Occurrences Analysées 47 61 Champs remplis manuellement. Permettent vérifier la validité des occurrences trouvées : Statut lexical = correct, faute d'orthographe, autre catégorie, autre langue, archaïsme, etc. Statut morphologique = déverbal ou non Champs remplis manuellement. Permettent d'évaluer la sélection affixale en fonction de la répartition en domaines et en types d'utilisation des différents déverbaux

2 Répartition quantitative –age/-ment
Résultats Répartition quantitative –age/-ment Statistiques établies sur des données massives mais brutes (Tableaux 1 et 2) : -ment et –age sont les deux suffixes qui entrent le plus souvent en concurrence puisqu'il s'agit du couple d'opposition affixale le plus représenté ; quantitativement, ils sont représentés de façon équivalente au sein des déverbaux (Tableau 1); Ils sont tout autant disponibles dans la formation de néologismes (Tableau 2). Il semble donc qu'il n'y ait pas de dominance nette de l'un ou l'autre de ces deux affixes dans la formation de déverbaux. A partir de données brutes (tableaux 1 et 2) Tableau 2 : Répartition des couples -age/-ment Tableau 1 : Nombre de déverbaux obtenus Pour près d'un tiers des néologismes, le domaine d'emploi ne recouvre pas le domaine d'emploi du dérivé attesté dans notre référentiel dictionnairique (Tableaux 3 et 4). Domaines d'emploi Sur un échantillon de données : 80 verbes examinés manuellement (tableaux 3 et 4) NOM amincissage amincissement Suffixe age ment Attesté TLF+RE Non Oui Statut Lexical correct Statut Morphologique déverbal Verbe amincir Type d'emploi technique général Domaine tannerie, textile médecine, santé, météorologie, zoologie, philatélie... Pages Référencées 10 17410 Pages Analysées 8 27 Occurrences Analysées 9 150 RELATIONS DOMAINES Disjoints Contextes Aminicissage des coutures centre d'aminicissement techniques d'aminicissage cure d'aminicissement système d'aminicissage des coutures amincissement de la couche d'ozone aminicissement de la lithosphère institut de beauté et d'amincissement produit d'amincissement Amincir : amincissage/amincissement Amincissage : "Gamme abrasifs pour le cuir : travail à sec ou travail, nettoyage chair, amincissage, veloutage, finitions, gamme complète en stock." Amincissement : "Dîtes adieu aux kilos qui vous obsèdent et gâchent votre quotidien. Cathy, spécialiste de l'amincissement vous proposera des programmes de soins sur mesure après un bilan personnalisé complet (alimentaire, corporel, mode de vie, impédance métrie). Cliquez pour agrandir." Rissoler : rissolement/rissolage Rissolement : "Faites les fondre lentement dans le beurre jusqu'à ce que, l'eau des champignons totalement évaporée, le rissolement s'amorce." Rissolage : "En fin de rissolage, augmenter le feu et ajouter les petits lardons et les laisser grésiller quelques instants. Ajouter les moules." Tableau 3 : Répartition des domaines d'emploi des nouveaux déverbaux en -age Tableau 4 : Répartition des domaines d'emploi des nouveaux déverbaux en -ment DOMAINES Pourcentage Domaines identiques 25,86 Restriction de domaines 24,14 Domaines disjoints 22,41 Domaines en recouvrement partiel 15,52 Extension de domaines 12,07 DOMAINES Pourcentage Domaines identiques 36,36 Restriction de domaines 27,27 Domaines disjoints 18,18 Domaines en recouvrement partiel 13,64 Extension de domaines 4,55 Jeux de langage Poésie : "[...] tout enfui enfoui recouvert scellé, oh toi, saleté, contre l'angoisse de la page blanche idéale panacée, fauve enragé radical épitomé, massacrage, capitulation désespérée, bousillage, épilogue goguenard (épinard!), anéantissage saboté..., bah... sabotage!" (http://home.inter.net/berlol/feu.htm) Rafales : "Thomas DANZEISEN: saxophones, objets divers, Christophe RYSER: contrebasse, objets divers. Duo né de l'envie de sortir de leurs contextes musicaux individuels et à la recherche du terrain propice à l'expérimentation. Trifouillage, grinçage, soufflage, pinçage, grattage,....et ceterage." (http://www.amr-geneve.ch/prog2000/aout/overground%20detail.htm) Blagues et calembours divers "On a passé la nuit sous tente, et le lendemain à 7h, autrement dit aux aurores, on s'est tiré du sac d'accouchage (HAHA) tant bien que mal ! Le week-end à pris fin après un bon petit  déjeuner. Un très chouette WE malheureusement "entaché" par le mauvais temps." (http://www.membres.lycos.fr/flambls/chron/3_00/chronique2eme2000.htm) Dans les "jeux de langage", le suffixe –age est presque exclusivement le seul suffixe utilisé pour former des déverbaux d'action ludiques (ce qui tendrait à corroborer l'hypothèse que le suffixe –age est le suffixe par défaut) NOM rissolage rissolement Suffixe age ment Attesté TLF+RE Non Oui Statut Lexical correct Statut Morphologique déverbal Verbe rissoler Type d'emploi technique Domaine culinaire Pages Référencées 256 33 Pages Analysées 32 4 Occurrences Analysées 45 RELATIONS DOMAINES Identité Contextes Phase de rissolage rissolement du lard Début de rissolage rissolement des oignons rissolage des lardons rissolement dans la poêle poêlage et rissolage le rissolement s'amorce concentration par rissolage huile de rissolage

3 Proto-rôles Calcul des N en position de complément du nom Encuver
Méthode : Recherche systématique des occurrences sur le web Analyse syntaxique automatique des contextes Calcul des N apparaissant en position" Xage de N"/"Xment de N" De façon à observer la distribution des N en position de complément du nom par rapport à la forme du dérivé. Exemples : Proto-rôles Un de nos objectifs de départ était de valider l'hypothèse de C. Kelling (2001) selon laquelle la répartition -age/-ment serait motivée par les proto-rôles des arguments des verbes servant de base aux dérivés : C. Kelling (2001) -ment premier argument de la base verbale = proto-agent -age premier argument de la base verbale = proto-patient Nos résultats % de déverbaux agentifs -ment -age Total TLFi+RE 41,25 42,50 83,75 WEB 18,18 31,03 27,50 TOTAL 46,25 65,00 55,62 Encuver Débroussailler Encuvement de N centre (3) béton (2) flak (2) transformateur (2) canon (2) pièce (1) tir (1) marine (1) station (1) Encuvage de N raisin (9) grappe (4) vendange (3) baie (2) cépage (2) moût (2) carignan (1) pinot (1) sauvignon (1) Débroussaillement de N bande (4) totalité (3) arrêté (2) maintien (2) propriété (2) reste (2) sol (2) fossé (1) portage (1) Débroussaillage de N coteau (3) sentier (3) taillis (3) marais (2) motte (2) piste (2) question (2) sommet (2) secteur (2) La répartition observée est beaucoup moins systématique que celle proposée par Kelling. On n'observe, pour l'instant, que des tendances. CONCLUSIONS PROVISOIRES Cette étude à large spectre est toujours en cours, mais elle donne accès à un très grand nombre de données sur les déverbaux en –age et –ment Les hypothèses classiques sur les distinctions ne sont pas vérifiées de façon significative sur les plans de : - la fréquence d'apparition : les déverbaux attestés dans les dictionnaires, ainsi que ceux nouvellement créés le sont dans les mêmes proportions ; - la thématique : plus de la moitié des déverbaux concurrents apparaissent dans les mêmes domaines ; - la complémentation du nom (et donc, pour une part, la signification) : plus d'un quart des couples de déverbaux présentent un recouvrement des compléments ; - le statut des proto-rôles : l'hypothèse de C. Kelling n'est pas vérifiée. Une étude basée sur les attestations du Web est bien entendu à prendre avec précaution, les données étant parfois peu fiables (locuteurs non natifs, erreurs typographiques, etc.). Toutefois, la variété et la spontanéité des productions permet une approche nouvelle, notamment sur les jeux de langage, pour lesquels une distinction se fait nettement avec l'emploi quasi-exclusif de –age pour atteindre des effets comiques. Encuvage/encuvement Ø Débroussaillage / débroussaillement de N terrain (18) zone (14) site (11) abord (10) chemin (10) habitation (8) forêt (5) parcelle (5) partie (5) Répartition des verbes en fonction des compléments de leurs déverbaux Un quart des couples de déverbaux ont des compléments en commun, ce qui semble indiquer que les deux déverbaux ont les mêmes emplois et le même sens. La méthode ayant permis d'effectuer ces calculs est très restrictive. Les tests effectués manuellement ont montré que les cas de synonymie sont plus nombreux que ceux obtenus automatiquement. Le taux de synonymie réel doit être supérieur à 25%. BIBLIOGRAPHIE Dowty D. R. (1991), “Thematic Proto-Roles and Argument Selection”, Language 67, pp. 547–619. Grimshaw J. (1990), Argument Structure, Cambridge, Mass., MIT Press. Kelling C.(2001), “Agentivity and Suffix Selection”, in Proceedings of the LFG ’01 Conference, Stanford, CA, CSLI, pp. 147–162. Kelling C. (2003), “The Role of Agentivity for Suffix Selection”, in G. Booij, J. De Cesaris, A. Ralli & S. Scalise eds, Acts of the Third Mediterranean Meeting on Morphology. Namer F.(2003), “Valider les unités morphologiques par le Web”, in B. Fradin, G. Dal, N. Hathout, F. Kerleroux, M. Plénat & M. Roché éds, Les unités morphologiques, Silexicales 3, Un. de Lille 3, pp Plag I. (1999), Morphological productivity. Structural constraints in English derivation, Berlin/New York, Mouton de Gruyter. Tanguy L. & Hathout N. (2002), “Webaffix : un outil d'acquisition morphologique dérivationnelle à partir du Web”, in Actes de la 9e conférence annuelle sur le Traitement Automatique des Langues Naturelles (TALN’02), Nancy, juin 2002, pp Tasmowski-de Ryck L. (1977), « Tours ‑ment/‑age et génération morphologique », SCL XXVIII-4, pp


Télécharger ppt "WesConVa (Web, Suffixation, Concurrence de déVerbaux d’Action)"

Présentations similaires


Annonces Google