Télécharger la présentation
1
Bernard Victorri et Nabil Abdellaoui
L’utilisation de méthodes quantitatives dans l’étude de la polysémie lexicale Bernard Victorri et Nabil Abdellaoui Lattice-CNRS, ENS
2
La « révolution » technologique
Un dispositif expérimental d’observation tout à fait inédit qui permet de « voir » la langue (cf. la lunette de Galilée) Des méthodes « brutales » d’une efficacité redoutable Un discours très modeste sur des objectifs limités de TAL A quand l’émergence d’une assise théorique à la hauteur de ces bouleversements ?
3
Méthodes quantitatives et géométrie
Les méthodes quantitatives apportent du continu Ce continu n’est pas une tare dont il faudrait se débarrasser. Au contraire : cela rejoint des intuitions de linguistes et des résultats de psycholinguistique. Il faut un cadre mathématique adapté au continu pour donner une légitimité aux méthodes quantitatives : notamment, il faut pouvoir retrouver le qualitatif à l’intérieur de ce nouveau cadre. Le cadre de la géométrie différentielle et des systèmes dynamiques correspond à ce besoin
4
L’apport des graphes lexicaux (Bruno Gaume)
Comment définir une distance sémantique lexicale ?
5
La méthode des cliques (Ploux et Victorri 1998)
Détermination des cliques du graphe de synonymie Détermination d’une distance entre cliques Détermination des axes de l’espace sémantique local associé à une unité lexicale
6
Un exemple : l’adjectif sec
sans eau: La route était sèche maigre: Un vieil homme sec et ridé sec improductif: Rester sec à un examen insensible: Un homme au cœur sec abrupt: Donner un coup sec seul: Avoir un atout sec dans son jeu … (TLF: plus de 30 subdivisions)
7
Le dictionnaire de synonymes
56 synonymes (adjectivaux) de sec aigre aride austère autoritaire blessant bourru bref brusque brutal cassant concis cru desséché dur décharné déplaisant désagréable désertique désobligeant efflanqué endurci fauché ferme froid glacial glacé improductif indifférent ingrat insensible ...
8
Une partie du graphe de synonymie de sec
aride maigre stérile décharné rude austère brusque Cliques : - sec, aride, maigre, stérile - sec, aride, maigre, décharné - sec, rude, austère - sec, rude, brusque
9
Calcul des cliques du graphe
75 cliques pour sec aride;desséché;décharné;maigre;sec aride;désertique;ingrat;sec;stérile aride;desséché;maigre;sec;stérile aride;improductif;pauvre;sec;stérile;vide austère;rude;sec;simple;sévère autoritaire;brusque;cassant;sec;tranchant bourru;brusque;brutal;cru;rude;sec bref;brusque;brutal;sec bref;concis;sec dur;froid;indifférent;insensible;sec fauché;pauvre;sec indifférent;insensible;sec;égoïste sec;seul;simple ...
10
Calcul de la distance entre les cliques
Métrique du 2 Soit : u1, u2, …, un les synonymes, c1, c2, …, cp les cliques, xk1, xk2,….;, xkn les coordonnées de ck, (xki = 1 si ui ck et xki = 0 si ui c ) d2(ck, cl) = avec :
11
VisuSyn : une représentation géométrique (www. crisco. unicaen
VisuSyn : une représentation géométrique ( ou
12
VisuSyn : les cliques
13
VisuSyn : les synonymes
14
Zone de pertinence de aride
15
Nombre d’occurrences dans le corpus
Calcul du sens à l’aide d’un corpus (Frantext) (Fabienne Venant, Guillaume Jacquet) Calcul du degré d’affinité d’un nom épithète Exemple : le nom terre Nombre d’occurrences dans le corpus terre aride terre maigre terre stérile terre sèche 8 2 6 3 terre austère terre rude terre brusque terre décharnée 1 Cliques Degré d’affinité sec, aride, maigre, stérile sec, aride, maigre, décharné sec, rude, austère sec, rude, brusque 98 % 57 % 42 % 28 %
16
Calcul du degré d’affinité
Soit : u1, u2, …, un les synonymes, c1, c2, …, cp les cliques, e1,e2,......,em les noms, nij le nombre d’occurrences du couple (ei, uj) dans le corpus. Degré d’affinité du nom ei avec l’adjectif uj dij = avec f(x) = Degré d’affinité aik du nom ei avec la clique ck où le facteur de pondération pij vaut et xkj=1 ssi uj ck
17
Fonction potentielle induite par le nom régissant Exemple: coup
18
Fonction potentielle induite par le nom régissant Cas d’un sens précis: herbe
19
Fonction potentielle induite par le nom régissant Cas d’ambiguïté-alternative : homme
20
Fonction potentielle induite par le nom régissant Cas d’indétermination : ton
21
Evaluation quantitative des résultats
(Venant 2002) Calcul du taux d’adéquation d’un synonyme pour désambiguïser sec dans le contexte d’un nom donné : fj : fonction de pertinence associée à l’adjectif gi : fonction de pertinence associée au nom Evaluation des performances du système à l’aide d’un test sur les 20 noms les plus fréquents et sur 5 synonymes désambiguïsants → Taux de réussite : 79%
22
COUP Visusyn Sujets Réussite brusque A 100 % décharné D desséché stérile glacial MOYENNE TERRE Visusyn Sujets Réussite brusque D 100 % décharnée C desséchée A stérile B glaciale 80 % MOYENNE 96 % MANIERES Visusyn Sujets Réussite brusques A B 80 % décharnées D 100 % desséchées stériles glaciales 0 % MOYENNE 76 % BOUE Visusyn Sujets Réussite brusque D 100 % décharnée desséchée A 0 % stérile glaciale MOYENNE 60 % LIT Visusyn Sujets Réussite brusque C D 80 % décharné 100 % desséché A 0 % stérile glacial MOYENNE 72 % FLEUR Visusyn Sujets Réussite brusque D 100 % décharnée C 80 % desséchée A 0 % stérile B glaciale MOYENNE 56 %
Présentations similaires
© 2024 SlidePlayer.fr Inc.
All rights reserved.