La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Lutilisation de méthodes quantitatives dans létude de la polysémie lexicale Bernard Victorri et Nabil Abdellaoui Lattice-CNRS, ENS.

Présentations similaires


Présentation au sujet: "Lutilisation de méthodes quantitatives dans létude de la polysémie lexicale Bernard Victorri et Nabil Abdellaoui Lattice-CNRS, ENS."— Transcription de la présentation:

1 Lutilisation de méthodes quantitatives dans létude de la polysémie lexicale Bernard Victorri et Nabil Abdellaoui Lattice-CNRS, ENS

2 La « révolution » technologique Un dispositif expérimental dobservation tout à fait inédit qui permet de « voir » la langue (cf. la lunette de Galilée) Des méthodes « brutales » dune efficacité redoutable Un discours très modeste sur des objectifs limités de TAL A quand lémergence dune assise théorique à la hauteur de ces bouleversements ?

3 Les méthodes quantitatives apportent du continu Ce continu nest pas une tare dont il faudrait se débarrasser. Au contraire : cela rejoint des intuitions de linguistes et des résultats de psycholinguistique. Il faut un cadre mathématique adapté au continu pour donner une légitimité aux méthodes quantitatives : notamment, il faut pouvoir retrouver le qualitatif à lintérieur de ce nouveau cadre. Méthodes quantitatives et géométrie Le cadre de la géométrie différentielle et des systèmes dynamiques correspond à ce besoin

4 Lapport des graphes lexicaux (Bruno Gaume) Comment définir une distance sémantique lexicale ?

5 La méthode des cliques (Ploux et Victorri 1998) 1.Détermination des cliques du graphe de synonymie 2.Détermination dune distance entre cliques 3.Détermination des axes de lespace sémantique local associé à une unité lexicale

6 Un exemple : ladjectif sec sans eau: La route était sèche maigre: Un vieil homme sec et ridé sec improductif: Rester sec à un examen insensible: Un homme au cœur sec abrupt:Donner un coup sec seul:Avoir un atout sec dans son jeu … (TLF: plus de 30 subdivisions)

7 Le dictionnaire de synonymes 56 synonymes (adjectivaux) de sec aigre aride austère autoritaire blessant bourru bref brusque brutal cassant concis cru desséché dur décharné déplaisant désagréable désertique désobligeant efflanqué endurci fauché ferme froid glacial glacé improductif indifférent ingrat insensible...

8 Une partie du graphe de synonymie de sec sec aride maigre stérile décharné rude austère brusque Cliques : - sec, aride, maigre, stérile - sec, aride, maigre, décharné - sec, rude, austère - sec, rude, brusque

9 Calcul des cliques du graphe 75 cliques pour sec aride;desséché;décharné;maigre;sec aride;désertique;ingrat;sec;stérile aride;desséché;maigre;sec;stérile aride;improductif;pauvre;sec;stérile;vide austère;rude;sec;simple;sévère autoritaire;brusque;cassant;sec;tranchant bourru;brusque;brutal;cru;rude;sec bref;brusque;brutal;sec bref;concis;sec dur;froid;indifférent;insensible;sec fauché;pauvre;sec indifférent;insensible;sec;égoïste sec;seul;simple...

10 Métrique du 2 Soit : u 1, u 2, …, u n les synonymes, c 1, c 2, …, c p les cliques, x k1, x k2,….;, x kn les coordonnées de c k, (x ki = 1 si u i c k et x ki = 0 si u i c ) Calcul de la distance entre les cliques d 2 (c k, c l ) = avec :

11 VisuSyn : une représentation géométrique (www.crisco.unicaen.fr ou

12 VisuSyn : les cliques

13 VisuSyn : les synonymes

14 Zone de pertinence de aride

15 Calcul du sens à laide dun corpus (Frantext) (Fabienne Venant, Guillaume Jacquet) Nombre doccurrences dans le corpus terre aride terre maigre terre stérile terre sèche terre austère terre rude terre brusque terre décharnée Calcul du degré daffinité dun nom épithète Exemple : le nom terre CliquesDegré daffinité sec, aride, maigre, stérile sec, aride, maigre, décharné sec, rude, austère sec, rude, brusque 98 % 57 % 42 % 28 %

16 Soit : u 1, u 2, …, u n les synonymes, c 1, c 2, …, c p les cliques, e 1,e 2,......,e m les noms, n ij le nombre doccurrences du couple (e i, u j ) dans le corpus. Degré daffinité du nom e i avec ladjectif u j Calcul du degré daffinité Degré daffinité a ik du nom e i avec la clique c k et x kj =1 ssi u j c k où le facteur de pondération p ij vaut d ij =avec f(x) =

17 Fonction potentielle induite par le nom régissant Exemple: coup

18 Fonction potentielle induite par le nom régissant Cas dun sens précis: herbe

19 Fonction potentielle induite par le nom régissant Cas dambiguïté-alternative : homme

20 Fonction potentielle induite par le nom régissant Cas dindétermination : ton

21 Evaluation quantitative des résultats (Venant 2002) Calcul du taux dadéquation dun synonyme pour désambiguïser sec dans le contexte dun nom donné : f j : fonction de pertinence associée à ladjectif g i : fonction de pertinence associée au nom Evaluation des performances du système à laide dun test sur les 20 noms les plus fréquents et sur 5 synonymes désambiguïsants Taux de réussite : 79%

22 COUPVisusynSujetsRéussite brusqueAA100 % décharnéDD100 % desséchéDD100 % stérileDD100 % glacialDD100 % MOYENNE100 % TERREVisusynSujetsRéussite brusqueDD100 % décharnéeCC100 % desséchéeAA100 % stérileBB100 % glacialeCD80 % MOYENNE96 % MANIERESVisusynSujetsRéussite brusquesAB80 % décharnéesDD100 % desséchéesDD100 % stérilesDD100 % glacialesDB0 % MOYENNE76 % BOUEVisusynSujetsRéussite brusqueDD100 % décharnéeDD100 % desséchéeDA0 % stérileDD100 % glacialeAD0 % MOYENNE60 % LITVisusynSujetsRéussite brusqueCD80 % décharnéDD100 % desséchéDA0 % stérileDD100 % glacialCD80 % MOYENNE72 % FLEURVisusynSujetsRéussite brusqueDD100 % décharnéeDC80 % desséchéeCA0 % stérileBD0 % glacialeDD100 % MOYENNE56 %


Télécharger ppt "Lutilisation de méthodes quantitatives dans létude de la polysémie lexicale Bernard Victorri et Nabil Abdellaoui Lattice-CNRS, ENS."

Présentations similaires


Annonces Google