Bernard Victorri et Nabil Abdellaoui

Slides:



Advertisements
Présentations similaires
Aurélien Barbier LIRIS Université Claude Bernard Lyon 1 Nautibus, 8 boulevard Niels.
Advertisements

Sciences de la Vie et de la Terre, Maths et Sciences Physiques
EVOLUTIONS DES PROGRAMMES
Lévolution de lépreuve de mathématiques Au baccalauréat général (séries S et ES)
Fabrice Lauri, François Charpillet, Daniel Szer
Distance inter-locuteur
REPÉRAGE DANS L’ESPACE
Calcul géométrique avec des données incertaines
Test statistique : principe
CISPN Droit Aérien 43. CISPN CONTRÔLE REGIONAL Référence –Documentation 4444.
2- La théorie du producteur
ASSOCIATION entre caractères qualitatifs
Lévolution de lépreuve de mathématiques au baccalauréat général (séries S et ES) Journées danimation sur le collège 2007/ 2008 – Socle et programmes.
COMME UNE TERRE ALTEREE (1/5) Comme une terre altérée
La hauteur des montagnes sur la Lune
ASSOCIATION entre caractères qualitatifs
Les TESTS STATISTIQUES
Importance de l’horizon d’observation des coûts pour juger du caractère variable ou fixe des coûts de production. La courbe de coût d’une entreprise est.
Visualisation d’un dictionnaire des synonymes à différentes échelles :
Analyse du programme de 4ème
Estimation de la survie comparaison des courbes de survie FRT C3.
Indexation textuelle : Systèmes de recherche d’informations
REPÉRAGE DANS L’ESPACE
Représentations mentales: Le point de vue des neurosciences cognitives
Traitement de données socio-économiques et techniques d’analyse :
Produit vectoriel Montage préparé par : André Ross
Les principaux climats
Problématiques et lacunes
Chapitre 2 : La fonction de transfert
Le cas du presbyte Divers éléments dans l ’histoire de cas vous ont renseigné sur l ’addition nécessaire au client pour sa vision de près: Après avoir.
1 Journée de regroupement des correspondants "Egalité et genre" - 21 novembre 2011 Rectorat de Rouen - SAIO - CD-HD Résultats scolaires, appréciations.
La segmentation
CONSTRUCTION MECANIQUE LES COUPES ET LES SECTIONS
Territoires, risque inondation et vulnérabilité des activités économiques (séquence 2) Construire un langage commun.
Produit mixte Montage préparé par : André Ross
Vers la dimension 3. La géométrie dans l'espace ne fait qu'étendre les concepts qui vous sont familiers en dimension 2 à la dimension 3. Le plus difficile.
Reconnaissance Vocale
LIN 1750 DGD 11 Prosodie.
Thales Research and Technology Filtrage et Extraction dInformation 1 Évaluation comparative de ressources générales et de ressources spécifiques pour l'extraction.
Le Sémiographe Outil générique pour effectuer des opérations texte sens texte ou texte sens actions
Forum des Industries de la Langue, 17 mars 2010
1.1 Les Biomes Le mot “biosphère” réfère à la région sur ou près de la surface de la Terre qui abrite tous les êtres vivants. Un biome est une région dont.
17 - Induction.
Chapitre 3 La cinématique à une dimension
Equations pour les mesures gradiométriques (GOCE)
Résolution de problèmes Analyse : « Le programme sinscrit, comme celui de la classe de seconde, dans le cadre de la résolution de problèmes. Les situations.
La polysémie des adjectifs : comment les définir ?
Arithmétique et algèbre Continuités et ruptures : lettres, signe égal, expressions Module 1.
Unité 1 Vocabulaire Le symbole - Bernard Dadié
EXERCICE II : Le rugby, sport de contact et d’Évitement (8 points)
Géométrie analytique Distance entre deux points.
Technique de points de contrôle: Formes de Bézier
Différentielle et taux de variation
Physique mécanique (NYA)
La construction du sens: un système complexe dynamique Fabienne Venant Département de mathématiques, UQAM
Dessine-moi une ambiguïté Une approche géométrique du calcul du sens Fabienne Venant Université Nancy 2, France Département de mathématiques, UQAM.
Enseigner le lexique à l’école primaire
Il était une fois un bonhomme de neige, qui se nommait Rudolfo
TALN 2005, Dourdan1 Construction automatique de classes de sélection distributionnelle Guillaume Jacquet et Fabienne Venant Lattice-CNRS UMR 8094.
Projet : Automatiser la découverte de moyens mnémotechniques
Chapitre 3 : Développer et Factoriser avec des nombres
Du discours aux modèles… Une tentative d’articulation
Avoir une vie harmonieuse et heureuse n'est pas difficile. Il n'y a pas de recettes magiques. Il suffit de bien se connaître soi-même, selon le.
20/06/2015propagation de signatures lexicales dans le graphe du Web 1 Propagation de signatures lexicales dans le graphe du Web M. Bouklit M. Lafourcade.
Copyright Altran Technologies 2013PHYSOR1 Activité T6 – Générateurs de jdd MCNP SMURFER Jeu de paramètres libres Contraintes physiques et géométriques.
1.  On souhaite comparer deux traitements dans le cadre d’un essai randomisé sur les lombosciatiques :  corticoïdes par infiltrations  placebo  Critère.
Référentiels et points de mesure
1 4th International Conference on Arabic Language Processing, May 2–3, 2012, Rabat, Morocco Titre Mohamed El Amine ABDERRAHIM Mohamed Alaedine ABDERRAHIM.
STATISTIQUE DESCRIPTIVE
DISTANCE D’ARRÊT FONCTIONS DE RÉFÉRENCE. Situation : En ville, Daniel en cyclomoteur aperçoit brusquement sur la route à quelques mètres devant lui, Diaguely.
Transcription de la présentation:

Bernard Victorri et Nabil Abdellaoui L’utilisation de méthodes quantitatives dans l’étude de la polysémie lexicale Bernard Victorri et Nabil Abdellaoui Lattice-CNRS, ENS

La « révolution » technologique Un dispositif expérimental d’observation tout à fait inédit qui permet de « voir » la langue (cf. la lunette de Galilée) Des méthodes « brutales » d’une efficacité redoutable Un discours très modeste sur des objectifs limités de TAL A quand l’émergence d’une assise théorique à la hauteur de ces bouleversements ?

Méthodes quantitatives et géométrie Les méthodes quantitatives apportent du continu Ce continu n’est pas une tare dont il faudrait se débarrasser. Au contraire : cela rejoint des intuitions de linguistes et des résultats de psycholinguistique. Il faut un cadre mathématique adapté au continu pour donner une légitimité aux méthodes quantitatives : notamment, il faut pouvoir retrouver le qualitatif à l’intérieur de ce nouveau cadre. Le cadre de la géométrie différentielle et des systèmes dynamiques correspond à ce besoin

L’apport des graphes lexicaux (Bruno Gaume) Comment définir une distance sémantique lexicale ?

La méthode des cliques (Ploux et Victorri 1998) Détermination des cliques du graphe de synonymie Détermination d’une distance entre cliques Détermination des axes de l’espace sémantique local associé à une unité lexicale

Un exemple : l’adjectif sec sans eau: La route était sèche maigre: Un vieil homme sec et ridé sec improductif: Rester sec à un examen insensible: Un homme au cœur sec abrupt: Donner un coup sec seul: Avoir un atout sec dans son jeu … (TLF: plus de 30 subdivisions)

Le dictionnaire de synonymes 56 synonymes (adjectivaux) de sec aigre aride austère autoritaire blessant bourru bref brusque brutal cassant concis cru desséché dur décharné déplaisant désagréable désertique désobligeant efflanqué endurci fauché ferme froid glacial glacé improductif indifférent ingrat insensible ...

Une partie du graphe de synonymie de sec aride maigre stérile décharné rude austère brusque Cliques : - sec, aride, maigre, stérile - sec, aride, maigre, décharné - sec, rude, austère - sec, rude, brusque

Calcul des cliques du graphe 75 cliques pour sec aride;desséché;décharné;maigre;sec aride;désertique;ingrat;sec;stérile aride;desséché;maigre;sec;stérile aride;improductif;pauvre;sec;stérile;vide austère;rude;sec;simple;sévère autoritaire;brusque;cassant;sec;tranchant bourru;brusque;brutal;cru;rude;sec bref;brusque;brutal;sec bref;concis;sec dur;froid;indifférent;insensible;sec fauché;pauvre;sec indifférent;insensible;sec;égoïste sec;seul;simple ...

Calcul de la distance entre les cliques Métrique du 2 Soit : u1, u2, …, un les synonymes, c1, c2, …, cp les cliques, xk1, xk2,….;, xkn les coordonnées de ck, (xki = 1 si ui  ck et xki = 0 si ui  c ) d2(ck, cl) = avec :

VisuSyn : une représentation géométrique (www. crisco. unicaen VisuSyn : une représentation géométrique (www.crisco.unicaen.fr ou www.dico.isc.cnrs.fr)

VisuSyn : les cliques

VisuSyn : les synonymes

Zone de pertinence de aride

Nombre d’occurrences dans le corpus Calcul du sens à l’aide d’un corpus (Frantext) (Fabienne Venant, Guillaume Jacquet) Calcul du degré d’affinité d’un nom épithète Exemple : le nom terre Nombre d’occurrences dans le corpus terre aride terre maigre terre stérile terre sèche 8 2 6 3 terre austère terre rude terre brusque terre décharnée 1 Cliques Degré d’affinité sec, aride, maigre, stérile sec, aride, maigre, décharné sec, rude, austère sec, rude, brusque 98 % 57 % 42 % 28 %

Calcul du degré d’affinité Soit : u1, u2, …, un les synonymes, c1, c2, …, cp les cliques, e1,e2,......,em les noms, nij le nombre d’occurrences du couple (ei, uj) dans le corpus. Degré d’affinité du nom ei avec l’adjectif uj dij = avec f(x) = Degré d’affinité aik du nom ei avec la clique ck où le facteur de pondération pij vaut et xkj=1 ssi uj  ck

Fonction potentielle induite par le nom régissant Exemple: coup

Fonction potentielle induite par le nom régissant Cas d’un sens précis: herbe

Fonction potentielle induite par le nom régissant Cas d’ambiguïté-alternative : homme

Fonction potentielle induite par le nom régissant Cas d’indétermination : ton

Evaluation quantitative des résultats (Venant 2002) Calcul du taux d’adéquation d’un synonyme pour désambiguïser sec dans le contexte d’un nom donné : fj : fonction de pertinence associée à l’adjectif gi : fonction de pertinence associée au nom Evaluation des performances du système à l’aide d’un test sur les 20 noms les plus fréquents et sur 5 synonymes désambiguïsants → Taux de réussite : 79%

COUP Visusyn Sujets Réussite brusque A 100 % décharné D desséché stérile glacial MOYENNE TERRE Visusyn Sujets Réussite brusque D 100 % décharnée C desséchée A stérile B glaciale 80 % MOYENNE 96 % MANIERES Visusyn Sujets Réussite brusques A B 80 % décharnées D 100 % desséchées stériles glaciales 0 % MOYENNE 76 % BOUE Visusyn Sujets Réussite brusque D 100 % décharnée desséchée A 0 % stérile glaciale MOYENNE 60 % LIT Visusyn Sujets Réussite brusque C D 80 % décharné 100 % desséché A 0 % stérile glacial MOYENNE 72 % FLEUR Visusyn Sujets Réussite brusque D 100 % décharnée C 80 % desséchée A 0 % stérile B glaciale MOYENNE 56 %