La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

30/11/2000Soutenance doctorat : D. Dutoit1 Quelques opérations texte-->sens et texte-->sens-->texte utilisant une sémantique universaliste apriorique Dominique.

Présentations similaires


Présentation au sujet: "30/11/2000Soutenance doctorat : D. Dutoit1 Quelques opérations texte-->sens et texte-->sens-->texte utilisant une sémantique universaliste apriorique Dominique."— Transcription de la présentation:

1 30/11/2000Soutenance doctorat : D. Dutoit1 Quelques opérations texte-->sens et texte-->sens-->texte utilisant une sémantique universaliste apriorique Dominique DUTOIT Université de Caen

2 30/11/2000Soutenance doctorat : D. Dutoit2 Une sémantique linguistique La Sémantique Générale a le mérite de distinguer sens et signification. Nous étudions les rapports entre signification et texte. Sens des Significations Signification des textes (commentaire à propos des signes) Avec lidée quon saura associer des sens à des invariants de signification (sens dans la théorie sens-->texte).

3 30/11/2000Soutenance doctorat : D. Dutoit3 Rapports signe/signification/sens

4 30/11/2000Soutenance doctorat : D. Dutoit4 Nos calculs concernent les mots et les textes. --> Pas de domaine terminologique Ces calculs ont des effets - linguistiques - cybernétiques - réels. --> Pas de domaine applicatif Luniversalisme et lapriorisme caractérisent notre sémantique linguistique. Les domaines

5 30/11/2000Soutenance doctorat : D. Dutoit5 Universalisme et apriorisme universalisme : les significations sont déclarées ainsi que leurs expressions. apriorisme : les effets potentiels des significations sont déclarés.

6 30/11/2000Soutenance doctorat : D. Dutoit6 Des opérations linguistiques Opération texte-->sens : la désambiguïsation lexico-sémantique Plusieurs Opérations texte-->sens-->texte Par exemple, –Dictionnaire à lenvers (réduction lexicale) –Résumé lexical, thématique –Paraphrases dénoncés courts –filtrage dinformation, ajout de co-texte, signature sémantique –...

7 30/11/2000Soutenance doctorat : D. Dutoit7 La démarche de présentation Les données : le Dictionnaire Intégral Les traitements sémantiques : Le Sémiographe

8 Les données Le Dictionnaire Intégral (DI)

9 30/11/2000Soutenance doctorat : D. Dutoit9 Le Dictionnaire Intégral Description qualitative –TST, Sémantique componentielle et CYC –Cohérence des trois théories –Lexemple de riche adj. –Conclusion Description quantitative –Par rapport à WordNet –Par rapport aux trois théories

10 30/11/2000Soutenance doctorat : D. Dutoit10 la TST Produire toutes les paraphrases dun sens. sens ou Représentation Sémantique profonde : graphe formel construit à partir des entrées numérotées du Dictionnaire Explicatif et Combinatoire (DEC). Un même sens pourra produire : La lune éclipse le soleil ET léclipse du soleil par la lune Le DEC est fait de fonctions lexico- sémantiques S 0 (éclipser) = éclipse (nominalisation), S 1 (éclipser) = corps céleste Description qualitative

11 30/11/2000Soutenance doctorat : D. Dutoit11 La sémantique componentielle La sémantique componentielle décompose les significations en traits plus élémentaires (sèmes) et espère, depuis cette décomposition, découvrir des lois de composition. TraitSém(éclipse) = [abstrait] [cacher] [action] [fait]… Description qualitative

12 30/11/2000Soutenance doctorat : D. Dutoit12 CYC CYC a pour ambition de décrire les connaissances courantes dun écolier Il arrive que la lune passe devant le soleil et le cache à nos yeux pendant quelques minutes…il fait alors nuit durant le jour… Description qualitative

13 30/11/2000Soutenance doctorat : D. Dutoit13 Intégration le syntagme et le paradigme Problèmes posés: A) Pourquoi ne lit-on jamais le mangeur mange? B) Pourquoi le gourmand mange peut se rencontrer? C) Pourquoi lavocat mange nest pas ambigu pour nous? D) Quest ce qui distingue ces trois énoncés? Description qualitative

14 30/11/2000Soutenance doctorat : D. Dutoit14 Réponses A) Parce quon ne parle pas pour ne rien dire sauf dans le dictionnaire où lon parle de la langue elle- même (DEC). B) Parce que la redondance est incomplète (sémantique componentielle). C) Parce que les gens mangent et que les fruits ne mangent pas (CYC). D) Un point de vue sur la langue. Notre sémantique tente de regrouper ces points de vue différents : cest le Dictionnaire Intégral. Description qualitative

15 30/11/2000Soutenance doctorat : D. Dutoit15 Les relations TST X (mot-sens ou sens) Y (mot-sens ou sens) mangeur manger Sémantique componentielle \X (trait de sens, concept) //// \Y (concept) gourmand=Spec mangeur //// \nourriture, manger CYC \X (concept actanciel) //// \Y (concept actanciel) avocat //// \verbes vie animale isotopies Relation actancielle SV Description qualitative

16 30/11/2000Soutenance doctorat : D. Dutoit16 Relation actancielle SV Isotopies : nourriture, vivant... Graphique complet V des animaux avocat Le mangeur mange : vert, rouge et bleu le gourmand mange : rouge et bleu lavocat mange : bleu mangeur manger gourmand Description qualitative

17 30/11/2000Soutenance doctorat : D. Dutoit17 Les 3 théories et les textes Le mangeur mange : vert, rouge et bleu Vert (TST) est absent du syntagme le gourmand mange : rouge et bleu Rouge (Sém. Comp.) peut se rechercher en et hors syntagme ; lavocat mange : bleu Bleu est absent hors syntagme Description qualitative

18 30/11/2000Soutenance doctorat : D. Dutoit18 Un exemple riche adj. Que dit-on dans les emplois Une riche récolte, Un style riche Une rime riche Une mine riche en or Un sol riche Une personne riche Un appartement riche Un vêtement riche Description qualitative

19 30/11/2000Soutenance doctorat : D. Dutoit19 Les emplois attestent lusage par définition Les emplois correspondent à des compréhensions Compréhension : représentation sémantique, sens (dont paraphrase) ; modèle de mémoire Comme il y a autant de compréhensions que de sens, combien de sens pour riche ? Description qualitative

20 30/11/2000Soutenance doctorat : D. Dutoit20 Pour riche adj., il y a 4 sens principaux et des emplois à propriétés particulières. Description qualitative

21 30/11/2000Soutenance doctorat : D. Dutoit21 Pour Une riche récolte Pour Un style, une rime riche Pour Une mine riche en or Pour Un sol riche Pour Une personne riche récolte Qté=bcp qualité style posséder variété n,m or contenir bcp 1,1 minesol 1,1 récolte développer. Qté=bcp personne posséder biens Qté=bcp

22 30/11/2000Soutenance doctorat : D. Dutoit22 Relation actancielle SA Isotopies : [ bcp en masse], [fav.], [chose indénombrable...] Riche sens 1 (récolte) indénombrables Adj des indénombables? riche enrichir, pauvre,... abondant Emplois récolte, production... Description qualitative

23 30/11/2000Soutenance doctorat : D. Dutoit23 Riche dans Lexidiom 1e _riche adj. seul ¦ \qui est en grande qté d'une façon favorable [FC ADJ]/FC Gen ¦ \récolte [FD ADJjugement]/FDJN, Jugement 2e_riche adj. seul ¦ \qui (s')est développé en grande diversité (fav.) [FC ADJ]/FC Gen ¦ \riche (style) [FD ADJjugement]/FDJN, Jugement ¦ \bon (pour un discours) [FD ADJjugement]/FDJN, Jugement ¦ \qui est garni, décoré d'ornements [FC ADJ]/FDJN, Jugement ¦ \rime [FD ADJdescript.]/FDJN, Jugement ¦ \langue et langage [FD ADJdescript.]/FDJN, Jugement ¦ \qualificatif de la voix [FD ADJdescript.]/FDJN, Jugement 3e _riche adj. seul _ ¦ \J + en + comp [Cons0]/->ConsLar ¦ \J + de + comp [Cons0]/->ConsLar ¦ \qui contient qqch en abondance: riche en (fav.) [FC ADJ]/FC Gen ¦ \qualificatif favorable d'un sol agricole [FD ADJjugement]/FDJN, Jugement ¦ \substance minérale [FD ADJdescript.]/FDJN, Jugement Description qualitative

24 30/11/2000Soutenance doctorat : D. Dutoit24 4e _riche adj. seul ¦ \qui par sa richesse permet un grand dévelop.(fav. [FC ADJ]/FC Gen _ ¦ \qui a la propriété de nourrir bcp [FC ADJ]/FC SpecEnc ¦ \qualificatif favorable d'un sol agricole [FD ADJjugement]/FDJN, Jugement ¦ \qualificatif de qualité du caractère [FD ADJjugement]/FDJN, Jugement 5E _riche adj. seul ¦ \qui est riche de biens ou d'argent [FC ADJ]/FC Gen 6E _riche Nom M.S., flex : F ¦ \personne riche [FC N]/FC Gen ¦ _riche adj. seul/personne J 7e _riche adj. seul ¦ \fastueux et cher [FC ADJ]/FC Spec ¦ \appartement [FD ADJjugement]/FDJN, Jugement Collocations gosse de #riche Nom M.S., flex : F nouveau #riche Nom M.S.... Description qualitative

25 30/11/2000Soutenance doctorat : D. Dutoit25 Conclusion Le Dictionnaire Intégral comporte trois niveaux de description complémentaires à rôle précis Le découpage en sens du Dictionnaire Integral est conditionné par le modèle de compréhension. Description qualitative

26 30/11/2000Soutenance doctorat : D. Dutoit26 Comparaison avec WordNet : les mots Description quantitative

27 30/11/2000Soutenance doctorat : D. Dutoit27 Comparaison avec WordNet : les relations Description quantitative WordNetDI Fonctions lexicales TST 0 sauf synonymieOui si accord Concepts isotopiques 0 hors SpecOui Connaissance CYC 0Oui si générale

28 30/11/2000Soutenance doctorat : D. Dutoit28 Utilisation actuelle dans les algorithmes Description quantitative Le Sémiographe Fonctions lexicales TSTNon Concepts isotopiquesOui Connaissance CYCNon Pour la désambiguïsation sémantique lactuel Sémiographe nutilise que le Rouge des isotopies.

29 Les traitements Le Sémiographe

30 30/11/2000Soutenance doctorat : D. Dutoit30 Le Sémiographe Des traitements de base –La désambiguïsation lexico-sémantique –La réduction lexicale Des traitements plus applicatifs –Le résumé lexical de textes, la thématique –La paraphrase dénoncés courts –Le filtrage dinformations, lajout de co-texte...

31 Les traitements de base La désambiguïsation lexico- sémantique

32 30/11/2000Soutenance doctorat : D. Dutoit32 Problème posé information sur le sens dun énoncé probabilité P de résolution : 1/80 < P < 1/36) Laviateur, abattu en plein vol, réussit à rejoindre ses lignes en manœuvrant un parachute probabilité P de résolution : 1/30982 < P < 1/900) La WSD

33 30/11/2000Soutenance doctorat : D. Dutoit33 Moyen utilisé Les isotopies uniquement ==> pas de connaissances courantes ni de TST ==> pas de différence de traitement syntagme/espace hors syntagme ==> des énoncés non solutionnables comme lavocat mange un avocat La WSD

34 30/11/2000Soutenance doctorat : D. Dutoit34 Deux algorithmes Lactivation : unification par les meilleurs isotopes partagés –Activation (poissonE, filet) Activation (bateauE, filet) Activation (merE, filet) Activation (pêcheur, filet) Activation (pêcher, filet) La WSD

35 30/11/2000Soutenance doctorat : D. Dutoit35 La proximité sémantique : unification sur tous les isotopes et prise en compte des différences Prox(poissonE, filet) Activation (poissonE, filet) + Racine du vivant La proximité sémantique est asymétrique : Prox( vendeur, fleuriste ) Activation ( vendeur, fleuriste ) Prox( fleuriste, vendeur ) Activation ( fleuriste, vendeur ) + Racine des plantes La WSD

36 30/11/2000Soutenance doctorat : D. Dutoit36 Les résultats Pour 35 mots étudiés dans le manuscrit, 172 sens au total (5 sens par mot en moy.), 115 sens incorrects sont éliminés et 1 seul bon sens est éliminé. La probabilité datteindre aléatoirement un résultat aussi bon ou meilleur est : 0,5%. ==> Le système est statistiquement efficace hors domaine en utilisant les seuls moyens de lisotopie! La WSD

37 Les traitements de base La réduction lexicale

38 30/11/2000Soutenance doctorat : D. Dutoit38 Réduction lexicale, dictionnaire à lenvers, forme en N… : différents noms pour un même principe. Passer dune expression comportant plusieurs mots à une expression comportant moins de mots. Monnaie du Japon = yen Monnaie de Tokyo = yen Monnaie de Hiro Hito = yen La réduction lexicale

39 30/11/2000Soutenance doctorat : D. Dutoit39 Fonctionnement La réduction lexicale est une opération : Texte-->sens-->texte : le texte généré reflète les significations calculées du texte de départ. Dans les cas simples, elle dessine une forme en N : monnaie Gen de yen Isotope Japon Japon La réduction lexicale

40 30/11/2000Soutenance doctorat : D. Dutoit40 Fonctionnement Dans des cas plus compliqués, elle dessine une forme en usine : Seuls ceux qui voient lavenir dans les sources prédisent convenablement le futur. P(ceux) = 1/10000 La réduction lexicale ceux Gen de ??? Isotope divination Voir lavenir Isotope : source source qui

41 30/11/2000Soutenance doctorat : D. Dutoit41 Algorithme utilisé Proximité sémantique Manque Les définitions Résultats Souvent bons, produit des listes analogiques au texte de départ La réduction lexicale

42 Les traitements applicatifs

43 30/11/2000Soutenance doctorat : D. Dutoit43 Le résumé lexical dun texte Principe : un texte traitant dun sujet active abondamment tous les isotopes de ce sujet billard : [billard thème] [jouer thème] [adresse thème] [gagner thème] [salle thème]… Algorithme : activation disotopes, proximité Usage : indexation et filtrage Résultats : apporte un plus, très bons Traitements TST applicatifs

44 30/11/2000Soutenance doctorat : D. Dutoit44 Le routage, nomenclature... Principe : un texte doit dirigé automatiquement vers une boîte à lettres comme : [guerre du kosovo] : guerre;kosovo Algorithme : activation ou proximité Résultats : peu de silence, peuvent être très bon pour les sujets référentiels Traitements TST applicatifs

45 30/11/2000Soutenance doctorat : D. Dutoit45 Signature sémantique Principe : un texte doit être surchargé de lexiques désambiguïsant ses principaux mots. Billard (jeu), Billard (chirurgie),... Algorithme : Sens-->texte Résultats : utile pour la recherche, ralenti lindexation. Traitements TST applicatifs

46 30/11/2000Soutenance doctorat : D. Dutoit46 Signature sémantique Principe : un texte doit être surchargé de lexiques désambiguïsant ses principaux mots. Billard (jeu), Billard (chirurgie),... Algorithme : Sens-->texte Résultats : utile pour la recherche, ralenti lindexation. Traitements TST applicatifs

47 30/11/2000Soutenance doctorat : D. Dutoit47 Conclusion générale Au plan scientifique, nous avons : –montré une intégration réaliste de trois théories actuellement indépendantes –anticipé les conséquences de cette intégration sur les calculs sémantiques –montré que des mots chargés a priori de sens génèrent des modèles de données au sens informatique –montré que ces modèles décident pour une large part de lhomonymie ou de la polysémie –en définitive, nous avons montré comment construire un DICTIONNAIRE INTEGRAL

48 30/11/2000Soutenance doctorat : D. Dutoit48 Au plan des réalisations, nous avons : –décrit lun des plus gros projets au plan mondial –décrit lune des réalisations les plus avancées –montré la faisabilité de la réalisation en avançant Au plan des techniques, nous avons : –réussi à diviser en sous-projets, pendant 10 ans, le projet général, permettant ainsi son financement –malgré que nous soyons léquipe la plus petite au plan mondial, réussi à développer tant les données que les traitements et la théorie générale. Conclusion générale

49 30/11/2000Soutenance doctorat : D. Dutoit49 En terme prospectif, nous prévoyons dans les 3 ans à venir au plan scientifique : –dinstancier en définition les modèles de sens (tel celui de riche) pour les 2000 mots les plus courants du français –de lancer une étude portant sur les conséquences en terme de nature de calcul de ces modèles. au plan des réalisations : –de plus développer les outils sens-->texte et texte-->sens pour mieux mémoriser les textes, préparer lextraction de connaissances (lien syntaxe/mot-sens) –de favoriser la pénétration de nos outils et méthodes –de développer des relations maintenues vers dautres langues Conclusion générale


Télécharger ppt "30/11/2000Soutenance doctorat : D. Dutoit1 Quelques opérations texte-->sens et texte-->sens-->texte utilisant une sémantique universaliste apriorique Dominique."

Présentations similaires


Annonces Google