Soutenance doctorat : D. Dutoit

Slides:



Advertisements
Présentations similaires
Qu’est-ce que LingPro ? LingPro est la branche ingénierie linguistique de i-KM La collaboration i-KM / LingPro est le résultat d’un partenariat sous forme.
Advertisements

Comment annoter un texte
MOT Éditeur de modèles de connaissances par objets typés
Les présentateurs doivent souvent transmettre des informations techniques à des auditeurs qui connaissent moins bien le sujet et le vocabulaire spécifique.
Théorie des graphes.
24510, AND PROJECT STANDARDS TEST IN TWO MOROCCAN CITIES LOCAL ACTION – 4th WORLD WATER FORUM, MEXICO 2006 SERVICE DE NORMALISATION INDUSTRIELLE.
Résolution de problèmes et logiciel de calcul symbolique
Treuil IRD Abdelwahed FSSM-Marrakech
Algèbre de composants : une approche fonctionnelle à la sémantique de documents Bart Lamiroy LORIA/INPL QGar - École des Mines de Nancy.
Rencontre avec… DICTIONNAIRES EN LIGNE ET OUTILS DE TRADUCTION
Unité 1 Le texte argumentatif.
L'UNION FAIT LA FORCE Les Contrats Francs
Analyse et structuration thématiques
OLST — Université de Montréal
Les écrits scientifiques Cycle II – 2 décembre 2006 Plan de lintervention –Quest-ce quécrire ? –Ecrire en sciences –La dictée à ladulte –Regroupement :
Indexation textuelle : Systèmes de recherche d’informations
variable aléatoire Discrète
Cordial, le TAL et les aides à la rédaction
Le lexique de la société de linformation 1. Mod. B : Le lexique de la société de linformation.1 Les TICE, quest-ce que cest?
La compréhension en lecture, J. Giasson
Vers une approche de construction de composants ontologiques pour le web sémantique – synthèse et discussion. Nesrine Ben Mustapha (RIADI, ENSI Tunis)
La carte mentale.
PLC2 – Sciences physiques Directeur de mémoire : Philippe DURUISSEAU
INTELLIGENCE COLLECTIVE : RENCONTRES 2006Nîmes mai 2006 CENTRE DE RECHERCHE LGI2P 1- Doctorante Ecole des mines de Paris, 2- Maitre de Conférences.
L’INTERACTIVITÉ DANS L’ENSEIGNEMENT MAGISTRAL
Pour un système formel de description linguistique
PROJET D'ACTIVITE RIVIS-TIPEI LAURA.
Organiser le texte Du mot au texte © Fralica - Philippe Van Goethem
Graphes Conceptuels J.F. Baget Inria.
Initiation à la conception de systèmes d'information
Les conditions d’efficacité de l’enseignement magistral
Bases de données lexicales
Project de la langue française
BIENVENUE ! 9e Colloque annuel de EPAC\APEC – Section Québec Éthique et culture organisationnelle.
LA COMPREHENSION EN LECTURE
Plan d’un texte argumentatif
Maîtrise de la langue française
Analyse d’énoncés de problèmes additifs
MOT Éditeur de modèles de connaissances par objets typés
Symbolisme vs Connexionnisme
Présentation du mémoire
Memodata/CRISCO (CNRS)
Le Sémiographe Outil générique pour effectuer des opérations texte sens texte ou texte sens actions
Forum des Industries de la Langue, 17 mars 2010
LE MODÈLE KEYNÉSIEN 1. Note historique
Chapitre 9 Les sous-programmes.
Josée Lemire Conseillère pédagogique CSCN
Initiation à la conception des systèmes d'informations
Passer au CSS et autres... Quelle différence entre ces deux pages ? Si vous regardez uniquement le contenu, aucune. Tout se joue sur la mise en forme.
Algorithmes et Programmation
Théories, formalismes, modèles Sylvain Kahane Modyco, Université Paris 10 - Nanterre Mosaïque, Paris, 1/12/2006.
Marquez cette valeur sur le diagramme à points de la question 6. La moyenne réelle des nombres de lettres par mots dans la population de l'ensemble des.
Dictionnaires, lexicographie, lexicographes
La poésie.
Initiation à la conception des systèmes d'informations
Thème 4 : Les éléments naturels. Cours 2 : L’eau dans la nature et chez les êtres vivants. Français Guide du Maître Thème 6 : Exprimer ce que l’on ressent.
Dominique LAURENT Patrick SEGUELA
ARMATURE Concours blanc de SHS 2008.
Le Traitement Automatique des Langues (TAL)
Video.
Nouvelles Technologies Internet & Mobile
Progression/Programmation – Français (1/3)
INTRODUCTION AUX BASES DE DONNEES
LES TEXTES ET LES SHADOKS (Docs d’application et d’accompagnement)
Le Pitch appliqué au recrutement
Les bases de données Séance 3 Construction du Modèle Conceptuel de Données.
École élémentaire Jules Payot Aix en Provence Bolarin Véronique Année scolaire 2008/2009 Philippe LA COUR Correspondant EDD IA 13.
MES STRATÉGIES DE LECTURE
*Lycée qualifiant Salaheddine al ayoubi-Taourirt 1 L.Q. SalaheddineElAyoubi- Taourirt
Transcription de la présentation:

Soutenance doctorat : D. Dutoit Quelques opérations texte-->sens et texte-->sens-->texte utilisant une sémantique universaliste apriorique Dominique DUTOIT Université de Caen 30/11/2000 Soutenance doctorat : D. Dutoit

Une sémantique linguistique La Sémantique Générale a le mérite de distinguer sens et signification. Nous étudions les rapports entre signification et texte. Sens des Significations Signification des textes (commentaire à propos des signes) Avec l’idée qu’on saura associer des sens à des invariants de signification (sens dans la théorie sens-->texte). 30/11/2000 Soutenance doctorat : D. Dutoit

Rapports signe/signification/sens 1 et 1’ est linguistique, 2 et 2’ rentre dans le linguistique si l’on admet une analyse différente de Jean s’aime et de Jean et Jeanne s’aiment, alors 3 et 3’ devient linguistique (en plus compliqué) 30/11/2000 Soutenance doctorat : D. Dutoit

Soutenance doctorat : D. Dutoit Les domaines Nos calculs concernent les mots et les textes. --> Pas de domaine terminologique Ces calculs ont des effets - linguistiques - cybernétiques - réels. --> Pas de domaine applicatif L’universalisme et l’apriorisme caractérisent notre sémantique linguistique. effets linguistiques : paraphrase effets cybernétiques : modèle de mémoire effet réels : changer de chaîne de télé, fournir une information 30/11/2000 Soutenance doctorat : D. Dutoit

Universalisme et apriorisme universalisme : les significations sont déclarées ainsi que leurs expressions. apriorisme : les effets potentiels des significations sont déclarés. 30/11/2000 Soutenance doctorat : D. Dutoit

Des opérations linguistiques Opération texte-->sens : la désambiguïsation lexico-sémantique Plusieurs Opérations texte-->sens-->texte Par exemple, Dictionnaire à l’envers (réduction lexicale) Résumé lexical, thématique Paraphrases d’énoncés courts filtrage d’information, ajout de co-texte, signature sémantique ... 30/11/2000 Soutenance doctorat : D. Dutoit

La démarche de présentation Les données : le Dictionnaire Intégral Les traitements sémantiques : Le Sémiographe 30/11/2000 Soutenance doctorat : D. Dutoit

Le Dictionnaire Intégral (DI) Les données Le Dictionnaire Intégral (DI)

Le Dictionnaire Intégral Description qualitative TST, Sémantique componentielle et CYC Cohérence des trois théories L’exemple de riche adj. Conclusion Description quantitative Par rapport à WordNet Par rapport aux trois théories 30/11/2000 Soutenance doctorat : D. Dutoit

Soutenance doctorat : D. Dutoit Description qualitative la TST Produire toutes les paraphrases d’un “sens”. “sens” ou Représentation Sémantique profonde : graphe formel construit à partir des entrées numérotées du Dictionnaire Explicatif et Combinatoire (DEC). Un même sens pourra produire : La lune éclipse le soleil ET l’éclipse du soleil par la lune Le DEC est fait de fonctions lexico-sémantiques S0(éclipser) = éclipse (nominalisation), S1(éclipser) = corps céleste sémantique de mot-sens (lexical) et pas de classe. 30/11/2000 Soutenance doctorat : D. Dutoit

La sémantique componentielle Description qualitative La sémantique componentielle La sémantique componentielle décompose les significations en traits plus élémentaires (sèmes) et espère, depuis cette décomposition, découvrir des lois de composition. TraitSém(éclipse) = [abstrait] [cacher] [action] [fait]… 30/11/2000 Soutenance doctorat : D. Dutoit

Soutenance doctorat : D. Dutoit Description qualitative CYC CYC a pour ambition de décrire les connaissances courantes d’un écolier Il arrive que la lune passe devant le soleil et le cache à nos yeux pendant quelques minutes…il fait alors nuit durant le jour… 30/11/2000 Soutenance doctorat : D. Dutoit

Intégration le syntagme et le paradigme Description qualitative Intégration le syntagme et le paradigme Problèmes posés: A) Pourquoi ne lit-on jamais le mangeur mange? B) Pourquoi le gourmand mange peut se rencontrer? C) Pourquoi l’avocat mange n’est pas ambigu pour nous? D) Qu’est ce qui distingue ces trois énoncés? 30/11/2000 Soutenance doctorat : D. Dutoit

Soutenance doctorat : D. Dutoit Description qualitative Réponses A) Parce qu’on ne parle pas pour ne rien dire sauf dans le dictionnaire où l’on parle de la langue elle-même (DEC). B) Parce que la redondance est incomplète (sémantique componentielle). C) Parce que les gens mangent et que les fruits ne mangent pas (CYC). D) Un point de vue sur la langue. Notre sémantique tente de regrouper ces points de vue différents : c’est le Dictionnaire Intégral. 30/11/2000 Soutenance doctorat : D. Dutoit

Soutenance doctorat : D. Dutoit Description qualitative Les relations TST X (mot-sens ou sens) <FL> Y (mot-sens ou sens) mangeur <FL> manger Sémantique componentielle \X (trait de sens, concept) //// \Y (concept) gourmand=Spec mangeur //// \nourriture, manger CYC \X (concept actanciel) //// \Y (concept actanciel) avocat //// \verbes vie animale isotopies Relation actancielle SV 30/11/2000 Soutenance doctorat : D. Dutoit

Soutenance doctorat : D. Dutoit Description qualitative Graphique complet Relation actancielle SV V des animaux avocat Isotopies : nourriture, vivant... mangeur <FL : S1> manger <Gen> gourmand Le mangeur mange : vert, rouge et bleu le gourmand mange : rouge et bleu l’avocat mange : bleu 30/11/2000 Soutenance doctorat : D. Dutoit

Les 3 théories et les textes Description qualitative Les 3 théories et les textes Le mangeur mange : vert, rouge et bleu Vert (TST) est absent du syntagme le gourmand mange : rouge et bleu Rouge (Sém. Comp.) peut se rechercher en et hors syntagme ; l’avocat mange : bleu Bleu est absent hors syntagme 30/11/2000 Soutenance doctorat : D. Dutoit

Soutenance doctorat : D. Dutoit Description qualitative Un exemple riche adj. Que dit-on dans les emplois Une riche récolte, Un style riche Une rime riche Une mine riche en or Un sol riche Une personne riche Un appartement riche Un vêtement riche 30/11/2000 Soutenance doctorat : D. Dutoit

Soutenance doctorat : D. Dutoit Description qualitative Les emplois attestent l’usage par définition Les emplois correspondent à des compréhensions Compréhension : représentation sémantique, sens (dont paraphrase) ;  modèle de mémoire Comme il y a autant de compréhensions que de sens, combien de sens pour riche ? 30/11/2000 Soutenance doctorat : D. Dutoit

Soutenance doctorat : D. Dutoit Description qualitative Pour riche adj., il y a 4 sens principaux et des emplois à propriétés particulières. 30/11/2000 Soutenance doctorat : D. Dutoit

Soutenance doctorat : D. Dutoit Pour Une riche récolte Pour Un style, une rime riche Pour Une mine riche en or Pour Un sol riche Pour Une personne riche récolte Qté=bcp qualité style posséder variété n,m or contenir bcp 1,1 mine sol 1,1 récolte développer. Qté=bcp Impact : précision sur l'homonymie et la polysémie. Pour "riche", il y a homonymie en compréhension (discontinuité des sens). La polysémie se retrouve dans le partage de certains traits de sens (bcp, fav.) D'un façon gén., pour la continuité je considère qu'il faut à chaque l'expliquer : elle a pour origine l'emploi et abouti à un sens profond homogène, pour origine la comprehension et aboutit à la création de plusieurs traits de sens. personne posséder biens Qté=bcp 30/11/2000 Soutenance doctorat : D. Dutoit

Soutenance doctorat : D. Dutoit Description qualitative Riche sens 1 (récolte) Relation actancielle SA indénombrables Adj des indénombables? Isotopies : [bcp en masse], [fav.], [chose indénombrable...] Emplois récolte, production... riche <FL : S1> enrichir, pauvre, ... abondant 30/11/2000 Soutenance doctorat : D. Dutoit

Soutenance doctorat : D. Dutoit Description qualitative Riche dans Lexidiom 1e _riche adj. seul ¦ \qui est en grande qté d'une façon favorable [FC ADJ]/FC Gen ¦ \récolte [FD ADJjugement]/FDJN, Jugement 2e_riche adj. seul ¦ \qui (s')est développé en grande diversité (fav.) [FC ADJ]/FC Gen ¦ \riche (style) [FD ADJjugement]/FDJN, Jugement ¦ \bon (pour un discours) [FD ADJjugement]/FDJN, Jugement ¦ \qui est garni, décoré d'ornements [FC ADJ]/FDJN, Jugement ¦ \rime [FD ADJdescript.]/FDJN, Jugement ¦ \langue et langage [FD ADJdescript.]/FDJN, Jugement ¦ \qualificatif de la voix [FD ADJdescript.]/FDJN, Jugement 3e _riche adj. seul _ ¦ \J + en + comp [Cons0]/->ConsLar ¦ \J + de + comp [Cons0]/->ConsLar ¦ \qui contient qqch en abondance: riche en (fav.) [FC ADJ]/FC Gen ¦ \qualificatif favorable d'un sol agricole [FD ADJjugement]/FDJN, Jugement ¦ \substance minérale [FD ADJdescript.]/FDJN, Jugement 30/11/2000 Soutenance doctorat : D. Dutoit

Soutenance doctorat : D. Dutoit Description qualitative 4e _riche adj. seul ¦ \qui par sa richesse permet un grand dévelop.(fav. [FC ADJ]/FC Gen _ ¦ \qui a la propriété de nourrir bcp [FC ADJ]/FC SpecEnc ¦ \qualificatif favorable d'un sol agricole [FD ADJjugement]/FDJN, Jugement ¦ \qualificatif de qualité du caractère [FD ADJjugement]/FDJN, Jugement 5E _riche adj. seul ¦ \qui est riche de biens ou d'argent [FC ADJ]/FC Gen 6E _riche Nom M.S., flex : F ¦ \personne riche [FC N]/FC Gen ¦ _riche adj. seul/personne J 7e _riche adj. seul ¦ \fastueux et cher [FC ADJ]/FC Spec ¦ \appartement [FD ADJjugement]/FDJN, Jugement Collocations gosse de #riche Nom M.S., flex : F nouveau #riche Nom M.S. ... 30/11/2000 Soutenance doctorat : D. Dutoit

Soutenance doctorat : D. Dutoit Description qualitative Conclusion Le Dictionnaire Intégral comporte trois niveaux de description complémentaires à rôle précis Le découpage en sens du Dictionnaire Integral est conditionné par le modèle de compréhension. 30/11/2000 Soutenance doctorat : D. Dutoit

Comparaison avec WordNet : les mots Description quantitative Comparaison avec WordNet : les mots 30/11/2000 Soutenance doctorat : D. Dutoit

Comparaison avec WordNet : les relations Description quantitative Comparaison avec WordNet : les relations WordNet DI Fonctions lexicales TST 0 sauf synonymie Oui si accord Concepts isotopiques 0 hors Spec Oui Connaissance CYC 0 Oui si générale 30/11/2000 Soutenance doctorat : D. Dutoit

Utilisation actuelle dans les algorithmes Description quantitative Utilisation actuelle dans les algorithmes Le Sémiographe Fonctions lexicales TST Non Concepts isotopiques Oui Connaissance CYC Non Pour la désambiguïsation sémantique l’actuel Sémiographe n’utilise que le Rouge des isotopies. 30/11/2000 Soutenance doctorat : D. Dutoit

Les traitements Le Sémiographe

Soutenance doctorat : D. Dutoit Le Sémiographe Des traitements de base La désambiguïsation lexico-sémantique La réduction lexicale Des traitements plus applicatifs Le résumé lexical de textes, la thématique La paraphrase d’énoncés courts Le filtrage d’informations, l’ajout de co-texte... 30/11/2000 Soutenance doctorat : D. Dutoit

Les traitements de base La désambiguïsation lexico-sémantique

Soutenance doctorat : D. Dutoit La WSD Problème posé information sur le sens d’un énoncé probabilité P de résolution : 1/80 < P < 1/36) L’aviateur, abattu en plein vol, réussit à rejoindre ses lignes en manœuvrant un parachute probabilité P de résolution : 1/30982 < P < 1/900) 30/11/2000 Soutenance doctorat : D. Dutoit

Soutenance doctorat : D. Dutoit La WSD Moyen utilisé Les isotopies uniquement ==> pas de connaissances courantes ni de TST ==> pas de différence de traitement syntagme/espace hors syntagme ==> des énoncés non solutionnables comme l’avocat mange un avocat 30/11/2000 Soutenance doctorat : D. Dutoit

Soutenance doctorat : D. Dutoit La WSD Deux algorithmes L’activation : unification par les meilleurs isotopes partagés Activation (poissonE, filet)  Activation (bateauE, filet)  Activation (merE, filet)  Activation (pêcheur, filet)  Activation (pêcher, filet) 30/11/2000 Soutenance doctorat : D. Dutoit

Soutenance doctorat : D. Dutoit La WSD La proximité sémantique : unification sur tous les isotopes et prise en compte des différences Prox(poissonE, filet)  Activation (poissonE, filet) + Racine du vivant La proximité sémantique est asymétrique : Prox(vendeur,fleuriste)  Activation (vendeur, fleuriste) Prox(fleuriste,vendeur)  Activation (fleuriste, vendeur) + Racine des plantes 30/11/2000 Soutenance doctorat : D. Dutoit

Soutenance doctorat : D. Dutoit Les résultats La WSD Pour 35 mots étudiés dans le manuscrit, 172 sens au total (5 sens par mot en moy.), 115 sens incorrects sont éliminés et 1 seul “bon sens” est éliminé. La probabilité d’atteindre aléatoirement un résultat aussi bon ou meilleur est : 0,5%. ==> Le système est statistiquement efficace hors domaine en utilisant les seuls moyens de l’isotopie! 30/11/2000 Soutenance doctorat : D. Dutoit

Les traitements de base La réduction lexicale

Soutenance doctorat : D. Dutoit La réduction lexicale Réduction lexicale, dictionnaire à l’envers, forme en N… : différents noms pour un même principe. Passer d’une expression comportant plusieurs mots à une expression comportant moins de mots. Monnaie du Japon = yen Monnaie de Tokyo = yen Monnaie de Hiro Hito = yen 30/11/2000 Soutenance doctorat : D. Dutoit

Soutenance doctorat : D. Dutoit La réduction lexicale Fonctionnement La réduction lexicale est une opération : Texte-->sens-->texte : le texte généré reflète les significations calculées du texte de départ. Dans les cas simples, elle dessine une forme en N : monnaie Isotope Japon Gen de Japon yen 30/11/2000 Soutenance doctorat : D. Dutoit

Soutenance doctorat : D. Dutoit La réduction lexicale Fonctionnement Dans des cas plus compliqués, elle dessine une forme en “usine” : Seuls ceux qui voient l’avenir dans les sources prédisent convenablement le futur. P(ceux) = 1/10000 ceux Gen de ??? Isotope divination Voir l’avenir Isotope : source source qui 30/11/2000 Soutenance doctorat : D. Dutoit

Soutenance doctorat : D. Dutoit La réduction lexicale Algorithme utilisé Proximité sémantique Manque Les définitions Résultats Souvent bons, produit des listes analogiques au texte de départ 30/11/2000 Soutenance doctorat : D. Dutoit

Les traitements applicatifs

Le résumé lexical d’un texte Traitements TST applicatifs Le résumé lexical d’un texte Principe : un texte traitant d’un sujet active abondamment tous les isotopes de ce sujet billard : [billard thème] [jouer thème] [adresse thème] [gagner thème] [salle thème]… Algorithme : activation d’isotopes, proximité Usage : indexation et filtrage Résultats : apporte un plus, très bons 30/11/2000 Soutenance doctorat : D. Dutoit

Le routage, nomenclature... Traitements TST applicatifs Le routage, nomenclature... Principe : un texte doit dirigé automatiquement vers une boîte à lettres comme : [guerre du kosovo] : guerre;kosovo Algorithme : activation ou proximité Résultats : peu de silence, peuvent être très bon pour les sujets référentiels 30/11/2000 Soutenance doctorat : D. Dutoit

Soutenance doctorat : D. Dutoit Traitements TST applicatifs Signature sémantique Principe : un texte doit être surchargé de lexiques désambiguïsant ses principaux mots. Billard (jeu), Billard (chirurgie), ... Algorithme : Sens-->texte Résultats : utile pour la recherche, ralenti l’indexation. 30/11/2000 Soutenance doctorat : D. Dutoit

Soutenance doctorat : D. Dutoit Traitements TST applicatifs Signature sémantique Principe : un texte doit être surchargé de lexiques désambiguïsant ses principaux mots. Billard (jeu), Billard (chirurgie), ... Algorithme : Sens-->texte Résultats : utile pour la recherche, ralenti l’indexation. 30/11/2000 Soutenance doctorat : D. Dutoit

Soutenance doctorat : D. Dutoit Conclusion générale Au plan scientifique, nous avons : montré une intégration réaliste de trois théories actuellement indépendantes anticipé les conséquences de cette intégration sur les calculs sémantiques montré que des mots chargés a priori de sens génèrent des modèles de données au sens informatique montré que ces modèles décident pour une large part de l’homonymie ou de la polysémie en définitive, nous avons montré comment construire un DICTIONNAIRE INTEGRAL 30/11/2000 Soutenance doctorat : D. Dutoit

Soutenance doctorat : D. Dutoit Conclusion générale Au plan des réalisations, nous avons : décrit l’un des plus gros projets au plan mondial décrit l’une des réalisations les plus avancées montré la faisabilité de la réalisation en avançant Au plan des techniques, nous avons : réussi à diviser en sous-projets, pendant 10 ans, le projet général, permettant ainsi son financement malgré que nous soyons l’équipe la plus petite au plan mondial, réussi à développer tant les données que les traitements et la théorie générale. 30/11/2000 Soutenance doctorat : D. Dutoit

Soutenance doctorat : D. Dutoit Conclusion générale En terme prospectif, nous prévoyons dans les 3 ans à venir au plan scientifique : d’instancier en définition les modèles de sens (tel celui de riche) pour les 2000 mots les plus courants du français de lancer une étude portant sur les conséquences en terme de nature de calcul de ces modèles. au plan des réalisations : de plus développer les outils sens-->texte et texte-->sens pour mieux mémoriser les textes, préparer l’extraction de connaissances (lien syntaxe/mot-sens) de favoriser la pénétration de nos outils et méthodes de développer des relations maintenues vers d’autres langues 30/11/2000 Soutenance doctorat : D. Dutoit