La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Memodata/CRISCO (CNRS)

Présentations similaires


Présentation au sujet: "Memodata/CRISCO (CNRS)"— Transcription de la présentation:

1 Memodata/CRISCO (CNRS)
Utilité et Utilisations du Sémiographe Dominique DUTOIT Memodata/Crisco 10/12/2001 Memodata/CRISCO (CNRS)

2 Utilité du Sémiographe
(0/5) Utilité du Sémiographe effets linguistiques : paraphrase effets cybernétiques : modèle de mémoire effet réels : changer de chaîne de télé, fournir une information 10/12/2001 Memodata/CRISCO (CNRS)

3 Utilité du Sémiographe
(1/5) Utilité du Sémiographe Animer Le Dictionnaire Intégral (LDI) : lui faire produire au bon moment les bons sens ou les bons textes. LDI : toutes les façons de voir le lexique, dont la façon qui représentera le texte t selon une dimension(s) d d ’un besoin b. effets linguistiques : paraphrase effets cybernétiques : modèle de mémoire effet réels : changer de chaîne de télé, fournir une information 10/12/2001 Memodata/CRISCO (CNRS)

4 Memodata/CRISCO (CNRS)
Utilité du Sémiographe LDI (2/5) LDI est (1) : universaliste : toutes les significations sont déclarées ainsi que leurs expressions. aprioriste : tous les effets potentiels des significations sont déclarés. U(avocat) : personne (Classe) qui … Droit (thème) A(avocat) : fct(U (personne), U(qui … Droit)) -- agent, animé… -- monde(s) du Droit 10/12/2001 Memodata/CRISCO (CNRS)

5 Memodata/CRISCO (CNRS)
Utilité du Sémiographe LDI (3/5) LDI est (2) : De forme : graphe unique acyclique orienté fait de mondes dont chaque monde comprend des éléments de nature, prédication, usage, ... De fond : - un ensemble de micro-systèmes en interrelations (TST) - un ensemble de macro-système en interrelations (sémantique componentielle) - un ensemble de classes en relation de syntaxe 10/12/2001 Memodata/CRISCO (CNRS)

6 Memodata/CRISCO (CNRS)
Utilité du Sémiographe (4/5) Animer LDI (1) Transformer les tissus de LDI en organes et voies de communication Adapter ces organes et voies aux tâches linguistiques Permettre à LDI de se voir en mouvement et de s ’adapter au contexte Exemples - fournir une étude différentielle de samouraï selon nippon ou chevalier ; de nippon selon samouraï ou chevalier ; de chevalier selon samouraï ou nippon... 10/12/2001 Memodata/CRISCO (CNRS)

7 Memodata/CRISCO (CNRS)
Utilité du Sémiographe (5/5) Animer LDI (1 : ex) Soit le texte : samouraï … … nippon … … Dans ce texte samouraï est le samouraï japonais selon le prédicat Japon dans le corrélat nippon. Mais il reste à noter que : La classe \personne, les prédicats (une fois \personne retiré) \guerrier, \noble, \portant une armure (…) sont absents. Le grammème \nom est absent (si pas de dét. Ou autre). Soit le texte : samouraï … … chevalier … … Dans ce texte samouraï est le samouraï selon les classes \guerrier, \noble, \ce qui est cuirassé, \nom dans le corrélat chevalier. Mais il reste à noter que : du Japon est absent. 10/12/2001 Memodata/CRISCO (CNRS)

8 Faire comprendre LDI (2)
Utilité du Sémiographe (5/5) Faire comprendre LDI (2) Comment structurer un dictionnaire intégral? Comment s ’assurer que LDI progresse? Comment rendre pensable que LDI se construira un jour tout seul? ET …..…Memodata étant une entreprise……... Comment réaliser rapidement un grand nombre d ’applications linguistiques efficaces en utilisant l ’environnement : DICTIONNAIRE INTEGRAL - SEMIOGRAPHE SenseAgent 10/12/2001 Memodata/CRISCO (CNRS)

9 Utilisations du Sémiographe (démos)
Utilisation du Sémiographe (0/4) Utilisations du Sémiographe (démos) effets linguistiques : paraphrase effets cybernétiques : modèle de mémoire effet réels : changer de chaîne de télé, fournir une information 10/12/2001 Memodata/CRISCO (CNRS)

10 Memodata/CRISCO (CNRS)
Utilisation du Sémiographe (0/4) effets linguistiques : paraphrase effets cybernétiques : modèle de mémoire effet réels : changer de chaîne de télé, fournir une information 10/12/2001 Memodata/CRISCO (CNRS)

11 Utilisation du Sémiographe
(1/10) Conditions de la démo Pas de (re)compilation (~ 15’) --> Pas de test sur la sensibilité du système ou sur sa spécialisation Pas d’apprentissage (hors domaine) Pas de grammaire (fonctions sémantiques seules) Développement : pas de demande d’explication en intention (traits sémantiques, sèmes selon Pottier) des résultats Ressources utilisées (démo Atala) Fonctions lexicales TST Non Concepts isotopiques Oui Connaissances CYC Non 10/12/2001 Memodata/CRISCO (CNRS)

12 Memodata/CRISCO (CNRS)
Utilisation du Sémiographe (2/5) Utilisation du Sémiographe (2/10) Les fonctions de mots 20 API hyper/hypo, syn, ant, géo, lemme, trad, exp... Go 10/12/2001 Memodata/CRISCO (CNRS)

13 Memodata/CRISCO (CNRS)
Utilisation du Sémiographe (2/5) Utilisation du Sémiographe (2/10) hyponymes de monnaie L’hyperonyme Nombre de réponses (selon la profondeur maximale) Temps de traitement (en milliseconde) Go 10/12/2001 Memodata/CRISCO (CNRS)

14 Memodata/CRISCO (CNRS)
Utilisation du Sémiographe (2/5) Utilisation du Sémiographe (2/10) Hyponymes de personne Trop de réponses pour l’envoi à l’afficheur Go 10/12/2001 Memodata/CRISCO (CNRS)

15 Memodata/CRISCO (CNRS)
Utilisation du Sémiographe (2/5) Utilisation du Sémiographe (2/10) Hyperonymes de yen L’affichage des numéros ne suffit pas pour traduire la profondeur du graphe. Les relations utilisées Go 10/12/2001 Memodata/CRISCO (CNRS)

16 Memodata/CRISCO (CNRS)
Utilisation du Sémiographe (2/5) Utilisation du Sémiographe (2/10) Synonymes de monnaie Forme résumée avec perte d’info. dans l’affichage des niveaux de langue en jeu Go 10/12/2001 Memodata/CRISCO (CNRS)

17 Lieu contenu dans Cameroun
Utilisation du Sémiographe (2/5) Utilisation du Sémiographe (2/10) Lieu contenu dans Cameroun La nature des lieux n’est pas affichée. Parfois on pourra la déduire de la relation. Le mieux resterait de demander le type de lieu. Go 10/12/2001 Memodata/CRISCO (CNRS)

18 Lieu contenant Cameroun
Utilisation du Sémiographe (2/5) Utilisation du Sémiographe (2/10) Lieu contenant Cameroun Dans une discussion entre un camerounais et un Alien, l’Univers serait dynamiquement utile. L’intérêt des traits est bien sûr un phénomène strictement dynamique (contextuel, pragmatique,…) Go 10/12/2001 Memodata/CRISCO (CNRS)

19 Dérivé sémantique de rêver
Utilisation du Sémiographe (2/5) Utilisation du Sémiographe (2/10) Dérivé sémantique de rêver Dérivation sémantique et non morphologique Fonction lexicale de fonction lexicale de ... Go 10/12/2001 Memodata/CRISCO (CNRS)

20 Lemmatisation de are (anglais)
Utilisation du Sémiographe (2/5) Utilisation du Sémiographe (2/10) Lemmatisation de are (anglais) En anglais, are est aussi un nom. Six langues disponibles au plan des modèles Go 10/12/2001 Memodata/CRISCO (CNRS)

21 Conjugaison de montare (italien)
Utilisation du Sémiographe (2/5) Utilisation du Sémiographe (2/10) Conjugaison de montare (italien) Choix d’un modèle (tr/int) Go 10/12/2001 Memodata/CRISCO (CNRS)

22 “Brother” de monter Go Non synonymes (ils sont sémantiquement
Utilisation du Sémiographe (2/5) Utilisation du Sémiographe (2/10) “Brother” de monter Non synonymes (ils sont sémantiquement différents), certains verbes admettent des cas de substitution avec monter selon des traits de sens précis. Go 10/12/2001 Memodata/CRISCO (CNRS)

23 Memodata/CRISCO (CNRS)
Utilisation du Sémiographe (2/5) Utilisation du Sémiographe (2/10) Expansion de monter Un script permet l’enchainement des diverses fonctions de mots. Comme pour l’alcool, attention aux abus! Go 10/12/2001 Memodata/CRISCO (CNRS)

24 Les fonctions sémantiques de phrase
Utilisation du Sémiographe (3/10) Les fonctions sémantiques de phrase Des traitements de base La désambiguïsation lexico-sémantique (forme ) La réduction lexicale ( forme N) Extraction sémique ( forme ) 10/12/2001 Memodata/CRISCO (CNRS)

25 Memodata/CRISCO (CNRS)
Utilisation du Sémiographe (4/10) La WSD : forme en  information sur le sens d’un énoncé probabilité P de résolution : 1/80 < P < 1/36) L’aviateur, abattu en plein vol, réussit à rejoindre ses lignes en manœuvrant un parachute probabilité P de résolution : 1/30982 < P < 1/900) 10/12/2001 Memodata/CRISCO (CNRS)

26 distance de monter à voiture
Utilisation du Sémiographe (2/5) Utilisation du Sémiographe (4/10) distance de monter à voiture Sur cet exemple, le trait sémantique prendre place dans un véhicule sera sélectionné. Par conséquence, il sélectionnera le bon sens de monter. Réciproquement, plusieurs sens de voiture seront sélectionnés. Go 10/12/2001 Memodata/CRISCO (CNRS)

27 Memodata/CRISCO (CNRS)
Utilisation du Sémiographe Forme N Forme N Réduction lexicale, dictionnaire à l’envers, forme en N… : différents noms pour un même principe… étalon de nos mesure! Passer d’une expression comportant plusieurs mots à une expression comportant moins de mots. Monnaie du Japon = yen Monnaie de Tokyo = yen Monnaie de Hiro Hito = yen 10/12/2001 Memodata/CRISCO (CNRS)

28 Memodata/CRISCO (CNRS)
Utilisation du Sémiographe Forme N (suite) Forme N (suite) La réduction lexicale est une opération : Texte-->sens-->texte : le texte généré reflète les significations calculées du texte de départ. Dans les cas simples, elle dessine une forme en N : monnaie Isotope Japon Gen de Japon yen 10/12/2001 Memodata/CRISCO (CNRS)

29 Memodata/CRISCO (CNRS)
Utilisation du Sémiographe Forme N (suite) Forme N (suite) Dans des cas plus compliqués, elle dessine une forme en “usine” : Seuls ceux qui voient l’avenir dans les sources prédisent convenablement le futur. P(ceux) = 1/10000 ceux Gen de ??? Isotope divination Voir l’avenir Isotope : source source qui 10/12/2001 Memodata/CRISCO (CNRS)

30 Go N de personne qui répare et vend des voitures Les dix mille
Utilisation du Sémiographe (2/5) Utilisation du Sémiographe (4/10) N de personne qui répare et vend des voitures Les dix mille personnes humaines du dictionnaire sont classées selon ce que perçoit le système de la question. La fonction peut être de fonctionnement très fin et précis pour des domaines limités. Ici, elle fonctionne pour les objets du Dictionnaire. Go 10/12/2001 Memodata/CRISCO (CNRS)

31 Utilisation du Sémiographe
Forme  (5/10) forme  : extraction des traits contextuels de différence et de ressemblance. Depuis : samouraï Vers : chevalier Classème (contextuel) N. (grammème) . Dissymétrie (dissemblance) \Personnequi fait la guerre Dissymétrie (dissemblance) Symétrie (ressemblance) Sémantèmes (contextuel) Qui est du Japon Qui porte une armure Qui est noble 10/12/2001 Memodata/CRISCO (CNRS)

32 Utilisation du Sémiographe
Forme  (6/10) Les fonctions de texte

33 Le résumé lexical d’un texte
Utilisation du Sémiographe (7/10) Le résumé lexical d’un texte Principe : un texte traitant d’un sujet active abondamment tous les isotopes de ce sujet billard : [billard thème] [jouer thème] [adresse thème] [gagner thème] [salle thème]… Algorithme : activation d’isotopes, proximité Usage : indexation et filtrage Résultats : apporte un plus, très bons 10/12/2001 Memodata/CRISCO (CNRS)

34 Le routage, nomenclature...
Utilisation du Sémiographe (8/10) Le routage, nomenclature... Principe : un texte doit être dirigé automatiquement vers une boîte à lettres comme : [guerre du kosovo] : guerre;kosovo Algorithme : activation ou proximité Résultats : peut être très bon pour les sujets référentiels, préférer match sur classe enrichi des brothers pour les structures actancielles 10/12/2001 Memodata/CRISCO (CNRS)

35 Memodata/CRISCO (CNRS)
Utilisation du Sémiographe (9/10) Signature sémantique Principe : un texte doit être surchargé de lexiques désambiguïsant ses principaux mots. Billard (jeu), Billard (chirurgie), ... Algorithme : Sens-->texte Résultats : utile pour la recherche, ralenti l’indexation. 10/12/2001 Memodata/CRISCO (CNRS)

36 Comparaison de deux textes
Utilisation du Sémiographe (10/10) Comparaison de deux textes Principe : un texte doit être surchargé de lexiques désambiguïsant ses principaux mots. Billard (jeu), Billard (chirurgie), ... Algorithme : Sens-->texte Résultats : utile pour la recherche, ralenti l’indexation. 10/12/2001 Memodata/CRISCO (CNRS)

37 Évolution du projet « Syntaxe Intégrale et Pragmatique Abstraite»
10/12/2001 Memodata/CRISCO (CNRS)

38 Memodata/CRISCO (CNRS)
La pragmatique abstraite Pourquoi la bonne réponse à Quelle est la couleur du cheval blanc d’Henry IV ? est-elle toujours blanc? La syntaxe intégrale Concevoir des espaces indépendants de représentation des observations : indépendance des variables = clarté des concepts Inventer ou sélectionner des terminologies propres à chaque espace Concevoir les effets des projections en tant qu’application d’un espace sur l’autre. 10/12/2001 Memodata/CRISCO (CNRS)

39 Memodata/CRISCO (CNRS)
10/12/2001 Memodata/CRISCO (CNRS)

40 Memodata/CRISCO (CNRS)
Syntaxe intégrale ou componentielle = déclaration de choses potentiellement vraies pour chaque espace (à définir) Sélection automatique des “matches” sur chaque espace par qqch comme le Sémiographe indépendamment de toute idée préconçue de stratégie unificatrice. Syntaxe à la fois analytique et générative (pas de processus) 10/12/2001 Memodata/CRISCO (CNRS)


Télécharger ppt "Memodata/CRISCO (CNRS)"

Présentations similaires


Annonces Google