Memodata/CRISCO (CNRS)

Slides:



Advertisements
Présentations similaires
Le Nom L’adjectif Le verbe Objectif: Orthogram
Advertisements

ORTHOGRAM PM 3 ou 4 Ecrire: « a » ou « à » Référentiel page 6
LES NOMBRES PREMIERS ET COMPOSÉS
[number 1-100].
Qualité du Premier Billot. 2 3 Défauts reliés à labattage.
1. Résumé 2 Présentation du créateur 3 Présentation du projet 4.
Page 1 Retour sur le e- tourisme. Page 2 Quelques chiffres…
Licence pro MPCQ : Cours
Distance inter-locuteur
Mon carnet De comportement
Proposition de recherches sur ABI (Pro Quest) Lise Herzhaft (Urfist de Lyon) et MH Prévoteau (Bibliothèque Université Paris 2) Mise en forme par Nolwenn.
Classe : …………… Nom : …………………………………… Date : ………………..
Reconnaissance de la parole
Les Prepositions.
VIRAGES SYMETRIQUES EN PALIER, MONTEE ET DESCENTE
Systèmes Experts implémentation en Prolog
La diapo suivante pour faire des algorithmes (colorier les ampoules …à varier pour éviter le « copiage ») et dénombrer (Entoure dans la bande numérique.
ESIEE Paris © Denis BUREAU I N Initiation à la programmation avec le langage Java.
Description du fonctionnement d'un système 1 Clic Clic
2 1. Vos droits en tant quusagers 3 1. Vos droits en tant quusagers (suite) 4.
Nom du module Date Lieu de la formation. 2 Genèse du projet Historique, partenaires, publics Pour qui ? Pourquoi ? Qui ? Comment ? Quand ?
1 7 Langues niveaux débutant à avancé. 2 Allemand.
PARTENARIAT ÉDUCATIF GRUNDTVIG PARTENARIAT ÉDUCATIF GRUNDTVIG REPERES COHESION CULTURELLE ET EXPANSION DES IDEES SUR LE TERRITOIRE EUROPEEN.
ORTH 1 CE2 Je sais écrire sans erreur les pluriels des noms se terminant par s, x, z.
1 Théorie des Graphes Cycle Eulérien. 2 Rappels de définitions On dit qu'une chaîne est un chemin passant par toutes les arêtes du graphe. On dit qu'un.
Mr: Lamloum Med LES NOMBRES PREMIERS ET COMPOSÉS Mr: Lamloum Med.
Soutenance doctorat : D. Dutoit
Interagir avec un objet mixte Propriétés physiques et numériques Céline Coutrix, Laurence Nigay Équipe Ingénierie de lInteraction Homme-Machine (IIHM)
1 Cours numéro 3 Graphes et informatique Définitions Exemple de modélisation Utilisation de ce document strictement réservée aux étudiants de l IFSIC.
Application des algorithmes génétiques
Vuibert Systèmes dinformation et management des organisations 6 e édition R. Reix – B. Fallery – M. Kalika – F. Rowe Chapitre 1 : La notion de système.
GRAM 1 CE2 Je sais transformer une phrase affirmative en phrase négative.
Guide pour construire une présentation de qualité
1 Journée de regroupement des correspondants "Egalité et genre" - 21 novembre 2011 Rectorat de Rouen - SAIO - CD-HD Résultats scolaires, appréciations.
ACDI IUT de Paris – 05 février CR-MD - v1.20 Enquête POST-DUT Informatique 03 1 Les diplômés de 2003 Claude Ratard - Vélizy.
1 Conduite du changement LA CONDUITE DU CHANGEMENT.
Académie de Créteil - B.C Quest-ce quune Inscription 1)1 action + 1 stagiaire + 1 client 2)Parcours individuel (avec son Prix de Vente) 3)Un financement.
Projet poker 1/56. Introduction Présentation de léquipe Cadre du projet Enjeux Choix du sujet 2.
LES NOMBRES PREMIERS ET COMPOSÉS
VOC 1 CE2 Je sais utiliser des mots de la vie quotidienne.
Partie 1: Ondes et Particules.
Unit 4: Les animaux - Il y a - There is/are Unit 4: Les animaux.
La Saint-Valentin Par Matt Maxwell.
2 TP avec l ’aide d ’un modeleur 3D :
Unit 4: Les animaux Unit 4: Les animaux.
Représentation des systèmes dynamiques dans l’espace d’état
Représentation des systèmes dynamiques dans l’espace d’état
Représentation des systèmes dynamiques dans l’espace d’état
1.1 LES VECTEURS GÉOMÉTRIQUES
Le Sémiographe Outil générique pour effectuer des opérations texte sens texte ou texte sens actions
Tournoi de Flyball Bouin-Plumoison 2008 Tournoi de Flyball
Notre calendrier français MARS 2014
Chapitre 3 Syntaxe et sémantique.
C'est pour bientôt.....
Les Nombres 0 – 100 en français.
F L T R Université catholique de Louvain-la-Neuve Faculté de philosophie et lettres FLTR Faculté de Philosophie et Lettres Présentation décembre 2002 Réalisation:
LA GESTION COLLABORATIVE DE PROJETS Grâce aux outils du Web /03/2011 Académie de Créteil - Nadine DUDRAGNE 1.
Elaboré par M. NUTH Sothan 1. 2 Soit x, y et z des coordonnées cartésiennes à 3 dimension. G un ensemble de points dans le plan (u, v). Déf. : On appelle.
ECOLE DES HAUTES ETUDES COMMERCIALES MARKETING FONDAMENTAL
Traitement de différentes préoccupations Le 28 octobre et 4 novembre 2010.
ECOLE DES HAUTES ETUDES COMMERCIALES
ECOLE DES HAUTES ETUDES COMMERCIALES MARKETING FONDAMENTAL
Nom:____________ Prénom: ___________
CALENDRIER-PLAYBOY 2020.
Les Chiffres Prêts?
1 Formation à l’usage éco-performant de votre pc 1 ère Partie.
UHA-FST Année L1S1-2 Examen de janvier 2006 – Durée 90 minutes Introduction aux concepts de la Physique N° carte étudiant:………………… 1-Donnez votre.
Partie II: Temps et évolution Energie et mouvements des particules
MES STRATÉGIES DE LECTURE
Transcription de la présentation:

Memodata/CRISCO (CNRS) Utilité et Utilisations du Sémiographe Dominique DUTOIT Memodata/Crisco 10/12/2001 Memodata/CRISCO (CNRS)

Utilité du Sémiographe (0/5) Utilité du Sémiographe effets linguistiques : paraphrase effets cybernétiques : modèle de mémoire effet réels : changer de chaîne de télé, fournir une information 10/12/2001 Memodata/CRISCO (CNRS)

Utilité du Sémiographe (1/5) Utilité du Sémiographe Animer Le Dictionnaire Intégral (LDI) : lui faire produire au bon moment les bons sens ou les bons textes. LDI : toutes les façons de voir le lexique, dont la façon qui représentera le texte t selon une dimension(s) d d ’un besoin b. effets linguistiques : paraphrase effets cybernétiques : modèle de mémoire effet réels : changer de chaîne de télé, fournir une information 10/12/2001 Memodata/CRISCO (CNRS)

Memodata/CRISCO (CNRS) Utilité du Sémiographe LDI (2/5) LDI est (1) : universaliste : toutes les significations sont déclarées ainsi que leurs expressions. aprioriste : tous les effets potentiels des significations sont déclarés. U(avocat) : personne (Classe) qui … Droit (thème) A(avocat) : fct(U (personne), U(qui … Droit)) -- agent, animé… -- monde(s) du Droit 10/12/2001 Memodata/CRISCO (CNRS)

Memodata/CRISCO (CNRS) Utilité du Sémiographe LDI (3/5) LDI est (2) : De forme : graphe unique acyclique orienté fait de mondes dont chaque monde comprend des éléments de nature, prédication, usage, ... De fond : - un ensemble de micro-systèmes en interrelations (TST) - un ensemble de macro-système en interrelations (sémantique componentielle) - un ensemble de classes en relation de syntaxe 10/12/2001 Memodata/CRISCO (CNRS)

Memodata/CRISCO (CNRS) Utilité du Sémiographe (4/5) Animer LDI (1) Transformer les tissus de LDI en organes et voies de communication Adapter ces organes et voies aux tâches linguistiques Permettre à LDI de se voir en mouvement et de s ’adapter au contexte Exemples - fournir une étude différentielle de samouraï selon nippon ou chevalier ; de nippon selon samouraï ou chevalier ; de chevalier selon samouraï ou nippon... 10/12/2001 Memodata/CRISCO (CNRS)

Memodata/CRISCO (CNRS) Utilité du Sémiographe (5/5) Animer LDI (1 : ex) Soit le texte : samouraï … … nippon … … Dans ce texte samouraï est le samouraï japonais selon le prédicat Japon dans le corrélat nippon. Mais il reste à noter que : La classe \personne, les prédicats (une fois \personne retiré) \guerrier, \noble, \portant une armure (…) sont absents. Le grammème \nom est absent (si pas de dét. Ou autre). Soit le texte : samouraï … … chevalier … … Dans ce texte samouraï est le samouraï selon les classes \guerrier, \noble, \ce qui est cuirassé, \nom dans le corrélat chevalier. Mais il reste à noter que : du Japon est absent. 10/12/2001 Memodata/CRISCO (CNRS)

Faire comprendre LDI (2) Utilité du Sémiographe (5/5) Faire comprendre LDI (2) Comment structurer un dictionnaire intégral? Comment s ’assurer que LDI progresse? Comment rendre pensable que LDI se construira un jour tout seul? ET …..…Memodata étant une entreprise……... Comment réaliser rapidement un grand nombre d ’applications linguistiques efficaces en utilisant l ’environnement : DICTIONNAIRE INTEGRAL - SEMIOGRAPHE SenseAgent 10/12/2001 Memodata/CRISCO (CNRS)

Utilisations du Sémiographe (démos) Utilisation du Sémiographe (0/4) Utilisations du Sémiographe (démos) effets linguistiques : paraphrase effets cybernétiques : modèle de mémoire effet réels : changer de chaîne de télé, fournir une information 10/12/2001 Memodata/CRISCO (CNRS)

Memodata/CRISCO (CNRS) Utilisation du Sémiographe (0/4) effets linguistiques : paraphrase effets cybernétiques : modèle de mémoire effet réels : changer de chaîne de télé, fournir une information 10/12/2001 Memodata/CRISCO (CNRS)

Utilisation du Sémiographe (1/10) Conditions de la démo Pas de (re)compilation (~ 15’) --> Pas de test sur - la sensibilité du système ou sur sa spécialisation Pas d’apprentissage (hors domaine) Pas de grammaire (fonctions sémantiques seules) Développement : pas de demande d’explication en intention (traits sémantiques, sèmes selon Pottier) des résultats Ressources utilisées (démo Atala) Fonctions lexicales TST Non Concepts isotopiques Oui Connaissances CYC Non 10/12/2001 Memodata/CRISCO (CNRS)

Memodata/CRISCO (CNRS) Utilisation du Sémiographe (2/5) Utilisation du Sémiographe (2/10) Les fonctions de mots 20 API hyper/hypo, syn, ant, géo, lemme, trad, exp... Go 10/12/2001 Memodata/CRISCO (CNRS)

Memodata/CRISCO (CNRS) Utilisation du Sémiographe (2/5) Utilisation du Sémiographe (2/10) hyponymes de monnaie L’hyperonyme Nombre de réponses (selon la profondeur maximale) Temps de traitement (en milliseconde) Go 10/12/2001 Memodata/CRISCO (CNRS)

Memodata/CRISCO (CNRS) Utilisation du Sémiographe (2/5) Utilisation du Sémiographe (2/10) Hyponymes de personne Trop de réponses pour l’envoi à l’afficheur Go 10/12/2001 Memodata/CRISCO (CNRS)

Memodata/CRISCO (CNRS) Utilisation du Sémiographe (2/5) Utilisation du Sémiographe (2/10) Hyperonymes de yen L’affichage des numéros ne suffit pas pour traduire la profondeur du graphe. Les relations utilisées Go 10/12/2001 Memodata/CRISCO (CNRS)

Memodata/CRISCO (CNRS) Utilisation du Sémiographe (2/5) Utilisation du Sémiographe (2/10) Synonymes de monnaie Forme résumée avec perte d’info. dans l’affichage des niveaux de langue en jeu Go 10/12/2001 Memodata/CRISCO (CNRS)

Lieu contenu dans Cameroun Utilisation du Sémiographe (2/5) Utilisation du Sémiographe (2/10) Lieu contenu dans Cameroun La nature des lieux n’est pas affichée. Parfois on pourra la déduire de la relation. Le mieux resterait de demander le type de lieu. Go 10/12/2001 Memodata/CRISCO (CNRS)

Lieu contenant Cameroun Utilisation du Sémiographe (2/5) Utilisation du Sémiographe (2/10) Lieu contenant Cameroun Dans une discussion entre un camerounais et un Alien, l’Univers serait dynamiquement utile. L’intérêt des traits est bien sûr un phénomène strictement dynamique (contextuel, pragmatique,…) Go 10/12/2001 Memodata/CRISCO (CNRS)

Dérivé sémantique de rêver Utilisation du Sémiographe (2/5) Utilisation du Sémiographe (2/10) Dérivé sémantique de rêver Dérivation sémantique et non morphologique Fonction lexicale de fonction lexicale de ... Go 10/12/2001 Memodata/CRISCO (CNRS)

Lemmatisation de are (anglais) Utilisation du Sémiographe (2/5) Utilisation du Sémiographe (2/10) Lemmatisation de are (anglais) En anglais, are est aussi un nom. Six langues disponibles au plan des modèles Go 10/12/2001 Memodata/CRISCO (CNRS)

Conjugaison de montare (italien) Utilisation du Sémiographe (2/5) Utilisation du Sémiographe (2/10) Conjugaison de montare (italien) Choix d’un modèle (tr/int) Go 10/12/2001 Memodata/CRISCO (CNRS)

“Brother” de monter Go Non synonymes (ils sont sémantiquement Utilisation du Sémiographe (2/5) Utilisation du Sémiographe (2/10) “Brother” de monter Non synonymes (ils sont sémantiquement différents), certains verbes admettent des cas de substitution avec monter selon des traits de sens précis. Go 10/12/2001 Memodata/CRISCO (CNRS)

Memodata/CRISCO (CNRS) Utilisation du Sémiographe (2/5) Utilisation du Sémiographe (2/10) Expansion de monter Un script permet l’enchainement des diverses fonctions de mots. Comme pour l’alcool, attention aux abus! Go 10/12/2001 Memodata/CRISCO (CNRS)

Les fonctions sémantiques de phrase Utilisation du Sémiographe (3/10) Les fonctions sémantiques de phrase Des traitements de base La désambiguïsation lexico-sémantique (forme ) La réduction lexicale ( forme N) Extraction sémique ( forme ) 10/12/2001 Memodata/CRISCO (CNRS)

Memodata/CRISCO (CNRS) Utilisation du Sémiographe (4/10) La WSD : forme en  information sur le sens d’un énoncé probabilité P de résolution : 1/80 < P < 1/36) L’aviateur, abattu en plein vol, réussit à rejoindre ses lignes en manœuvrant un parachute probabilité P de résolution : 1/30982 < P < 1/900) 10/12/2001 Memodata/CRISCO (CNRS)

distance de monter à voiture Utilisation du Sémiographe (2/5) Utilisation du Sémiographe (4/10) distance de monter à voiture Sur cet exemple, le trait sémantique prendre place dans un véhicule sera sélectionné. Par conséquence, il sélectionnera le bon sens de monter. Réciproquement, plusieurs sens de voiture seront sélectionnés. Go 10/12/2001 Memodata/CRISCO (CNRS)

Memodata/CRISCO (CNRS) Utilisation du Sémiographe Forme N Forme N Réduction lexicale, dictionnaire à l’envers, forme en N… : différents noms pour un même principe… étalon de nos mesure! Passer d’une expression comportant plusieurs mots à une expression comportant moins de mots. Monnaie du Japon = yen Monnaie de Tokyo = yen Monnaie de Hiro Hito = yen 10/12/2001 Memodata/CRISCO (CNRS)

Memodata/CRISCO (CNRS) Utilisation du Sémiographe Forme N (suite) Forme N (suite) La réduction lexicale est une opération : Texte-->sens-->texte : le texte généré reflète les significations calculées du texte de départ. Dans les cas simples, elle dessine une forme en N : monnaie Isotope Japon Gen de Japon yen 10/12/2001 Memodata/CRISCO (CNRS)

Memodata/CRISCO (CNRS) Utilisation du Sémiographe Forme N (suite) Forme N (suite) Dans des cas plus compliqués, elle dessine une forme en “usine” : Seuls ceux qui voient l’avenir dans les sources prédisent convenablement le futur. P(ceux) = 1/10000 ceux Gen de ??? Isotope divination Voir l’avenir Isotope : source source qui 10/12/2001 Memodata/CRISCO (CNRS)

Go N de personne qui répare et vend des voitures Les dix mille Utilisation du Sémiographe (2/5) Utilisation du Sémiographe (4/10) N de personne qui répare et vend des voitures Les dix mille personnes humaines du dictionnaire sont classées selon ce que perçoit le système de la question. La fonction peut être de fonctionnement très fin et précis pour des domaines limités. Ici, elle fonctionne pour les 200.000 objets du Dictionnaire. Go 10/12/2001 Memodata/CRISCO (CNRS)

Utilisation du Sémiographe Forme  (5/10) forme  : extraction des traits contextuels de différence et de ressemblance. Depuis : samouraï Vers : chevalier Classème (contextuel) N. (grammème) . Dissymétrie (dissemblance) \Personnequi fait la guerre Dissymétrie (dissemblance) Symétrie (ressemblance) Sémantèmes (contextuel) Qui est du Japon Qui porte une armure Qui est noble 10/12/2001 Memodata/CRISCO (CNRS)

Utilisation du Sémiographe Forme  (6/10) Les fonctions de texte

Le résumé lexical d’un texte Utilisation du Sémiographe (7/10) Le résumé lexical d’un texte Principe : un texte traitant d’un sujet active abondamment tous les isotopes de ce sujet billard : [billard thème] [jouer thème] [adresse thème] [gagner thème] [salle thème]… Algorithme : activation d’isotopes, proximité Usage : indexation et filtrage Résultats : apporte un plus, très bons 10/12/2001 Memodata/CRISCO (CNRS)

Le routage, nomenclature... Utilisation du Sémiographe (8/10) Le routage, nomenclature... Principe : un texte doit être dirigé automatiquement vers une boîte à lettres comme : [guerre du kosovo] : guerre;kosovo Algorithme : activation ou proximité Résultats : peut être très bon pour les sujets référentiels, préférer match sur classe enrichi des brothers pour les structures actancielles 10/12/2001 Memodata/CRISCO (CNRS)

Memodata/CRISCO (CNRS) Utilisation du Sémiographe (9/10) Signature sémantique Principe : un texte doit être surchargé de lexiques désambiguïsant ses principaux mots. Billard (jeu), Billard (chirurgie), ... Algorithme : Sens-->texte Résultats : utile pour la recherche, ralenti l’indexation. 10/12/2001 Memodata/CRISCO (CNRS)

Comparaison de deux textes Utilisation du Sémiographe (10/10) Comparaison de deux textes Principe : un texte doit être surchargé de lexiques désambiguïsant ses principaux mots. Billard (jeu), Billard (chirurgie), ... Algorithme : Sens-->texte Résultats : utile pour la recherche, ralenti l’indexation. 10/12/2001 Memodata/CRISCO (CNRS)

Évolution du projet « Syntaxe Intégrale et Pragmatique Abstraite» 10/12/2001 Memodata/CRISCO (CNRS)

Memodata/CRISCO (CNRS) La pragmatique abstraite Pourquoi la bonne réponse à Quelle est la couleur du cheval blanc d’Henry IV ? est-elle toujours blanc? La syntaxe intégrale Concevoir des espaces indépendants de représentation des observations : indépendance des variables = clarté des concepts Inventer ou sélectionner des terminologies propres à chaque espace Concevoir les effets des projections en tant qu’application d’un espace sur l’autre. 10/12/2001 Memodata/CRISCO (CNRS)

Memodata/CRISCO (CNRS) 10/12/2001 Memodata/CRISCO (CNRS)

Memodata/CRISCO (CNRS) Syntaxe intégrale ou componentielle = déclaration de choses potentiellement vraies pour chaque espace (à définir) Sélection automatique des “matches” sur chaque espace par qqch comme le Sémiographe indépendamment de toute idée préconçue de stratégie unificatrice. Syntaxe à la fois analytique et générative (pas de processus) 10/12/2001 Memodata/CRISCO (CNRS)