Prolexbase : Un dictionnaire relationnel multilingue de noms propres

Slides:



Advertisements
Présentations similaires
PARIS La ville lumiere.
Advertisements

Approche graphique du nombre dérivé
Livret d’Histoire, Géographie, Sciences et Instruction civique
Le Géoportail Partenaires API Géoportail Site thématique Conclusion.
Proposition de recherches sur ABI (Pro Quest) Lise Herzhaft (Urfist de Lyon) et MH Prévoteau (Bibliothèque Université Paris 2) Mise en forme par Nolwenn.
UNIVERSITÉ PARIS 3 ─ SORBONNE NOUVELLE
Questions de revue Chapitre Les Premières Nations et les Inuits ont vécu en Amérique depuis quand? Les Premières Nations et les Inuits ont vécu.
XML - Henry Boccon-Gibod 1 XML, Langage de description Ontologie pour les nuls.
Urbanisation de Système d'Information
1 La démarche expérimentale en Physique El-Mokhtar RAY (Université Paris 12)
Lycée MICHELET MARSEILLE
SYSTRAN Un outil du TAL Victoria AUPERT Marjorie LORSUNG.
Les outils du TAL Par RIGAUD Anaïs RALLIER Armelle SANTIAGO Gwendoline
Par Aline Mahot et Charlyne Routier
Combien d’Irlandais ont quitté leur pays pour vivre aux Etats-Unis
Défi écriture BEF Couverture. Défi écriture BEF Page 1.
Voyage en France: 11 au 22 juin 2010
Comment remplir le dossier d’inscription pour la classe de SECONDE ?
Travaux pratiques sur Nooj
1 7 Langues niveaux débutant à avancé. 2 Allemand.
5 Verbes au passé composé 1.Jai eu avoir 2. Jai du devoir.
Vers une approche de construction de composants ontologiques pour le web sémantique – synthèse et discussion. Nesrine Ben Mustapha (RIADI, ENSI Tunis)
1 VISITE GUIDÉE… Linstitution S.O.S Amitié S.O.S Amitié dans votre région Les appels Lécoute à S.O.S Amitié Lécoutant.
Université Paul Sabatier - Toulouse 3 - Département de GMP Enquête Insertion Professionnelle – Promotion
Un établissement de taille adaptée (562 élèves) : 6 classes de Seconde (32 à 35 élèves) 6 classes de Première (L, ES, S, STI2D) 6 classes de Terminale.
Les grandes villes françaises
Formation Centra - GDE.
La Voie Professionnelle. 2 Formation à temps plein dans un lycée professionnel Formation par alternance (apprentissage) : établissement de formation +
Alexandria, cest quoi ?. Des mots aux idées… Voici un dictionnaire multilingue pour votre site web. Il s'appelle Alexandria. C'est le premier du genre.
Initiation aux bases de données et à la programmation événementielle
OLAP : Un pas vers la navigation
juin 2011 : mise en place dune équipe danimation mandatée par lévêque du diocèse Son rôle : animer et coordonner la mise en œuvre de la démarche.
Claudia Maldonado Vivian Hemming Amparo Seaton
Envol 8Unité 14. Envol 8Unité 14 Bon – meilleur – le meilleur Bien – mieux – le mieux 1Claude nage beaucoup... que Jacques.mieux 2Mais Jacques est...
Recommandations et procédure d’attribution de DOI
La communication de ce document est soumise à autorisation de France Télécom R&D (Nom du fichier) - D1 - 01/03/2000 France Télécom R&D Énoncé Représentation.
Cairn.info Chercher : Repérer : Progresser 13/01/ { } Revues et diffusion des savoirs scientifiques : retour d’expérience de Cairn.info
Traducteur Technique en Interne Christophe Jovelin DESS ILTS 2005
L’identité et les nationalités
Les pays, les capitales et les nationalités
F L T R FLTR Faculté de Philosophie et Lettres - Christian Ruell - Equipe inf. fac. - mars 2006 UCL – LLN Université Catholique de Louvain à Louvain-la-Neuve.
Cours de Base de Données & Langage SQL
Le Sémiographe Outil générique pour effectuer des opérations texte sens texte ou texte sens actions
Web sémantique : Web de demain
Forum des Industries de la Langue, 17 mars 2010
CUME 330: Didactique des études sociales à lélémentaire Les ressources dapprentissage et la recherche dans les outils de Présenté par David Martin Préparé.
Introduction à lutilisation des corpus 1. Quest-ce quun corpus? Alexandra VOLANSCHI
Introduction à l’utilisation des corpus 1. Qu’est-ce qu’un corpus?
Quelle est la langue officielle de ce pays? japonais.
Modèle Logique de Données (MLD)
F L T R Université catholique de Louvain-la-Neuve Faculté de philosophie et lettres FLTR Faculté de Philosophie et Lettres Présentation décembre 2002 Réalisation:
ESPAGNE ANGLETERRE CORÉE DU SUD ÉTATS-UNIS JAPON PASCAL EDISON EINSTEIN MENDEL LYCÉE À OPTION NGUYEN THI MINH KHAI GROUPE DE LANGUES ÉTRANGÈRES SECTION.
Introduction.
By Sarah, Gary, Sarah, Jennifer
Comment introduire des données dans la base de données « recherche » des FUNDP © Collège des scientifiques - Faculté de Droit.
Oui, je suis hollandaise Oui, je suis chinois Oui, je suis chinoise
WIKIPEDIA ZHE DONG. Sommaire INTRODUCTION Bref historique Fonctionnement et concepts Wikimedia Foundation Projets publics Projets internes CONCLUSION.
PARIS La ville lumiere IIIième partie.
Méthodologie pour la structuration semi- automatique d’un corpus lexicographique bilingue : le cas du dictionnaire français-kabyle Mahfoud MAHTOUT Université.
1 Lionel Bargeot, ENESAD,13 Décembre 2006 IGCS et l'interopérabilité Colloque du 13 décembre 2006 Lionel Bargeot responsable régional du programme IGCS.
Direction de la normalisation terminologique (DNT) Mai 2010 La terminologie : une passion, des métiers !
France Bilodeau et Catherine Lamy 17 octobre 2014 La recherche dans les bases de données Repère, Cairn, Érudit et Google Scholar.
Agenda de la présentation
Langue française I module A
Moteur de recherche sémantique basé sur les fonctions lexicales
LA LITTERATURE au cycle 3 Stage littérature C3 JARNY – nov Présentation D. Cardinal IEN Briey2-Jarny avril 2004.
Progression/Programmation – Français (1/3)
LYCÉE JOŽE PLEČNIK LJUBLJANA Hana Radilovič, 4. G.
Architectures articulant des représentations hétérogènes L’exemple de Gate (Mini tutoriel, journée Atala du 12 février 2005) Thierry Poibeau LIPN (CNRS.
Les Rivières La Seine La Loire Le Rhône La Garonne Le Rhin.
Transcription de la présentation:

Prolexbase : Un dictionnaire relationnel multilingue de noms propres Denis Maurel1, Mickaël Tran1, Thierry Grass2, Duško Vitas3 1Université François-Rabelais de Tours, LI 2Université François-Rabelais de Tours, L&R 3Faculté des Mathématiques de Belgrade

Un lexique sémantique

Elle est commune aux langues traitées. Sémantique La sémantique de notre dictionnaire s’appuie sur une ontologie autour du nom propre conceptuel et de ses relations. Elle est commune aux langues traitées.

Une ontologie multilingue de noms propres Pivot : le nom propre conceptuel AR : Adjectif relationnel NR : Nom relationnel

Le nom propre conceptuel Œuvre Produit Ergonyme Fête Histoire Manifestation Pragmonyme Edifice Vaisseau Voie Toponyme Catastrophe Météorologie Astronyme Géonyme Hydronyme Célébrité Patronyme Prénom Pseudo anthroponyme Anthroponyme Association Ensemble Entreprise Institution Organisation Ville Ergonyme Toponyme Pays Région Supranational • Point de vue diachronique : Saint-Pétersbourg et Leningrad • Point de vue diastratique : Parigot et Parisien • Point de vue diatextuel : Cité phocéenne et Marseille • Point de vue diatopique : Nantes et Naoned Un nom propre conceptuel ne correspond pas au référent linguistique, mais à un certain point de vue sur ce référent. Historique Religieux Fictif Un nom propre conceptuel est hyponyme d’un type et d’une essence. 26 types et 4 supertypes hyperonymes 3 essences

Les relations • Synonymie : Saint-Pétersbourg et Leningrad Cité phocéenne et Marseille • Méronymie : Tours  Région Centre  France LU  Danone France  Onu la Prise de la Bastille  la Révolution française Un lien vers d'autres dictionnaires (langue générale, par exemple Eurowordnet) est prévu par une relation d’export. • Prédication : Paris est la capitale de la France Ray Norda est le patron de Novell Jacques Chirac est le locataire de l'Elysée Aaron est le frère de Moïse

Un lexique morphosyntaxique

Elle est particulière à une langue donnée. Morphosyntaxe La morphosyntaxe de notre dictionnaire est construite autour du prolexème associé à des grammaires locales . Elle est particulière à une langue donnée.

La partie particulière à une langue donnée Le niveau linguistique regroupe les lemmes correspondant à un même nom propre dans une langue donnée : le Prolexème. Les formes fléchies constituent le niveau des instances.

Exemple

Des exemples de grammaire locale Au niveau des expansions : Au niveau des prédicats :

La traduction Un système de TA doit donc être basé non sur des dictionnaires bilingues (ni, à plus forte raison, multilingues) mais sur […] des descriptions lexicales de différentes langues effectuées d’après les mêmes principes. Blanco X. (2001), Dictionnaires électroniques et traduction automatique espagnol-français, Langages, 143:66 Beograaninov est un dérivé de Belgrade (un adjectif possessif)

Les anaphores Relation de prédication Paris accueille avec perplexité l’initiative de Tony Blair... Les discussions qui ont eu lieu sur ce sujet en Grande-Bretagne…, laissent penser que Londres cherche à tirer les leçons de la Bosnie et de l’Albanie… La Grande-Bretagne et la France, qui ont opéré de manière très étroite, seraient dans une position délicate si les Américains venaient à se retirer… Les Britanniques, qui ont eu des échanges avec Washington sur leur nouvelle initiative, pensent que les États-Unis pourraient revoir leur position. Paris accueille avec perplexité l’initiative de Tony Blair... Les discussions qui ont eu lieu sur ce sujet en Grande-Bretagne…, laissent penser que Londres cherche à tirer les leçons de la Bosnie et de l’Albanie… La Grande-Bretagne et la France, qui ont opéré de manière très étroite, seraient dans une position délicate si les Américains venaient à se retirer… Les Britanniques, qui ont eu des échanges avec Washington sur leur nouvelle initiative, pensent que les États-Unis pourraient revoir leur position. Dérivation

L’implantation

La structure de Prolexbase

Les interfaces Consultation avancée Simple recherche Bientôt disponible sur http://tln.li.univ-tours.fr/

Quelques chiffres… La base vient seulement d’être installée, mais des données sont prêtes à être rentrées. En anglais, hollandais, français, italien, allemand, grec, portugais espagnol et russe : ● 838 noms géographique ● 766 entreprises ● 2635 prénoms ● 520 humains collectifs ● 7306 villes ● 502 pays ● 818 habitants En français : ● Plus de 323 000 entrées ● et 55 000 liens relationnels

Des projets d’applications… Recherche d'information Indexation Aide à la traduction Traduction automatique Alignement de textes multilingues Correction d’orthographe… Pour ces applications, il sera possible d’interroger la base par un échange de fichiers XML

Merci !