La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Les entités nommées Alexandre Gefen (CNRS-Université Paris 4-Sorbonne)

Présentations similaires


Présentation au sujet: "Les entités nommées Alexandre Gefen (CNRS-Université Paris 4-Sorbonne)"— Transcription de la présentation:

1 Les entités nommées Alexandre Gefen (CNRS-Université Paris 4-Sorbonne)

2 Quest quune entité nommée ? Les unités nommées sont des unités lexicales sélectionnées pour leur intérêt sémantique : dates, unités, noms de lieux, etc. Elles sont à la fois difficilement compréhensibles en contexte et en même temps comparables à dautres éléments similaires.

3 Définition linguistique Définition (via N. Dufournaud) : – « Tous les éléments du langage définis par référence : les noms propres au sens classique, les noms propres dans un sens élargi mais aussi les expressions de temps et de quantité » (Friburger, 2006). NB vient de Kripke (désignateurs rigides)

4 Les noms Quatre types : – Personnes – Lieux – Les fonctions – Les organismes

5 Les valeurs Dates,heures Montants Numérotations

6 Pourquoi sintéresser aux EN? Utiliser les textes comme une base données : Mise en relation des textes Traitement type TAL, cartographie, index (facile avec XSLT) Suivi de tendance, veille Optimisation de recherche et moteur de recherche sémantique Production de savoir par inférence (classification de documents par exemple)

7 Utile avec par exemple : des dictionnaires des textes de références des textes très longs et complexes : ex. Le Grand Cyrus partie 1, livre 1Le Grand Cyrus partie 1, livre 1

8 En perspective : le web sémantique Le balisage des textes vise à les faire communiquer entre eux mais aussi à créer un web de données destiné à sintégrer au web sémantique

9 Exemples Navigateur ontologique basée sur SKOS : YAGO 2 YAGO 2 Fiches automatisée de Freebase : Henry Ford facts - FreebaseHenry Ford facts - Freebase DBpedia : extraction de Wikipedia : Exemples SPARQL - Dbpedia.fr Exemples SPARQL - Dbpedia.fr

10 Présuposé de la production dEN - un travail didentification (de balisage) manuel ou dans certains cas automatique -un travail dindexation et de documentation une catégorisation (arbre de connaissance ou même une ontologie)

11 Les problèmes de sémantisaion On cherche à définir la référence unique de lentitée que lon va nommer : différence avec le niveau sémantique : Alexandre Gefen=deux mots mais une seule entité Problèmes : orthographe et variantes, identité sociale, pseudonyme, limite imprécise entre les titres et les fonctions, changement de noms de lieux (Lutèce/Paris) ou de système de datation

12 Exemple classique Lancien premier ministre socialiste Lionel Jospin a confirmé, jeudi 28 septembre, sur RTL, quil ne sera pas candidat à linvestiture socialiste pour la présidentielle de 2007.

13 Par delà les noms propres, gestion de grands corpus dinformation en intégrant les fonctions, les organisations Lancien premier ministre socialiste

14 Dans la TEI

15 Dans la TEI : tout encoder avec balise générique La famille s'était alors retirée en banlieue, à Villemomble, mais Alfred aimait se rendre à Paris et un jour de 1917 alors qu'il sortait de la maison des Arts et Métiers il était tombé inanimé dans la rue.

16 Des balises spécialisées pour les noms propres et pour les personnes (regroupés en mais non imbriqués) pour les institutions (regroupés en et éventuellement imbriqués) pour les lieux (regroupés en et éventuellement imbriqués) pour les dates (avec attribut par exemple pour pour un intervalle de pour un intervalle de temps pour les calendriers)

17 Détails de nom de famille ou patronyme prénom generational name titre et avant-nom épithète particules nobiliaires

18 Le cas de PersName

19 PersName Très utile par exemple dans le TEI Header Peut être utilisé aussi dans le corps du texte Peut être limité à une référence externe sans sémantisation : Alexandre Gefen

20 Exemple avec Edward George Bulwer-Lytton, Baron Lytton of Knebworth

21 Exemple 2 avec des type (via N. Dufournaud) haute dame dame Suzanne de Bourbon dame de Rieux

22 De la balise à la référence, deux outils de pointage par attribut Par un code avec "moncode" permet de regrouper des entités nommées : Lou Burnard... L. Burnard

23 Exemple de définition externe Pour pointer vers une définition "maref " : Alex.... Alexandre Gefen.... M. Gefen Le détails se met dans : Alexandre Gefen Alexandre est chercheur...

24 Exemple de liste Alexandre Gefen Lou Burnard

25 Exemple de relation Alexandre Gefen Lou Burnard

26 Dinnombrables possibilités... Exemples exhaustifs (du dictionnaire à lindex en passanrt par la bibliographie) : Example: (personal name) Example: (personal name) Dautres présentations meilleures que la mienne : Data vs Text: encodage des entités non-textuelles ou tours.fr/actualites/TEI_index_ pdfData vs Text: encodage des entités non-textuelleswww.bvh.univ- tours.fr/actualites/TEI_index_ pdf

27 Exercice Faire votre fiche à lintérieur dun texte bref inventé en utilisant Extraire votre définition et Ajouter des relations familiales en utilisant et les attributs e Ajouter des événements biographiques en utilisant

28 Merci ! sorbonne.fr sorbonne.fr


Télécharger ppt "Les entités nommées Alexandre Gefen (CNRS-Université Paris 4-Sorbonne)"

Présentations similaires


Annonces Google