La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Annotation et métadonnées Gaëlle Hignette, AgroParisTech

Présentations similaires


Présentation au sujet: "Annotation et métadonnées Gaëlle Hignette, AgroParisTech"— Transcription de la présentation:

1 Annotation et métadonnées Gaëlle Hignette, AgroParisTech

2 06/11/2008 Annotations et métadonnées - Gaëlle Hignette2 Plan du cours Annotations et métadonnées, définitions Annotation manuelle Annotation semi-automatique Annotation non supervisée Références

3 06/11/2008 Annotations et métadonnées - Gaëlle Hignette3 Plan du cours Annotations et métadonnées, définitions Annotation manuelle Annotation semi-automatique Annotation non supervisée Références

4 06/11/2008 Annotations et métadonnées - Gaëlle Hignette4 Définitions: annotation Langage courant (dictionnaire le Robert): Note critique ou explicative quon écrit sur un texte, un livre En informatique: Commentaire (libre) rattaché à un document ou une portion de document Utilisé dans les bases documentaires, les collecticiels… Concept (prédéfini) rattaché à une portion de document Utilisé pour la recherche et lextraction dinformation

5 06/11/2008 Annotations et métadonnées - Gaëlle Hignette5 Définitions: métadonnées Langage courant: Néologisme Métalangage: langage qui décrit un autre langage (dit « primaire ») En informatique: Données informatives sur les données courantes ex. auteur, date de modification, …

6 06/11/2008 Annotations et métadonnées - Gaëlle Hignette6 Et le web sémantique? Métadonnées dans le web sémantique Dublin Core Annotations dans le web sémantique Langages du web sémantique peu adaptés à lannotation au sein du texte Annotations stockées en en-tête de document ou dans un moteur à part, avec pointeurs Annotation de documents provenant du web En vue dune application précise Stockage local Format au choix, souvent XML

7 06/11/2008 Annotations et métadonnées - Gaëlle Hignette7 Exemple dannotation Dublin Core Le document HTML Dublin Core Metadata Initiative - Home Page Lannotation en RDF dans le fichier dcDesc.dcxml Dublin Core Metadata Initiative - Home Page The Dublin Core Metadata Initiative Web site text/html en The Dublin Core Metadata Initiative

8 06/11/2008 Annotations et métadonnées - Gaëlle Hignette8 Exemple dannotation utilisant des pointeurs

9 06/11/2008 Annotations et métadonnées - Gaëlle Hignette9 Exemple dannotation à lintérieur du document The Semsem team Members Jack KR......

10 06/11/2008 Annotations et métadonnées - Gaëlle Hignette10 Plan du cours Annotations et métadonnées, définitions Annotation manuelle Qui doit annoter? Quelques outils daide à lannotation Annotation semi-automatique Annotation non supervisée Références

11 06/11/2008 Annotations et métadonnées - Gaëlle Hignette11 Annotation manuelle par l'auteur Charge de travail supportable Métadonnées: génération automatique possible Annotation: au fil de la création du texte À condition de disposer d'outils faciles d'utilisation Mais parfois inutilisable L'auteur ne sait pas comment on va vouloir utiliser ce qu'il publie => quoi annoter? Choix de l'ontologie

12 06/11/2008 Annotations et métadonnées - Gaëlle Hignette12 Annotation par "l'utilisateur" Reprendre tout le web existant: impossible en annotation manuelle Annotation par commentaire libres destinées à la lecture par des humains: nécessairement manuelle, liée à lutilisation Annotation manuelle par des concepts prédéfinis indispensable comme base pour les techniques d'apprentissage Disponibilité de nombreux outils daide à lannotation

13 06/11/2008 Annotations et métadonnées - Gaëlle Hignette13 Plan du cours Annotations et métadonnées, définitions Annotation manuelle Qui doit annoter? Quelques outils daide à lannotation Annotation semi-automatique Annotation non supervisée Références

14 06/11/2008 Annotations et métadonnées - Gaëlle Hignette14 Cadixe, annotation en XML Pour des fichiers texte Annotation au fil de la lecture Insertion des tags XML dans le désordre, mais tags guidés par une DTD Rendu graphique personnalisable Vérification après-coup de la conformité à la DTD Stockage local des annotations en XML

15 06/11/2008 Annotations et métadonnées - Gaëlle Hignette15 Cadixe: copie décran

16 06/11/2008 Annotations et métadonnées - Gaëlle Hignette16 CREAM, annotation en RDF Pour des fichiers HTML 3 modes dannotation Indépendamment de la page, directement dans léditeur dontologie À la lecture, de léditeur de page vers léditeur dontologie À lécriture, de léditeur dontologie à léditeur de page Stockage des annotations dans la page (en-tête en RDF) et/ou dans un serveur dannotations permettant le raisonnement

17 06/11/2008 Annotations et métadonnées - Gaëlle Hignette17 CREAM: exemple

18 06/11/2008 Annotations et métadonnées - Gaëlle Hignette18 CREAM: annotation dune page existante

19 06/11/2008 Annotations et métadonnées - Gaëlle Hignette19 CREAM: création dune page à partir de lontologie

20 06/11/2008 Annotations et métadonnées - Gaëlle Hignette20 Annotea, annotations pour le travail collaboratif Outil du W3C Annotations textuelles par des auteurs Stockage des annotations en XHTML, métadonnées des annotations dans des serveurs RDF ou index local Intégration directe dans un browser spécifique: Amaya Intégration dans le browser Mozilla: Annozilla

21 06/11/2008 Annotations et métadonnées - Gaëlle Hignette21 Annotea: screenshot

22 06/11/2008 Annotations et métadonnées - Gaëlle Hignette22 Et le multimédia... Vannotea: annotation collaborative de vidéos M-OntoMat-Annotizer: extension de CREAM pour lannotation de vidéos outils de Mindswap: annotation dimages, d s, de HTML et texte Open Ontology Forge: outil de création dontologies et dannotation type CREAM – intégration de lannotation dimages et de texte

23 06/11/2008 Annotations et métadonnées - Gaëlle Hignette23 M-OntoMat-Annotizer: screenshot

24 06/11/2008 Annotations et métadonnées - Gaëlle Hignette24 Plan du cours Annotations et métadonnées, définitions Annotation manuelle Annotation semi-automatique Définition de règles pour lannotation Algorithmes dapprentissage Systèmes dannotation semi-automatique Annotation non supervisée Références

25 06/11/2008 Annotations et métadonnées - Gaëlle Hignette25 Définition de règles pour lannotation Règles spécifiques à un domaine, écrites par un expert Extraction dentités nommées (noms de personnes, de compagnies, dates...) Extraction basée sur une structure de documents redondante Extraction basée sur des contextes linguistiques

26 06/11/2008 Annotations et métadonnées - Gaëlle Hignette26 Extraction dentités nommées Généralement basée sur une combinaison de dictionnaire et dexpressions régulières Tâche de base pour des extractions dinformation de plus haut niveau Proposé dans la plateforme GATE: chaîne de traitement ANNIE tokenizer sentence splitter gazetteer NE transducer

27 06/11/2008 Annotations et métadonnées - Gaëlle Hignette27 Mapping de structure avec Lixto Création dune classe Choix graphique dun exemple Création automatique dun pattern possibilité de modifier manuellement le pattern Test du pattern possibilité de montrer dautres exemples pour affiner le pattern Eléments définis les uns par rapport aux autres

28 06/11/2008 Annotations et métadonnées - Gaëlle Hignette28 Lixto: screenshot

29 06/11/2008 Annotations et métadonnées - Gaëlle Hignette29 Règles linguistiques avec EXCOM Relations linguistiques indépendantes du domaine lien de causalité rencontre entre personnes formulation dune hypothèse, dune conclusion etc. Basé sur la présence dun indicateur fort, puis dindices contextuels permettant la désambiguation Gros effort en linguistique impliqué

30 06/11/2008 Annotations et métadonnées - Gaëlle Hignette30 Plan du cours Annotations et métadonnées, définitions Annotation manuelle Annotation semi-automatique Définition de règles pour lannotation Algorithmes dapprentissage Systèmes dannotation semi-automatique Annotation non supervisée Références

31 06/11/2008 Annotations et métadonnées - Gaëlle Hignette31 Annotation par apprentissage Annotation manuelle d'une base d'exemples Application d'un algorithme d'apprentissage Annotation automatique ou semi-automatique des documents restants Risque d'erreur Minimisation de l'effort d'annotation

32 06/11/2008 Annotations et métadonnées - Gaëlle Hignette32 Boosted Wrapper Induction Freitag & Kushmerick, 2000 Fonctionnement concept par concept Tâche de classification des limites Début: cet espace entre deux mots est-il le début d'une instance du concept? Fin: cet espace entre deux mots est-il la fin d'une instance du concept? Matching début/fin: longueur probable

33 06/11/2008 Annotations et métadonnées - Gaëlle Hignette33 BWI: Détecteurs de limites Un pattern est un motif à repérer dans le texte Ex. [Melle ] reconnaîtra Melle Dupond, Melle Chapitre, Melle Hignette… Un détecteur est constitué de deux patterns: avant limite et après limite Ex. [Melle][ ] Un détecteur a une confiance Melle Dupond

34 06/11/2008 Annotations et métadonnées - Gaëlle Hignette34 BWI: Définition du wrapper Le wrapper est constitué de un ensemble de détecteurs de limite de début, un ensemble de détecteurs de limite de fin, une fonction de distribution de longueur H: N [0,1] H(k)=Prob("champ a k mots")

35 06/11/2008 Annotations et métadonnées - Gaëlle Hignette35 BWI: Classification Chaque espace entre deux mots reçoit un score de limite de début et un score de limite de fin: Score = somme des confiances des détecteurs qui reconnaissent cet espace Une instance est reconnue entre les espaces i et j si Score debut (i)*Score fin (j)*H(j-i)>t t: paramètre de réglage précision/couverture

36 06/11/2008 Annotations et métadonnées - Gaëlle Hignette36 BWI: Boosting Temps 0: tous les exemples positifs ont le même poids Boucler tant qu'on a moins de T détecteurs choisir un détecteur changer le poids des exemples: plus de poids aux exemples positifs non encore couverts ou aux négatifs couverts par erreur

37 06/11/2008 Annotations et métadonnées - Gaëlle Hignette37 BWI: choix des détecteurs Initialement: détecteur sans préfixe ni suffixe À chaque étape on ajoute un mot ou généralisation au préfixe et au suffixe Maximiser sqrt(poids vrais positifs) - sqrt(poids faux positifs) Arrêt quand l'extension ne permet pas d'éliminer plus de faux positifs / longueur max de pattern atteinte

38 06/11/2008 Annotations et métadonnées - Gaëlle Hignette38 BWI: avantages Bonne précision Couverture: l'union fait la force Fonctionne sur texte libre ou structuré Généralisations: initialement prévu pour des informations de casse mais peut tenir compte d'un pré-traitement (ex. reconnaissance de prénoms, dates, classe grammaticale, etc.)

39 06/11/2008 Annotations et métadonnées - Gaëlle Hignette39 (LP) 2 Ciravegna 2001 Algorithme conçu pour tenir compte d'un pré- processing: forme grammaticale, dictionnaires, entités nommées Règles d'insertion de tags ouvrants et de tags fermants Meilleures règles Règles contextuelles Règles de correction Validation: suppression des tags orphelins

40 06/11/2008 Annotations et métadonnées - Gaëlle Hignette40 (LP) 2 : meilleures règles pour chaque exemple Pattern générateur = w mots avant, w mots après le tag Retenir les k meilleures généralisations taux d'erreur = erreur/succès < seuil plus de matches, moins d'erreurs suppression des règles redondantes retirer les exemples couverts par les règles continuer tant qu'il reste des exemples à couvrir

41 06/11/2008 Annotations et métadonnées - Gaëlle Hignette41 (LP) 2 : règles contextuelles Seuil de taux d'erreur exigeant Très bonne précision Couverture faible Augmenter la couverture sans trop perdre de précision Appliquer les "meilleures règles" Utiliser les tags créés pour la génération des patterns Exemples utilisés = ceux qui ne sont pas couverts par les meilleures règles Typiquement: fermeture d'un tag…

42 06/11/2008 Annotations et métadonnées - Gaëlle Hignette42 (LP) 2 : règles de correction Tags insérés parfois mal placés Règles permettant de déplacer un tag de maximum w positions fenêtre de w mots autour du tag mal placé meilleures k généralisations du pattern avec tags action = déplacement du tag dans la fenêtre

43 06/11/2008 Annotations et métadonnées - Gaëlle Hignette43 Plan du cours Annotations et métadonnées, définitions Annotation manuelle Annotation semi-automatique Définition de règles pour lannotation Algorithmes dapprentissage Systèmes dannotation semi-automatique Annotation non supervisée Références

44 06/11/2008 Annotations et métadonnées - Gaëlle Hignette44 SemTag Annotation des instances définies dans une ontologie ex. « Michael Jordan » Désambiguation par le contexte (n mots avant, n mots après) jugements humains sur certains contextes mesures statistiques sur la fréquence des mots ex. Michael Jordan, arguably the greatest player in basketball history... Professor Michael Jordan

45 06/11/2008 Annotations et métadonnées - Gaëlle Hignette45 S-CREAM: Semi-automatic CREAtion of Metadata Creation de la base d'exemples: annotation manuelle dans CREAM Extraction d'information par Amilcare, basé sur (LP) 2 Préprocessing par Annie Détection des phrases Forme grammaticale Dictionnaire Entités nommées Création des relations entre instances

46 06/11/2008 Annotations et métadonnées - Gaëlle Hignette46 De l'extraction d'information aux métadonnées relationnelles Hôtel de la Chasse 13 rue de l'Orée du Bois Trégoulec Tel Bienvenue sur le site de l'hôtel de la chasse. Nous sommes ouverts du 15 mars au 15 novembre. Le prix d'une nuit en chambre simple est de 32 euros, une nuit en chambre double vous coûtera 40 euros. Amilcare hôtel CP ville telephone prix devise date CREAM Hôtel de la chasse INSTANCE_OF hotel Hôtel de la chasse LOCALITE ville1 ville1 INSTANCE_OF ville ville1 NOM Trégoulec Ville1 CP Hôtel de la chasse PROPOSE_PRIX p1 Hôtel de la chasse PROPOSE_PRIX p2 p1 INSTANCE_OF prix p1 VALEUR 32 p1 DEVISE euros p2 INSTANCE_OF prix p2 VALEUR 40 p2 DEVISE euros

47 06/11/2008 Annotations et métadonnées - Gaëlle Hignette47 De l'extraction d'information aux métadonnées relationnelles Méthode ad-hoc, dépend de la tâche dannotation à réaliser Définition du concept maître Création des instances du concept maître Rattachement de toutes les autres instances à linstance-maître Par typage Par proximité Par remplissage Règles ad-hoc daggrégation dattributs

48 06/11/2008 Annotations et métadonnées - Gaëlle Hignette48 MnM Instances et attributs, mais pas de relations entre instances Interface graphique simple Apprentissage via Amilcare Lien direct entre information extraite et attributs Correction manuelle

49 06/11/2008 Annotations et métadonnées - Gaëlle Hignette49 MnM: screenshot

50 06/11/2008 Annotations et métadonnées - Gaëlle Hignette50 Melita Fonctionne sur le même principe que MnM Permet de régler le degré dintrusion de lautomatique par rapport au manuel

51 06/11/2008 Annotations et métadonnées - Gaëlle Hignette51 Melita: screenshot

52 06/11/2008 Annotations et métadonnées - Gaëlle Hignette52 Plan du cours Annotations et métadonnées, définitions Annotation manuelle Annotation semi-automatique Annotation non supervisée Utilisation de la redondance sur le web Annotation de tableaux de données Références

53 06/11/2008 Annotations et métadonnées - Gaëlle Hignette53 Armadillo: principe Basé sur la redondance de linformation sur le web Reconnaissance des instances dune classe ambiguë grâce à sa sur-classe et les classes en relation exemple: classe recherchée = Universitaire sur-classe = Personne, facile à trouver grâce aux systèmes dextraction dentités nommées classes en relation: Université (relation Travaille dans), Article (relation Ecrit par) définition: Universitaire = Personne qui Travaille dans une Université, avec au moins un Article Ecrit par cette Personne

54 06/11/2008 Annotations et métadonnées - Gaëlle Hignette54 Armadillo: fonctionnement Point de départ: « oracle » i.e. données certaines sur une classe source, en relation avec la classe à annoter (ex. liste des universités) Identification des candidats: instances de la sur-classe en lien avec la classe source (ex. personnes dans les pages dune université) Classification des candidats par utilisation des autres classes liées (ex. sites bibliographiques)

55 06/11/2008 Annotations et métadonnées - Gaëlle Hignette55 KnowItAll Motifs linguistiques dextraction indépendants du domaine ex: « such as » great cities such as Paris, London or Berlin philosophers such as Socrates and Platon Possibilité dévaluer la confiance dans les motifs sur une base dexemples Augmentation de la couverture en réutilisant les données extraites par ces motifs

56 06/11/2008 Annotations et métadonnées - Gaëlle Hignette56 KnowItAll: augmentation de la couverture Par apprentissage de motifs dextraction spécifiques au domaine Par extraction des sous-classes scientists such as mathematicians, physicists and chemists philiosophical mathematicians such as Leibniz and Lambert Par extraction de listes

57 06/11/2008 Annotations et métadonnées - Gaëlle Hignette57 Plan du cours Annotations et métadonnées, définitions Annotation manuelle Annotation semi-automatique Annotation non supervisée Utilisation de la redondance sur le web Annotation de tableaux de données Références

58 06/11/2008 Annotations et métadonnées - Gaëlle Hignette58 Annotation de tableaux Annotation de tableaux de données Ressources: une ontologie du domaine des tableaux à annoter But de lannotation: Recherche des relations sémantiques représentées par le tableau Rapprochement des valeurs symboliques du tableau avec les termes de lontologie

59 06/11/ Prérequis: lontologie micro- organismes produits alimentaires Escherichia E. coli E. coli O157 Bacillus B. cereus pathogen UHT milkpasteurized milk milk pasteurized UHT milk types symboliques types numériques pH: pas dunités, [0,14] etc... Temperature: °C ou °F, pas dintervalle de valeurs relations

60 06/11/2008 Annotations et métadonnées - Gaëlle Hignette60 Example de tableau à annoter MicroorganismMinimum Growth Temperature Maximum Growth Temperature Bacillus cereus 5°C 55°C Enterotoxigenic Escherichia coli 7°C 46°C titres de colonnes relations sémantiques colonne symboliquecolonnes numériques

61 06/11/2008 Annotations et métadonnées - Gaëlle Hignette61 Etapes de lannotation dun tableau Distinction entre colonnes symboliques et numériques Calcul des scores de similarité entre termes de lontologie et termes issus du web Reconnaissance du type des colonnes numériques Reconnaissance des relations représentées par le tableau Reconnaissance du type des colonnes symboliques Instanciation des relations pour chaque ligne du tableau

62 06/11/2008 Annotations et métadonnées - Gaëlle Hignette62 Etape 1: Reconnaissance des colonnes numériques et symboliques Sur chaque cellule, compter le nombre dindices numérique sûr: nombre en notation scientifique ou nombre suivi dune unité indice numérique: nombre ou unité indice symbolique: mot qui nest ni une unité ni un indicateur de résulat absent Déterminer le type de la cellule numérique si la cellule contient au moins un numérique sûr ou plus dindices numériques que dindices symboliques Déterminer le type de la colonne numérique si au moins la moitié des cellules sont numériques

63 06/11/2008 Annotations et métadonnées - Gaëlle Hignette63 Etape 1: exemple ProductsSamples tested Positive for Campylobacter (%) YearReference Chilled chicken Gill and Harris, 1984 Chicken products 1320 (approx – not specified) /1 994 Campbell and Gilbert, 1995 symb. num. inconnu symb.num. symb.

64 06/11/2008 Annotations et métadonnées - Gaëlle Hignette64 Quels termes de lontologie représentent le mieux le terme du web? => calcul dun score de similarité entre le terme du web et chacun des termes de lontologie Les termes sont transformés en vecteurs pondérés Les axes de coordonées représentent lensemble de tous les mots lemmatisés possibles Les valeurs des coordonnées représentent le poids de chaque mot dans le terme termes de lontologie: poids défini manuellement termes du web: poids de 1 sur chaque mot Mesure de similarité = cosinus de langle entre deux vecteurs Etape 2: Annotation de termes du web par des termes de lontologie

65 06/11/2008 Annotations et métadonnées - Gaëlle Hignette65 similarité entre « minced beef » et « minced poultry » : similarité entre « minced beef » et « ground beef »: coordonnées terme mincebeefpoultryground WEB: minced beef1100 ONTOLOGY: minced poultry ONTOLOGY: ground beef Etape 2: exemple sur un nom daliment

66 Minced beef Chorizo (low- acid fermented sausage) Smoked salmon minced poultry: 0.1 ground beef: 0.5 lactic acid bacteria: 0.3 fermented milk: 0.3 smoked sausage: 0.4 dried sausage: 0.4 fresh sausage: 0.4 smoked sausage : 0.1 smoked salmon: 1.0 smoked fish: 0.1 Sommes des similarités aliment : 0.6 aliment : 1.5 aliment : 1.2 similarités microorganisme: 0.0 microorganisme: 0.3 microorganisme: 0.0 ALIMENT Pour la colonne: score contenu (aliment)=3/3, score contenu (microorganisme)=0/3 Etape 3a: Reconnaissance du type dune colonne symbolique: score de contenu

67 06/11/2008 Annotations et métadonnées - Gaëlle Hignette67 Etape 3a: Reconnaissance du type dune colonne symbolique: choix du type Calcul de score titre, score dun type daprès le titre de la colonne = similarité entre titre de la colonne et nom du type Calcul du score final: score final = 1 – (1-score contenu )(1-score titre ) Choix du type de meilleur score pour la colonne (au moins x% supérieur au deuxième meilleur)

68 Etape 3 b: Reconnaissance du type dune colonne numérique D-reduction at 50°C 10 min 30 sec 15 min Repérage des unités °C min sec fait partie dun couple nombre-unité dans le titre Types possibles selon les unités D value storage time 0.5 : 0.5 Types possibles selon le titre D value : 0.5 Pour la colonne, score(type)=1-(1-score unité (type))(1-score titre (type)) si les valeurs dans la colonne sont compatibles score(D value) = 1 - (1-0.5)(1-0.5) = 0.75 score(storage time) = 1- (1-0.5)(1-0) = 0.5

69 06/11/2008 Annotations et métadonnées - Gaëlle Hignette69 Etape 4: reconnaissance des relations - exemple StrainMin pH Max pH Min temperature Max temperature ATCC °C40°C NCIB °C35°C Table 2: Conditions of growth for Clostridium botulinum inconnu pH Temperature Chercher les relations de lontologie dont le type résultat a été reconnu parmi les colonnes du tableau

70 06/11/2008 Annotations et métadonnées - Gaëlle Hignette70 InconnupH Temperature Relation du web: Relations de lontologie: Conditions of growth for Clostridium botulinum RelationSignatureScore sur les colonnes Score sur le titre Score final Growth parameter - pH pH Microorganism 1/ Product property - pH pH Food product 1/200.5 Growth parameter - Temperature Temperature Microorganism 1/ Etape 4: exemple (suite)

71 06/11/2008 Annotations et métadonnées - Gaëlle Hignette71 Etape 5: instanciation des relations Annotation sous forme de sous-ensembles flous Sous-ensemble classique: chaque élément x de lensemble de définition appartient ou nappartient pas au sous-ensemble Sous-ensemble flou: chaque élément x de lensemble de définition appartient au sous- ensemble avec un degré dappartenance (x) compris entre 0 et 1

72 06/11/2008 Annotations et métadonnées - Gaëlle Hignette72 Etape 5a: instanciation des symboliques Toutes les correspondances trouvées sont conservées à condition quelles correspondent au type de la colonne Sémantique de similarité cooked turkey :

73 06/11/2008 Annotations et métadonnées - Gaëlle Hignette73 Etape 5b: instanciation des numériques Rassemblement de toutes les colonnes contenant le même type Sémantique doptimalité Sémantique dimprécision

74 06/11/2008 Annotations et métadonnées - Gaëlle Hignette74 Etape 5b: optimalité Définit une plage dacceptabilité et une plage doptimalité reconnaissance de mots-clefs dans les titres de colonnes (Minimum, Maximum, Optimum) Exemple SpeciespH MinpH Opt pH Max Bacillus cereus

75 06/11/2008 Annotations et métadonnées - Gaëlle Hignette75 Etape 5b: imprécision Sémantique par défaut si aucune sémantique doptimalité na été trouvée intervalle dans une cellule – expression régulière moyenne+écart-type dans une cellule – expression régulière moyenne+écart-type dans deux colonnes – mot clef valeur précise

76 06/11/2008 Annotations et métadonnées - Gaëlle Hignette76 Plan du cours Annotations et métadonnées, définitions Annotation manuelle Annotation semi-automatique Annotation non supervisée Références

77 06/11/2008 Annotations et métadonnées - Gaëlle Hignette77 Références Cadixe: Le projet Caderige, Catégorisation Automatique de Documents pour l'Extraction de Réseaux d'Interactions GEniques CREAM: S. Handschuh, S. Staab, R. Studer. Leveraging metadata creation for the Semantic Web with CREAM. KI ' Advances in Artificial Intelligence. Proc. of the Annual German Conference on AI, R. Kruse et al., Springer, Berlin, SEP 2003 LIXTO: R. Baumgartner, O. Frölich, G. Gottlob, P. Harz, M. Herzog, P. Lehmann. Web Data Extraction for Business Intelligence: the Lixto Approach. BTW Annotea: J. Kahan, M. Koivunen, E. Prud'Hommeaux, and R. Swick. Annotea: An Open RDF Infrastructure for Shared Web Annotations. In Proc. of the WWW10 International Conference. Hong Kong, BWI: D. Freitag and N. Kushmerick. Boosted wrapper induction. In Proc. of the 17th National Conference on Artificial Intelligence AAAI- 2000, pages , 2000.

78 06/11/2008 Annotations et métadonnées - Gaëlle Hignette78 Références (2) (LP) 2 : Fabio Ciravegna. (LP) 2, Rule Induction for Information Extraction using Linguistic Constraints. Technical Report no CS-03-07, University of Sheffield, September 2003 SemTag: Stephen Dill, Nadav Eiron, David Gibson, Daniel Gruhl, Ramanathan Guha, Anant Jhingran, Tapas Kanungo, Sridhar Rajagopalan, Andrew Tomkins, John Tomlin, Jason Zien. SemTag and Seeker: Bootstrapping the semantic web via automated semantic annotation, WWW2003 MnM: M. Vargas-Vera, E. Motta, J. Domingue, M. Lanzoni, A. Stutt, F. Ciravegna. MnM: Ontology Driven Semi-Automatic and Automatic Support for Semantic Markup. The 13th International Conference on Knowledge Engineering and Management (EKAW 2002), ed Gomez- Perez, A., Springer Verlag, 2002 Melita: Fabio Ciravegna, Alexiei Dingli, Daniela Petrelli and Yorick Wilks : User-System Cooperation in Document Annotation based on Information Extraction The 13th International Conference on Knowledge Engineering and Management (EKAW 2002), ed Gomez- Perez, A., Springer Verlag, 2002

79 06/11/2008 Annotations et métadonnées - Gaëlle Hignette79 Références (3) Armadillo: Norton, B., Chapman, S., & Ciravegna, F. (2005). The Semantic Web : Research and Applications, chapter Orchestration of Semantic Web Services for Large-Scale Document Annotation, (pp. 649–663). Springer. KnowItAll: Etzioni, Cafarella, Downey, Popescu, Shaked, Soderland, Weld, & Yates (2005). Unsupervised named-entity extraction from the web : an experimental study. Artificial Intelligence,165(1), 91–134.


Télécharger ppt "Annotation et métadonnées Gaëlle Hignette, AgroParisTech"

Présentations similaires


Annonces Google