Télécharger la présentation
La présentation est en train de télécharger. S'il vous plaît, attendez
1
Marie-Noelle BESSAGNET
WORK PACKAGE 1: MODELS AND TOOLS ALLOWING TO SPECIFY AND TO BUILD SEARCH ENGINES DEDICATED TO GEOGRAPHIC INFORMATION (SPATIAL, TEMPORAL ET THEMATIC FACETS) Equipe T2I Laboratoire LIUPPA, UPPA Equipe IC3 Laboratoire IRIT, UPS MOANO 16/12/ 2010 BnF Marie-Noelle BESSAGNET MOANO 16 Décembre 2010
2
Expertise LIUPPA MOANO
3
Information extraction/Information retrieval
MOANO
4
Spatial Temporel Thématique Fonds Documentaire Chaîne de
Traitement sémantique Index Niveau 1 Recherche d’Information Scénarios d’Usages Interpréter Valider Extraire Spatial Interpréter Valider Extraire Temporel Chaîne de Traitement sémantique et statistique Interpréter Valider Extraire Thématique
5
Expertise IRIT MOANO
6
Ontologies, textes et web sémantique
Corpus de textes Ontologies à composante terminologique Construction d’ontologie Extraction d’information Recherche en botanique Perspectives Aide à la décision Ontologies Dynamiques Extraction de relations Construction et évolution Terminae, ANR Dafoe et Dynamo, 1 thèse SMAC Représentation des connaissances Autodiag, 1 thèse Outils d’extraction de relations Exploiter le langage : patrons lexico-syntaxique Exploiter la structure XML et la mise en forme (projet GEONTO) Relations sur plusieurs phrases : résolution d’anaphores MOANO
7
Expertise BnF Ressources Expertise indexation documentaire
Thésaurus RAMEAU Documents sur la botanique Expertise indexation documentaire MOANO
8
Les membres IRIT Nathalie AUSSENAC-GILLES, Mouna KAMEL BnF
LIUPPA Marie-Noelle BESSAGNET, Christian SALLABERRY IRIT Nathalie AUSSENAC-GILLES, Mouna KAMEL BnF Michel MINGAM MOANO
9
Découpage du WP1 WP 1.0 – Preliminary study of corpus features, end-users requirements and existing botanical ontologies Preliminary work should focus on identifying the ontologies available in botany to encourage their reuse to accelerate the construction of a new ontology WP 1.1: Development of methods and tools to extract concepts and relationships Preliminary study of corpora and reusable ontology to be used for botanical document annotation MOANO
10
Découpage du WP1 WP 1.2: Development of a thematic process to index text documents based on the produced ontology Tools for ontology-based indexing of botanical text MOANO
11
Découpage du WP1 WP 1.3 Development of a platform supporting the creation of descriptive notices (LIUPPA, BNF) ? Evolution de ce WP : outils d’aide à la validation de concepts par les ontologues MOANO
12
Place dans le projet : interactions
MOANO
13
Ontologie Pour faire simple, considérons l'exemple de la figure ci-dessus. On y voit une certaine « scène du monde ». La description de cette scène demande deux choses : (1) un vocabulaire non ambigu, aussi appelé vocabulaire conceptuel ou ontologie ; (2) une énonciation des faits de la scène, reposant sur l'utilisation du vocabulaire de l'ontologie. D'un point de vue pratique, une ontologie informatique permet, en particulier grâce aux travaux de l'intelligence artificielle symbolique sur les systèmes à base de connaissances et les moteurs d'inférence, d'implanter des mécanismes de raisonnement déductif, de classification automatique, de recherche d'information, et d'assurer l'interopérabilité entre plusieurs systèmes de ce type. Un exemple schématique d'ontologie : l'incontournable exemple des cubes. Source : MOANO
14
Etape 1 : création de l’ontologie
Une ontologie pour quoi faire? favoriser l'indexation conceptuelle automatique et la recherche de documents textuels sur la botanique (e.g., comptes rendus botaniques) ; faciliter la compréhension de la botanique (objectif pédagogique). Une ontologie de domaine : botanique Un préalable : Phase d'identification des ressources disponibles décrivent, respectivement, le vocabulaire lié à un domaine générique Elles donnent une représentation formelle des concepts du domaine étudié ainsi que des différentes relations qui lient ces derniers. Les ontologies sont surtout utilisées pour la représentation de connaissance et l’application de raisonnements sur ces connaissances MOANO
15
Etape 2 : un système de RI basé sur l’ontologie
Une ontologie pour quoi faire? Améliorer la requête de l’utilisateur; Aide à la décision MOANO
16
Ressource ontologique et processus de recherche d’information
Concept hierarchy, thesaurus, ontology, ... Document gathering Collection of documents Information need ----- ----- Indexing Analyse match In a U process of Information Retrieval, especially in the step of indexing documents and queries, external semantic resources could be used. They should be taxonomies, conceptual hierarchies or ontologies. They contain in general a shared and consensual vocabulary which could be used to enhance queries and documents representations. Documents representation Query representation ----- Retrieved documents Source Février URFIST Web sémantique N. Aussenac-Gilles
17
Un système de RI basé sur l’ontologie
Fonds Documentaire Chaîne de Traitement sémantique Index Requête Spatial Interpréter Valider Extraire Temporel Interpréter Valider Extraire Résultats Thématique Interpréter Valider Extraire MOANO
18
La botanique Compte-rendu de sortie botanique Récit
Corpus La botanique Compte-rendu de sortie botanique Récit Description de la flore vivant dans des biotopes à des périodes données « L’élément central est l’observation : c’est l’ensemble de données relatives à un ou plusieurs individus d’une même espèce observés sur un site à une certaine date par un observateur associé à un validateur / déterminateur, dans le cadre d’un ensemble d’observations appelé relevé. » MOANO
19
Extrait CR sortie botanique
Espace Thème : taxon Thème MOANO
20
Extrait CR sortie botanique
Espace : biotope Thème MOANO
21
Livres anciens « Le voyage de Tarbes, Première grande traversée des Pyrénées", aux éditions Loubatières, de Augustin Pyramus de Candolle. » Comment donner accès à ce contenu scientifique? Augustin Pyramus de Candolle ( ), botaniste. Muni d'un baromètre, il mesurait la hauteur des sommets qu'il gravissait ; mais il donne les hauteurs en toises, ce qui n'est pas vraiment pratique (1506 toises pour le Pic du Midi). MOANO
22
Livres anciens En 2007, un groupe de botanistes a refait cette traversée en 70 jours Evolution de la flore MOANO
23
Extrait de leur récit Le val d'Esquierry Nous partons à 6H45 du refuge d'Espingo pour rallier les Granges d'astau et rejoindre le reste de l'équipe dont nous étions séparés suite aux péripétie de la veille au port d'OO. Dans la descente, sur une falaise humide, nous trouvons une station à Saxifrage de Cluse d'une dizaine de pieds. Plante assez rare, Gérard précise qu'une station aurait été détruite lors de l'élargissement du sentier. Heureusement, la nature semble avoir encore quelques ressources. 8H15, arrivée au bivouac, nous retrouvons l'équipe. Nous mettons rapidement les échantillons d'herbier récoltés depuis trois jours dans la grande presse. Nous repartons vers 10H00 pour le val d'Esquierry. La montée à travers la prairie et la hêtraie est raide, mais assez courte. À la sortie, nous débouchons sur un immense vallon couvert de fleurs. Nous trouvons une prairie montagnarde pas encore pâturée. Nous relevons, comme de Candolle avant nous, le Millepertuis des montagnes, la Serratule fausse-centaurée, plante remarquable par la taille de son port et de son inflorescence et formant une population de quelques dizaines de pieds très localisée. taxon MOANO
24
Contexte : La botanique
Ouvrir l’accès à la connaissance (grand public, étudiants, décideurs, ...) au travers d’interfaces de recherche/navigation en texte. Exploiter les connaissances des experts présentes au sein des descriptions textuelles L’image a une place prépondérante en botanique : de nombreux croquis…. MOANO
25
Des images et des croquis
Le Millepertuis des montagnes, la Serratule fausse-centaurée, MOANO
26
Un concept : Le millepertuis plusieurs termes
Noms communs : Millepertuis, herbe de la Saint-Jean. Nom botanique : Hypericum perforatum, famille des hypéricacées ou clusiacées. Noms anglais : St. John’s Wort, SJW. MOANO
27
Des outils pour classer, indexer et rechercher
Thésaurus : RAMEAU Des référentiels taxonomiques pour la faune et la flore : : logiciel de gestion de bases de données naturalistes MOANO
28
Une taxonomie existante – Thésaurus Rameau
Une première base Une taxonomie existante – Thésaurus Rameau MOANO
29
Des questions? pour votre attention MOANO 16 Décembre 2010
Présentations similaires
© 2024 SlidePlayer.fr Inc.
All rights reserved.