La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Marie-Noelle BESSAGNET

Présentations similaires


Présentation au sujet: "Marie-Noelle BESSAGNET"— Transcription de la présentation:

1 Marie-Noelle BESSAGNET
WORK PACKAGE 1: MODELS AND TOOLS ALLOWING TO SPECIFY AND TO BUILD SEARCH ENGINES DEDICATED TO GEOGRAPHIC INFORMATION (SPATIAL, TEMPORAL ET THEMATIC FACETS) Equipe T2I Laboratoire LIUPPA, UPPA Equipe IC3 Laboratoire IRIT, UPS MOANO 16/12/ 2010 BnF Marie-Noelle BESSAGNET MOANO 16 Décembre 2010

2 Expertise LIUPPA MOANO

3 Information extraction/Information retrieval
MOANO

4 Spatial Temporel Thématique Fonds Documentaire Chaîne de
Traitement sémantique Index Niveau 1 Recherche d’Information Scénarios d’Usages Interpréter Valider Extraire Spatial Interpréter Valider Extraire Temporel Chaîne de Traitement sémantique et statistique Interpréter Valider Extraire Thématique

5 Expertise IRIT MOANO

6 Ontologies, textes et web sémantique
Corpus de textes Ontologies à composante terminologique Construction d’ontologie Extraction d’information Recherche en botanique Perspectives Aide à la décision Ontologies Dynamiques Extraction de relations Construction et évolution Terminae, ANR Dafoe et Dynamo, 1 thèse SMAC Représentation des connaissances Autodiag, 1 thèse Outils d’extraction de relations Exploiter le langage : patrons lexico-syntaxique Exploiter la structure XML et la mise en forme (projet GEONTO) Relations sur plusieurs phrases : résolution d’anaphores MOANO

7 Expertise BnF Ressources Expertise indexation documentaire
Thésaurus RAMEAU Documents sur la botanique Expertise indexation documentaire MOANO

8 Les membres IRIT Nathalie AUSSENAC-GILLES, Mouna KAMEL BnF
LIUPPA Marie-Noelle BESSAGNET, Christian SALLABERRY IRIT Nathalie AUSSENAC-GILLES, Mouna KAMEL BnF Michel MINGAM MOANO

9 Découpage du WP1 WP 1.0 – Preliminary study of corpus features, end-users requirements and existing botanical ontologies Preliminary work should focus on identifying the ontologies available in botany to encourage their reuse to accelerate the construction of a new ontology WP 1.1: Development of methods and tools to extract concepts and relationships Preliminary study of corpora and reusable ontology to be used for botanical document annotation MOANO

10 Découpage du WP1 WP 1.2: Development of a thematic process to index text documents based on the produced ontology Tools for ontology-based indexing of botanical text MOANO

11 Découpage du WP1 WP 1.3 Development of a platform supporting the creation of descriptive notices (LIUPPA, BNF) ? Evolution de ce WP : outils d’aide à la validation de concepts par les ontologues MOANO

12 Place dans le projet : interactions
MOANO

13 Ontologie Pour faire simple, considérons l'exemple de la figure ci-dessus. On y voit une certaine « scène du monde ». La description de cette scène demande deux choses : (1) un vocabulaire non ambigu, aussi appelé vocabulaire conceptuel ou ontologie ; (2) une énonciation des faits de la scène, reposant sur l'utilisation du vocabulaire de l'ontologie. D'un point de vue pratique, une ontologie informatique permet, en particulier grâce aux travaux de l'intelligence artificielle symbolique sur les systèmes à base de connaissances et les moteurs d'inférence, d'implanter des mécanismes de raisonnement déductif, de classification automatique, de recherche d'information, et d'assurer l'interopérabilité entre plusieurs systèmes de ce type. Un exemple schématique d'ontologie : l'incontournable exemple des cubes. Source : MOANO

14 Etape 1 : création de l’ontologie
Une ontologie pour quoi faire? favoriser l'indexation conceptuelle automatique et la recherche de documents textuels sur la botanique (e.g., comptes rendus botaniques) ; faciliter la compréhension de la botanique (objectif pédagogique). Une ontologie de domaine : botanique Un préalable : Phase d'identification des ressources disponibles décrivent, respectivement, le vocabulaire lié à un domaine générique Elles donnent une représentation formelle des concepts du domaine étudié ainsi que des différentes relations qui lient ces derniers. Les ontologies sont surtout utilisées pour la représentation de connaissance et l’application de raisonnements sur ces connaissances MOANO

15 Etape 2 : un système de RI basé sur l’ontologie
Une ontologie pour quoi faire? Améliorer la requête de l’utilisateur; Aide à la décision MOANO

16 Ressource ontologique et processus de recherche d’information
Concept hierarchy, thesaurus, ontology, ... Document gathering Collection of documents Information need ----- ----- Indexing Analyse match In a U process of Information Retrieval, especially in the step of indexing documents and queries, external semantic resources could be used. They should be taxonomies, conceptual hierarchies or ontologies. They contain in general a shared and consensual vocabulary which could be used to enhance queries and documents representations. Documents representation Query representation ----- Retrieved documents Source Février URFIST Web sémantique N. Aussenac-Gilles

17 Un système de RI basé sur l’ontologie
Fonds Documentaire Chaîne de Traitement sémantique Index Requête Spatial Interpréter Valider Extraire Temporel Interpréter Valider Extraire Résultats Thématique Interpréter Valider Extraire MOANO

18 La botanique Compte-rendu de sortie botanique Récit
Corpus La botanique Compte-rendu de sortie botanique Récit Description de la flore vivant dans des biotopes à des périodes données « L’élément central est l’observation : c’est l’ensemble de données relatives à un ou plusieurs individus d’une même espèce observés sur un site à une certaine date par un observateur associé à un validateur / déterminateur, dans le cadre d’un ensemble d’observations appelé relevé. » MOANO

19 Extrait CR sortie botanique
Espace Thème : taxon Thème MOANO

20 Extrait CR sortie botanique
Espace : biotope Thème MOANO

21 Livres anciens « Le voyage de Tarbes, Première grande traversée des Pyrénées", aux éditions Loubatières, de Augustin Pyramus de Candolle. » Comment donner accès à ce contenu scientifique? Augustin Pyramus de Candolle ( ), botaniste. Muni d'un baromètre, il mesurait la hauteur des sommets qu'il gravissait ; mais il donne les hauteurs en toises, ce qui n'est pas vraiment pratique (1506 toises pour le Pic du Midi). MOANO

22 Livres anciens En 2007, un groupe de botanistes a refait cette traversée en 70 jours Evolution de la flore MOANO

23 Extrait de leur récit Le val d'Esquierry Nous partons à 6H45 du refuge d'Espingo pour rallier les Granges d'astau et rejoindre le reste de l'équipe dont nous étions séparés suite aux péripétie de la veille au port d'OO. Dans la descente, sur une falaise humide, nous trouvons une station à Saxifrage de Cluse d'une dizaine de pieds. Plante assez rare, Gérard précise qu'une station aurait été détruite lors de l'élargissement du sentier. Heureusement, la nature semble avoir encore quelques ressources. 8H15, arrivée au bivouac, nous retrouvons l'équipe. Nous mettons rapidement les échantillons d'herbier récoltés depuis trois jours dans la grande presse. Nous repartons vers 10H00 pour le val d'Esquierry. La montée à travers la prairie et la hêtraie est  raide, mais assez courte. À la sortie, nous débouchons sur un immense vallon couvert de fleurs. Nous trouvons une prairie montagnarde pas encore pâturée. Nous relevons, comme de Candolle avant nous, le Millepertuis des montagnes, la Serratule fausse-centaurée, plante remarquable par la taille de son port et de son inflorescence et formant une population de quelques dizaines de pieds très localisée. taxon MOANO

24 Contexte : La botanique
Ouvrir l’accès à la connaissance (grand public, étudiants, décideurs, ...) au travers d’interfaces de recherche/navigation en texte. Exploiter les connaissances des experts présentes au sein des descriptions textuelles L’image a une place prépondérante en botanique : de nombreux croquis…. MOANO

25 Des images et des croquis
Le Millepertuis des montagnes, la Serratule fausse-centaurée, MOANO

26 Un concept : Le millepertuis plusieurs termes
Noms communs : Millepertuis, herbe de la Saint-Jean. Nom botanique : Hypericum perforatum, famille des hypéricacées ou clusiacées. Noms anglais : St. John’s Wort, SJW. MOANO

27 Des outils pour classer, indexer et rechercher
Thésaurus : RAMEAU Des référentiels taxonomiques pour la faune et la flore : : logiciel de gestion de bases de données naturalistes MOANO

28 Une taxonomie existante – Thésaurus Rameau
Une première base Une taxonomie existante – Thésaurus Rameau MOANO

29 Des questions? pour votre attention MOANO 16 Décembre 2010


Télécharger ppt "Marie-Noelle BESSAGNET"

Présentations similaires


Annonces Google