Introduction à la Recherche

Slides:



Advertisements
Présentations similaires
Qu’est-ce que LingPro ? LingPro est la branche ingénierie linguistique de i-KM La collaboration i-KM / LingPro est le résultat d’un partenariat sous forme.
Advertisements

Constitution de produits terminologiques à partir de corpus
Algèbre de composants : une approche fonctionnelle à la sémantique de documents Bart Lamiroy LORIA/INPL QGar - École des Mines de Nancy.
Département Informatique Responsable :M. Huchard Responsables adjoints : A. Jean-Marie, F. Koriche, P. Séébold.
Projet Sample Orchestrator Réunion plénière, 10 octobre 2007 SP2 - Indexation audio et navigation par le contenu Application prototype de navigation et.
Chapitre 6: Les procédures et les fonctions
Utilisation didactique des extractions lexicales des corpus
Ontologie, Méta-données, Sémiotiques
Analyse et structuration thématiques
Navigation Interactive dans les documents Brigitte Grau et Jean-Paul Sansonnet J.P. Fournier, N. Hernandez, M. Hurault-Plantet, J-C. Martin, G. Pitel,
Indexation textuelle : Systèmes de recherche d’informations
INTRODUCTION.
ETAPES DE LA RECHERCHE DOCUMENTAIRE
Reconnaissance de la parole
D’une thèse à une application commerciale
Vers une approche de construction de composants ontologiques pour le web sémantique – synthèse et discussion. Nesrine Ben Mustapha (RIADI, ENSI Tunis)
Un système de médiation basé sur les ontologies
Université Paris I – Panthéon Sorbonne
Projet Darties Groupe 2 15/12/2010.
Introduction à DOM Maroua Bouzid
Bouchra SOUKKARIEH Florence SEDES SIG - Université de Paul Sabatier
Annotations sémantiques pour le domaine des biopuces
Développement d’un réseau social professionnel
Système d’information, gestion du CDI et…
OIL & UPML DREVET - HUMBERT Introduction OIL : un langage de description dontologies UPML : un langage de description de systèmes à base.
FORMATION Deuxième module Objectifs :
Moteur de recherche d’information
Passage à l’écrit en sciences
MODULE 19 INTRODUCTION AU DOMAINE CONSTITUTION DES GROUPES.
Un modèle sémantique pour linteropérabilité de systèmes dinformation Equipe Ingénierie informatique et base de données – Laboratoire LE2I Université de.
Présentation du mémoire
24 Novembre 2006 Laboratoire dInformatique de Paris 6 Moteur de recherche XML pour la plateforme Outilex.
1 DTSI / Service Cognitique Robotique et Interaction OUTILEX Démonstrateur du CEA-LIST : moteur d'interrogation crosslingue (français, anglais, espagnol)
Le Sémiographe Outil générique pour effectuer des opérations texte sens texte ou texte sens actions
Introduction théorie et pratique
École de bibliothéconomie et des sciences de linformation 1 Gestion de linformation électronique (GIE) Maîtrise en sciences de linformation EBSI Université.
IFT6255 – Recherche d’information Jian-Yun Nie
Les techniques des moteurs de recherche
Ontologies pour l’astronomie
Par: Lisa Daigle-Blanchard, MS Professeure UMCS-Bathurst
28/05/20021 DOE : une mise en œuvre d’une méthode de structuration différentielle pour les ontologies Raphaël TroncyAntoine Isaac
Supports de formation au SQ Unifié
Algorithmes et Programmation
Pédagogie Générale Travaux pratiques Cartes conceptuelles.
DÉFINITIONS modules programmes chaînes de programmes
Mastère Professionnel Systèmes de Communication et Réseaux
Révision en rédaction. 1 Nolwenn Kerzreho 2008 Révision en rédaction Pourquoi ? Un problème (quel problème) ? Intervention des professionnels Conclusion.
La plateforme ETHNOSIRIS Une plateforme web sémantique de social tagging multilingue, multi- dialecte et polygraphe dédiée à la préservation participative.
Dominique LAURENT Patrick SEGUELA
Présentation Finale Spirit 07 / 03 / 2011 Groupe Vert 1 Equipe Verte.
Recherche d’information
23 Nov. 2005Colloque Médiathèques1 Nouvelles méthodes d’accès assisté à l’information Approches sémantiques Documents textuels et multimédia Patrice Enjalbert.
Présentation du développement du projet.  Introduction  Conception et méthodes  Developpement  Conclusion 2.
Présentation AICHA REVEL INGENIEUR D’ÉTUDE STERIA DEPARTEMENT TRD
Présentation Finale Spirit 07 / 03 / 2011 Groupe Vert 1 Equipe Verte.
L’enseignement de spécialité SLAM
Services en Text Mining. Introduction : Qui est Mentis ? Mentis a été fondée en 2005 comme une société spin-off du Laboratoire d'I ntelligence Artificielle.
TEXT MINING Fouille de textes
LA PRISE EN CHARGE DU TRAVAIL COOPÉRATIF
Projet Darties Groupe 2 15/12/2010. Objectifs fixés Réalisation de spécifications pour l’alimentation Travaux sur la partie restitution avec une démonstration.
Le Bac Vert Un outil de recyclage des objets et des documents.
Initiative pour une méthode publique  +33 (0) Référence Version.
Architectures articulant des représentations hétérogènes L’exemple de Gate (Mini tutoriel, journée Atala du 12 février 2005) Thierry Poibeau LIPN (CNRS.
Projet SwitcHome Cahier des charges techniques Adeline COUPE, Hélène DRAUX, Ismaïla GIROUX, Loïc TACHET.
R ETOURS SUR LE PROJET DISTIL ET PERSPECTIVES 2011 Sylvie Ranwez Gérard Dray.
Le langage SQL LA Plan 1. Introduction Rappels sur le modèle relationnel Les caractéristiques du langage SQL 2. Le Langage d'Interrogation des.
Introduction SGDBOO Sommaire Définition d’un SGBD (6 services)
Année Universitaire : 2013/2014 Réalisée par: Rahma DAIKHI Encadrants : M. Jean-Yves TIGLI M. Stéphane LAVIROTTE Au sein de : Laboratoire I3S, Equipe RAINBOW.
1 4th International Conference on Arabic Language Processing, May 2–3, 2012, Rabat, Morocco Titre Mohamed El Amine ABDERRAHIM Mohamed Alaedine ABDERRAHIM.
مادة : ديداكتيك الجغرافيا
Transcription de la présentation:

Introduction à la Recherche Indexation Sémantique Damien Levin Gaëtan Hervouet Louis-Alexandre Celton

Plan Introduction Notions Objectifs Première Partie : Etat de l’art Equipe Présentation Notions Indexation Corpus Ontologie Objectifs Première Partie : Etat de l’art Indexeur Sémantique Indexeur Syntaxique Seconde Partie : Conception d’une architecture modulaire Besoins Conception Implémentation Bilan Conclusion

Contexte L’équipe ATLAS-GDD

Notions Indexation : repérage des mots-clés significatifs (termes) et création des liens entre ces termes et le document indexé Introduction de ces notions Indexation : consiste à repérer des mots-clés significatifs dans un texte donné, permet d’avoir une représentation du document et savoir en gros de quoi il traite.

Notions Corpus : collections de documents. Exemple : Cranfield, 1400 documents rédigés en anglais au format HTML Ontologie : Modèle de données représentatif d’un ensemble de concepts Exemple : WordNet, base de données lexicale développée par des linguistes du laboratoire des sciences cognitives de l’Université de Princeton. Corpus : collection de données sur lesquels on lance une indexation. Cranfield en anglais car la plus complète Ontologie : avec les liens entre les différents concepts qui les relient.

Notions RIIO : indexeur sémantique développé par ATLAS-GDD Légende : Une ontologie restreinte, composée de douze concepts avec les liens de subsomption RIIO : indexeur sémantique développé par ATLAS-GDD Voici un exemple d’ontologie resteinte composée de 12 concepts

Objectifs Premier objectif : Lister des indexeurs sémantiques Second objectif : rendre le projet RIIO modulaire

Etat de l’art : Indexeur Syntaxique

Etat de l’art : Indexeur Sémantique

Conception d’une architecture modulaire Définitions

Conception d’une architecture modulaire Besoins Pouvoir utiliser indépendamment les différents modules : indexation syntaxique, expansion de requêtes L’utilisation des modules ne doit pas être fixe : aussi bien en local que en service. Première réunion avec Antho: Définition d’un module, decoupage de RIO en partie distinctes, indépendante les unes des autres Utilisation d’un module : librairie locale, service distant (exemple d’un module hébergé à l’autre bout du monde)

Conception d’une architecture modulaire

Conception d’une architecture modulaire Implémentation

Bilan Objectifs presque atteints Recherche indexeurs sémantiques peu fructueuse Conception modulaire MySIn Recherche peu fructueuse : remaniement de notre objectif avec un état de l’art des indexeurs syntaxiques ce qui nous a permis lors de notre seconde partie du projet dans le découpage modulaire de les intégrer au projet MySIn. Ce deuxième objectif a été atteint puisque toute l’analyse et la conception répondent aux critères de modularité et d’utilisation imposés. L’implémentation n’a pu être terminée car Anthony Ventresque n’a pas eu le temps d’utiliser l’architecture pour y remplir les briques restantes dont il disposait. Toutefois, elles possèdent toute une définition au sein du projet, il suffit alors d’adapter le code disponible pour que chaque module soit fonctionnel.

Conclusion Intégration au sein d’une équipe Connaitre les projets sur lesquels elle travaille Nouvelles méthodes de travail Enrichissement des connaissances Mode de fonctionnement d’un indexeur Webservice L’intégration au sein d’une équipe nécessite de connaitre les projets sur lesquels elle travail S’interesser à leur environnement de travail Nouvelle methode : reunion minimum toutes les 2 semaines pour avancement, travail en équipe svn Enrichissement des connaissances : Fonctionnement géénral d’un indexeur

Question ?