Date / references Systèmes Terre et Interarmées Projet OUTILEX Rapport détude final Octobre 2006.

Slides:



Advertisements
Présentations similaires
Congrès national 13 septembre Les contributions.
Advertisements

1 Modéliser Ou comment RE-présenter sa connaissance.
Les référentiels de qualité et de contrôle du SI eSCM
Présenté à Par. 2 3Termes et définitions 3.7 compétence aptitude à mettre en pratique des connaissances et un savoir-faire pour obtenir les résultats.
INDICATEURS STATISTIQUES ET DEVELOPPEMENT TECHNOLOGIQUE
Manuel Qualité, Structure et Contenus – optionnel
Atelier d'appropriation Management des Processus
Classe : …………… Nom : …………………………………… Date : ………………..
THALES COMMUNICATIONS Projet RNRT SYMPATEX 14 ème réunion davancement E.N.S.T. Paris, 46, rue Barrault Paris 13 ème 01 octobre 2002.
Épreuve pratique en Terminale Mercatique
1 - Finalités et Objectifs
LYCEE CORMONTAIGNE LE 22 Mars 2007
Projet n°4 : Objecteering
Dalila CHIADMIIFISI TIC et le développement de la recherche scientifique Revue scientifique : le modèle du libre accès Dalila Chiadmi.
2002 Compétitif XMiner : Plate-forme de structuration texte libre multi-approches par balisage XML de Tags Actifs Lobjectif du projet est de développer.
Eric BONJOUR, Maryvonne DULMET
La politique de Sécurité
MISE EN LIGNE D’UNE ANNONCE POUR UN MAPA* SUR LE SITE DU BOAMP**
Rénovation STMG : programme de Management
1 Nicolas Fressengeas - Utilisation du calcul formel automatique dans l'enseignement de l'électromagnétisme Supélec - Campus de Metz Expérience lors du.
Les modes de paiement La traite FOUR CLIENT
Détermination des processus
Travaux pratiques sur Nooj
Point sur les « normes » AICC/SCORM
La mise en place du Règlement sur la diffusion de linformation Un travail déquipe.
PARTIE 3 : Le SYSTEME D’INFORMATION FUTUR
Initiation au système d’information et aux bases de données
Initiation au système d’information et aux bases de données
Control des objectifs des technologies de l’information COBIT
Le portail personnel pour les professionnels du chiffre
Pour mieux sy retrouver NOUVELLE TERMINOLOGIE NOUVEAUX FORMATS NOUVELLE FAÇON DE PLANIFIER SON ENSEIGNEMENT SÉMINAIRE APEC 14 OCTOBRE 2011 Marcelle Parr,
le profil UML en temps réel MARTE
Vuibert Systèmes dinformation et management des organisations 6 e édition R. Reix – B. Fallery – M. Kalika – F. Rowe Chapitre 1 : La notion de système.
Rappel au Code de sécurité des travaux 1 Code de sécurité des travaux Rappel du personnel initié Chapitre Lignes de Transport (Aériennes)
1 CLUB DES UTILISATEURS SAS DE QUÉBEC COMMENT TRANSFORMER UN PROGRAMME SAS EN TÂCHE PLANIFIÉE SOUS WINDOWS Présentation de Jacques Pagé STRiCT Technologies.
Recherche Documentaire et traitement de l’information
Modèle Logique de Données
Département de génie logiciel et des TI Université du Québec École de technologie supérieure Systèmes dinformation dans les entreprises Systèmes dinformation.
Management des systèmes d’information Conclusion
SYSTEMES D’INFORMATION
SCIENCES DE L ’INGENIEUR
Test bilan de calcul mental N°1 :
MOT Éditeur de modèles de connaissances par objets typés
IGL301 - Spécification et vérification des exgiences 1 Chapitre 2 Le processus dingénierie des exigences (ref : Bray chapitre 2)
Système d’information
OUTILEX Présentation des résultats
1 DTSI / Service Cognitique Robotique et Interaction OUTILEX Démonstrateur du CEA-LIST : moteur d'interrogation crosslingue (français, anglais, espagnol)
Démonstrateur Lingway
Date / references Research & Technology Démonstrateur Thales R&T Projet Outilex.
Prima-Web Janvier SERUVIRE Attaché SPP Intégration Sociale Avril 2005.
Page 1 / Titre / Auteur / Date / Confidentiel D? LA DEMARCHE COLLEGES METIER.
Thésaurus de lactivité gouvernementale Richard Parent 17 novembre 2006 Ressource de soutien à linteropérabilité sémantique.
Une approche documentaire de la diffusion sur Internet Journée WebÉducation Martin Sévigny / Irosoft / 14 mai 2009
SEMINAIRE DE CONTACT novembre 2008 Outils de gestion de projet.
NORMALISATION DES LANGAGES DE PROGRAMMATION des Automates Programmables Industriels CEI Jean-Jacques DUMÉRY -1-
NORMALISATION DES LANGAGES DE PROGRAMMATION des Automates Programmables Industriels CEI
JEE 5 F.Pfister 2 institut eerie JEE – Une plateforme serveur  Développement et exécution d'applications réparties.
1 Modèle pédagogique d’un système d’apprentissage (SA)
Rappel au Code de sécurité des travaux 1 Code de sécurité des travaux, 5 e édition, 2008 Rappel du personnel initié Chapitre Lignes de transport (Aériennes)
Mise en oeuvre et exploitation
Supports de formation au SQ Unifié
Réalisé par : Mr IRZIM Hédi Mr JRAD Firas
1 BEP métiers de l’électronique Déroulement de l’examen (Candidats scolarisés)
Dominique LAURENT Patrick SEGUELA
Thibault ROY Université de Caen / Basse-Normandie Laboratoire GREYC – Equipe ISLanD Apport d’outils d’informatique documentaire à l’analyse de forums de.
Services en Text Mining. Introduction : Qui est Mentis ? Mentis a été fondée en 2005 comme une société spin-off du Laboratoire d'I ntelligence Artificielle.
Le Traitement Automatique des Langues (TAL)
OBJECTIFS : STOP à la recopie fastidieuse SÆCI « Recherche Structurée » permet de récupérer des informations de documents quelconques d’après leur positionnement.
Apéro Techno Romain Maragou - Aliou Sow Web sémantique.
Transcription de la présentation:

date / references Systèmes Terre et Interarmées Projet OUTILEX Rapport détude final Octobre 2006

1 date / references Les informations contenues dans ce document sont la propriété exclusive du Groupe Thales. Elles ne doivent pas être divulguées sans l'accord écrit de Thales Systèmes Terre et Interarmées Contexte et Objectifs du document Ce document a été élaboré dans le cadre du projet Outilex, il présente le rapport détude final de Thales Communications

2 date / references Les informations contenues dans ce document sont la propriété exclusive du Groupe Thales. Elles ne doivent pas être divulguées sans l'accord écrit de Thales Systèmes Terre et Interarmées Contributions attendues de Thales Communications Pour rappel, les annexes technique et financière de Thales Communications ont été revues en mars 2005, suite au transfert du contrat Outilex par la société Kalima vers la société Thales Communications. Dans le cadre de ces révisions, les contributions de Thales Communications au projet Outilex ont été définies comme suit, à compter de la date du transfert : Développement de composants dextraction dinformation (grammaires locales et ressources associées) Dévelopement dun démonstrateur métier dans le domaine de lanalyse des incidents Les composants dextraction dinformation (grammaires locales et ressources associées) ont été développés pour le traitement des données du démonstrateur. Pour des questions de fourniture des données par le client, le démonstrateur métier intialement prévu portant sur lanalyse des incidents dans le domaine de l automobile na pas pu être développé dans le cadre du projet.

3 date / references Les informations contenues dans ce document sont la propriété exclusive du Groupe Thales. Elles ne doivent pas être divulguées sans l'accord écrit de Thales Systèmes Terre et Interarmées Contributions attendues de Thales Communications On sest donc orienté, en cours de projet et avec laccord du consortium, vers le développement dun démonstrateur métier portant sur lextraction dinformations dans des textes de type dépêches et rapports à des fins dalimentation dune base de connaissances, laquelle est exploitée par des outils danalyse de type réseaux sémantiques et data mining. Le domaine métier retenu est le domaine de la Sécurité Nationale. Les travaux réalisés ont principalement visé à tester et valider « lutilisabilité » de la plate- forme Outilex dans un contexte industriel, en vue de répondre à des besoins métier non triviaux

4 date / references Les informations contenues dans ce document sont la propriété exclusive du Groupe Thales. Elles ne doivent pas être divulguées sans l'accord écrit de Thales Systèmes Terre et Interarmées Les besoins

5 date / references Les informations contenues dans ce document sont la propriété exclusive du Groupe Thales. Elles ne doivent pas être divulguées sans l'accord écrit de Thales Systèmes Terre et Interarmées Les besoins en matière dextraction dinformation ont été spécifiés par les utilisateurs finaux Quatre grands types de besoins ont été définis : Extraction dentités nommées (personnes, organisations, lieux, dates et heures) Extraction de faits Extraction de marqueurs dambiance Détection de relations élémentaires entre les entités extraites En vue dêtre stockées dans la base de connaissances puis exploitées par les outils danalyse et de visualisation, les données extraites ont été normalisées graphiquement, syntaxiquement et sémantiquement, via lutilisation de grammaires de normalisation, de ressources lexicales et de processus de transformation des informations Besoins en matière dextraction dinformation

6 date / references Les informations contenues dans ce document sont la propriété exclusive du Groupe Thales. Elles ne doivent pas être divulguées sans l'accord écrit de Thales Systèmes Terre et Interarmées Corpus dexpérimentation Le corpus utilisé dans le cadre du démonstrateur est composé denviron un millier de rapports de divers organismes de renseignement portant sur la thématique des campagnes de fauchage OGM. Chaque rapport est composé de données structurées – objet, date, auteur, source - et dun texte. Pour des questions de confidentialité, les données structurées hors lobjet des rapports, ont été supprimées dans la version finale du démonstrateur.

7 date / references Les informations contenues dans ce document sont la propriété exclusive du Groupe Thales. Elles ne doivent pas être divulguées sans l'accord écrit de Thales Systèmes Terre et Interarmées Aperçu du démonstrateur implémenté

8 date / references Les informations contenues dans ce document sont la propriété exclusive du Groupe Thales. Elles ne doivent pas être divulguées sans l'accord écrit de Thales Systèmes Terre et Interarmées Schéma du démonstrateur Les données dentrée du démonstrateur sont constituées de données non structurées et de données structurées - données signalétiques associées aux textes (date, source, auteur, … ) – Ces données sont couplées aux données structurées issues des processus dextraction dinformation et exploitées par les outils danalyse.

9 date / references Les informations contenues dans ce document sont la propriété exclusive du Groupe Thales. Elles ne doivent pas être divulguées sans l'accord écrit de Thales Systèmes Terre et Interarmées Etape 1 : Extraction dinformation

10 date / references Les informations contenues dans ce document sont la propriété exclusive du Groupe Thales. Elles ne doivent pas être divulguées sans l'accord écrit de Thales Systèmes Terre et Interarmées Exemple Entités Nommées/Personnes

11 date / references Les informations contenues dans ce document sont la propriété exclusive du Groupe Thales. Elles ne doivent pas être divulguées sans l'accord écrit de Thales Systèmes Terre et Interarmées Exemple Détection de Relations Certaines relations élémentaires ont été identifiées via les grammaires locales. Il sagit principalement de relations telles que personne/fonction, personne/date de naissance, personne /lieu de naissance, personne/adresse, etc ….

12 date / references Les informations contenues dans ce document sont la propriété exclusive du Groupe Thales. Elles ne doivent pas être divulguées sans l'accord écrit de Thales Systèmes Terre et Interarmées Etape 2 : Gestion des Connaissances

13 date / references Les informations contenues dans ce document sont la propriété exclusive du Groupe Thales. Elles ne doivent pas être divulguées sans l'accord écrit de Thales Systèmes Terre et Interarmées Gestion des connaissances Le processus dextraction permet dalimenter des formulaires dans lesquels sont renseignées les entités et les relations entres entités

14 date / references Les informations contenues dans ce document sont la propriété exclusive du Groupe Thales. Elles ne doivent pas être divulguées sans l'accord écrit de Thales Systèmes Terre et Interarmées Gestion des connaissances Les informations extraites permettent dalimenter automatiquement une base de connaissances, sur laquelle les utilisateurs effectuent des requêtes. Dans lexemple ci-dessous, on visualise les informations biographiques associées à une Personne en exploitant notamment les relations entre entités

15 date / references Les informations contenues dans ce document sont la propriété exclusive du Groupe Thales. Elles ne doivent pas être divulguées sans l'accord écrit de Thales Systèmes Terre et Interarmées Etape 3 : Mining

16 date / references Les informations contenues dans ce document sont la propriété exclusive du Groupe Thales. Elles ne doivent pas être divulguées sans l'accord écrit de Thales Systèmes Terre et Interarmées Des processus danalyse statistiques sont utilisées en vue de faire létude quantitative et qualitative des données analysées

17 date / references Les informations contenues dans ce document sont la propriété exclusive du Groupe Thales. Elles ne doivent pas être divulguées sans l'accord écrit de Thales Systèmes Terre et Interarmées Aperçu des composants Outilex implémentés

18 date / references Les informations contenues dans ce document sont la propriété exclusive du Groupe Thales. Elles ne doivent pas être divulguées sans l'accord écrit de Thales Systèmes Terre et Interarmées Grammaires locales Les ressources grammaticales ont été implémentées au format Outilex. La grammaire ci-dessous est la grammaire dextraction des entités nommées et des faits. En sortie danalyse, les informations extraites sont étiquetées par des balises indiquant leur type.

19 date / references Les informations contenues dans ce document sont la propriété exclusive du Groupe Thales. Elles ne doivent pas être divulguées sans l'accord écrit de Thales Systèmes Terre et Interarmées Identification des relations - Jose Bové Responsable Faucheurs Volontaires José Bové, responsable des Faucheurs Volontaires

20 date / references Les informations contenues dans ce document sont la propriété exclusive du Groupe Thales. Elles ne doivent pas être divulguées sans l'accord écrit de Thales Systèmes Terre et Interarmées Ressources lexicales Les ressources lexicales Métier ont été implémentées au format Unitex, puis converties au format Outilex. Les regroupements appliquées aux informations extraites sont effectués à partir de processus de normalisation élémentaires (2 janvier 2005/02/01/2005), de dictionnaires et de règles de grammaires conféderation paysanne,.NP+ActeurOrg conféderation paysanne (PREP DPT)* (PREP REGION)* GROUPE DE MILITANTS ANTI-OGM Niveau morpho-syntaxique Regroupement sémantique

21 date / references Les informations contenues dans ce document sont la propriété exclusive du Groupe Thales. Elles ne doivent pas être divulguées sans l'accord écrit de Thales Systèmes Terre et Interarmées Conclusions

22 date / references Les informations contenues dans ce document sont la propriété exclusive du Groupe Thales. Elles ne doivent pas être divulguées sans l'accord écrit de Thales Systèmes Terre et Interarmées Lexpérimentation réalisée a permis de valider lintérêt de la plate-forme sur les points suivants : Reprise de lexistant en termes de ressources grammaticales et lexicales (Format Unitex notamment) Développement rapide de nouveaux composants Intérêt de la normalisation des formats des ressources linguistiques Logiciel libre et communauté dutilisateurs La pondération sur les grammaires na pas été testée, il est clair néanmoins quil sagit dun point fort. La taille du corpus dexpérimentation ne permet pas de se prononcer sur les performances en termes de temps de traitement de la plate-forme.