1 DTSI / Service Cognitique Robotique et Interaction OUTILEX Démonstrateur du CEA-LIST : moteur d'interrogation crosslingue (français, anglais, espagnol) Romaric Besançon 24/11/2006
2 DTSI / Service Cognitique Robotique et Interaction Moteur d'interrogation crosslingue du CEA-LIST
3 DTSI / Service Cognitique Robotique et Interaction Moteur d'interrogation crosslingue du CEA-LIST Intégration OUTILEX
4 DTSI / Service Cognitique Robotique et Interaction Analyseur linguistique LIMA traitement modulaire chaîne de traitements unités de traitements se passant la structure d'analyse du texte (graphe du texte analysé) chaîne dépendant de la langue Intégration des librairies OUTILEX création de nouvelles unités de traitements faisant appel aux librairies OUTILEX structure d'analyse : automate du texte conversion de structure pour la désambiguïsation morpho- syntaxique et l'analyse syntaxique
5 DTSI / Service Cognitique Robotique et Interaction Intégration d'OUTILEX dans l'analyseur LIMA tokeniseur dictionnaire expressions idiomatiques entités nommées Pos-tagging analyse syntaxique
6 DTSI / Service Cognitique Robotique et Interaction Intégration d'OUTILEX dans l'analyseur LIMA tokeniseur dictionnaire expressions idiomatiques entités nommées Pos-tagging analyse syntaxique tokeniseur dictionnaire expressions idiomatiques entités nommées conversion structure tokeniseur OUTILEX dictionnaire OUTILEX grammaires OUTILEX grammaires OUTILEX
7 DTSI / Service Cognitique Robotique et Interaction Adaptations des ressources linguistiques Définitions des propriétés linguistiques définition du fichier de configuration des propriétés linguistiques de la langue (lingdef) Dictionnaires de langue conversion des dictionnaires au format OUTILEX Règles de reconnaissance des expressions idiomatiques, verbes composés et entités nommées conversion des règles au format CEA-LIST (expressions régulières avec déclencheur) en règles au format OUTILEX beau:&avoir$L_V [$L_ADV?]:faire:IDIOM:
8 DTSI / Service Cognitique Robotique et Interaction Démonstrateur Moteur d'interrogation crosslingue français, anglais, espagnol dépêches de l'AFP collectées en août 2006 (entre 400 et 800 par langue) architecture client-serveur et interface Web