La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

22 avril 2011 Acquisition de Connaissances 2. I. Présentation de Lucene II. Améliorations Gestion des synonymes Intégration des stemmers Conclusion Démo.

Présentations similaires


Présentation au sujet: "22 avril 2011 Acquisition de Connaissances 2. I. Présentation de Lucene II. Améliorations Gestion des synonymes Intégration des stemmers Conclusion Démo."— Transcription de la présentation:

1 22 avril 2011 Acquisition de Connaissances 2

2 I. Présentation de Lucene II. Améliorations Gestion des synonymes Intégration des stemmers Conclusion Démo 2 Sommaire

3 3 I - Présentation de Lucene Projet open-source développé en JAVA Moteur de recherche pour documents textuels Deux phases Indexation IndexWriterAnalyserDocumentFieldDirectory Recherche IndexSearcherTermQueryHits 1 2

4 4 I - Présentation de Lucene C E QUE L UCENE PROPOSE : Indexation « intelligente » (filtre sur les mots) Recherche par champs (titre, auteur, contenu) Requêtes multiples (expressions régulières, expression booléennes, recherche de proximité C E QUE L UCENE PROPOSE : Indexation « intelligente » (filtre sur les mots) Recherche par champs (titre, auteur, contenu) Requêtes multiples (expressions régulières, expression booléennes, recherche de proximité C E QU IL MANQUE À L UCENE : Interface graphique Recherche de synonymes Mise en place de stemmers non anglais C E QU IL MANQUE À L UCENE : Interface graphique Recherche de synonymes Mise en place de stemmers non anglais

5 5 II – Améliorations Synonymes (1/2) : Principe et mise en œuvre Utiliser à lindexation et/ou à la recherche un dictionnaire des synonymes pour augmenter le nombre de résultats. Base de synonymes FiltreAnalyseurLucene Recherche Synonym Filter XML (V1) WordNet (V2) Synonym Analyzer Indexation fast quick rapid...

6 6 II – Améliorations Synonymes (2/2) : Résultats Requêtes simples sur quelques fichiers Requêtes complexes sur un grand nombre de fichiers

7 7 II – Améliorations Stemmers (1/2) : Principe et mise en œuvre « La racinisation est le nom donné au procédé qui vise à transformer les flexions en leur radical ou stemme. Il cherche à rassembler les différentes variantes flexionnelle et dérivationnelle dun mot » Indexation

8 8 II – Améliorations Stemmers (2/2) : Résultats Stemmatisation dune phrase (français) Enter query: fonctionner Searching for: fonctionner Total frequency : 0 0 total matching documents Enter query: fonctionner Searching for: fonction Occurences in : /Users/vincent/Desktop/docs/TestFrench.txt 2 x fonction Frequency : 2 Total frequency : 2 1 total matching documents Stemmatisation sur une collection (anglais)

9 9 Conclusion Q UELQUES DIFFICULTÉS RENCONTRÉES Formation à Lucene Choix des fonctionnalités Organisation du groupe Q UELQUES IDÉES D AMÉLIORATIONS Correcteur dorthographe Améliorations des expressions régulières Recherche contextuelle


Télécharger ppt "22 avril 2011 Acquisition de Connaissances 2. I. Présentation de Lucene II. Améliorations Gestion des synonymes Intégration des stemmers Conclusion Démo."

Présentations similaires


Annonces Google