Séminaire Doc Mining Paris 13/11/2002 PSI Librairie Adam Sébastien Delalandre Mathieu Héroux Pierre
Séminaire DocMining Paris 13/11/2002 Plan Introduction Démonstration Conclusion
Séminaire DocMining Paris 13/11/2002 Plan Introduction Démonstration Conclusion
Séminaire DocMining Paris 13/11/2002 Introduction Présentation de la PSILib (1) Librairie traitement « équipe document» PSI Historique LTI, LibImage, TAI, GraphePsi, … PSI Librairie Début projet :Octobre 2001 Avant projet : Février 2002 (S Nancy) Versions :Mai (S Lannion), Juillet, Octobre 2002
Séminaire DocMining Paris 13/11/2002 Introduction Présentation de la PSILib (2) Base d’outils standards pour le traitement des documents découpés en 4 bibliothèques : PSI Image Processing Library PSI Classification Tool Library PSI Interpretation Interface Library PSI Knowledge Management Library
Séminaire DocMining Paris 13/11/2002 Introduction Caractéristiques (1) Taille > lignes de code >2 Mégas de fichier source Langages 10% java 20% C++ 60% CANSI 5% script (XSLT, XML-QL)
Séminaire DocMining Paris 13/11/2002 Introduction Caractéristiques (2) Bibliothèques externes Java JAI Xerces Keelt C/C++ LibTiff STL
Séminaire DocMining Paris 13/11/2002 Introduction Caractéristiques (3) Points forts Exploitation Multi langage Java & C/C++ 100% interfaçable depuis Java Partiellement interfaçable depuis le C/C++ Exploitation Multi Plate forme Windows et Linux
Séminaire DocMining Paris 13/11/2002 Introduction Caractéristiques (4) Points forts Paramétrage des outils Externalisation des connaissances opératoires Interfaçage des outils Flots de données dédiés & XML (SVG, XGMML) Bibliothèque documentée Générée Automatiquement avec JavaDoc Pointe 56 MO de rapport (>2000 pages) PS, PDF, HTML,Word
Séminaire DocMining Paris 13/11/2002 Introduction Caractéristiques (5) Points faibles Fiabilité de la librairie Pas de test de robustesse Pas de code de gestion d’erreurs Implémentation plus procédurale qu’objet
Séminaire DocMining Paris 13/11/2002 Introduction Traitements (1) PSI Image Processing Library Gestion fichiers (tout formats) Gestion objets Convolution (médian, moyenneur) Conversion couleur (Otsu, Kittler) Morphologie Marquage de masses connexes (filtrage, occlusions) Structurel(Taconnet, Dibaja, la corde, split & merge, nœud) Statistique(Fourier-Mellin, sondes circulaires, Zernike)
Séminaire DocMining Paris 13/11/2002 Introduction Traitement (2) PSI Classification Tool Library Kppv Graphe de voisinage, toponyme Appariement Graphe (générique)
Séminaire DocMining Paris 13/11/2002 Introduction Traitement (3) PSI Interpretation Interface Library Shell, Affichage, Fichier PSI Knowledge Management Library XSLT (Xerces), XML-QL(Keelt)
Séminaire DocMining Paris 13/11/2002 Introduction Mise à disposition Actuellement Site de thèse A venir Serveur PSI
Séminaire DocMining Paris 13/11/2002 Plan Introduction Démonstration Conclusion
Séminaire DocMining Paris 13/11/2002 Démonstration Documentation & Utilisation
Séminaire DocMining Paris 13/11/2002 Plan Introduction Démonstration Conclusion
Séminaire DocMining Paris 13/11/2002 Conclusion Points faibles Problèmes éventuels de robustesse & performance Implémentation plus procédurale que objet Exploitation depuis Java favorisée Architecture interne discutable
Séminaire DocMining Paris 13/11/2002 Conclusion Points forts Package « complet » Documentation technique et scientifique Contraintes techniques « faibles » Portable sous Linux & Window Langage d’interface (java et C/C++) Interfaçage système « aisé » (XML et dérivés « SVG, XGMML»)