La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Séminaire Doc Mining Paris 13/11/2002 PSI Librairie Adam Sébastien Delalandre Mathieu Héroux Pierre.

Présentations similaires


Présentation au sujet: "Séminaire Doc Mining Paris 13/11/2002 PSI Librairie Adam Sébastien Delalandre Mathieu Héroux Pierre."— Transcription de la présentation:

1 Séminaire Doc Mining Paris 13/11/2002 PSI Librairie Adam Sébastien Delalandre Mathieu Héroux Pierre

2 Séminaire DocMining Paris 13/11/2002 Plan  Introduction  Démonstration  Conclusion

3 Séminaire DocMining Paris 13/11/2002 Plan  Introduction  Démonstration  Conclusion

4 Séminaire DocMining Paris 13/11/2002 Introduction  Présentation de la PSILib (1)  Librairie traitement « équipe document» PSI  Historique  1992-2001  LTI, LibImage, TAI, GraphePsi, …  2001-2002  PSI Librairie  Début projet :Octobre 2001  Avant projet : Février 2002 (S Nancy)  Versions :Mai (S Lannion), Juillet, Octobre 2002

5 Séminaire DocMining Paris 13/11/2002 Introduction  Présentation de la PSILib (2)  Base d’outils standards pour le traitement des documents découpés en 4 bibliothèques :  PSI Image Processing Library  PSI Classification Tool Library  PSI Interpretation Interface Library  PSI Knowledge Management Library

6 Séminaire DocMining Paris 13/11/2002 Introduction  Caractéristiques (1)  Taille  >50 000 lignes de code  >2 Mégas de fichier source  Langages  10% java  20% C++  60% CANSI  5% script (XSLT, XML-QL)

7 Séminaire DocMining Paris 13/11/2002 Introduction  Caractéristiques (2)  Bibliothèques externes  Java  JAI  Xerces  Keelt  C/C++  LibTiff  STL

8 Séminaire DocMining Paris 13/11/2002 Introduction  Caractéristiques (3)  Points forts  Exploitation Multi langage  Java & C/C++  100% interfaçable depuis Java  Partiellement interfaçable depuis le C/C++  Exploitation Multi Plate forme  Windows et Linux

9 Séminaire DocMining Paris 13/11/2002 Introduction  Caractéristiques (4)  Points forts  Paramétrage des outils  Externalisation des connaissances opératoires  Interfaçage des outils  Flots de données dédiés & XML (SVG, XGMML)  Bibliothèque documentée  Générée Automatiquement avec JavaDoc  Pointe 56 MO de rapport (>2000 pages)  PS, PDF, HTML,Word

10 Séminaire DocMining Paris 13/11/2002 Introduction  Caractéristiques (5)  Points faibles  Fiabilité de la librairie  Pas de test de robustesse  Pas de code de gestion d’erreurs  Implémentation plus procédurale qu’objet

11 Séminaire DocMining Paris 13/11/2002 Introduction  Traitements (1)  PSI Image Processing Library  Gestion fichiers (tout formats)  Gestion objets  Convolution (médian, moyenneur)  Conversion couleur (Otsu, Kittler)  Morphologie  Marquage de masses connexes (filtrage, occlusions)  Structurel(Taconnet, Dibaja, la corde, split & merge, nœud)  Statistique(Fourier-Mellin, sondes circulaires, Zernike)

12 Séminaire DocMining Paris 13/11/2002 Introduction  Traitement (2)  PSI Classification Tool Library  Kppv  Graphe de voisinage, toponyme  Appariement Graphe (générique)

13 Séminaire DocMining Paris 13/11/2002 Introduction  Traitement (3)  PSI Interpretation Interface Library  Shell, Affichage, Fichier  PSI Knowledge Management Library  XSLT (Xerces), XML-QL(Keelt)

14 Séminaire DocMining Paris 13/11/2002 Introduction  Mise à disposition  Actuellement  Site de thèse  http://site.voila.fr/roxml http://site.voila.fr/roxml  A venir  Serveur PSI

15 Séminaire DocMining Paris 13/11/2002 Plan  Introduction  Démonstration  Conclusion

16 Séminaire DocMining Paris 13/11/2002 Démonstration  Documentation & Utilisation

17 Séminaire DocMining Paris 13/11/2002 Plan  Introduction  Démonstration  Conclusion

18 Séminaire DocMining Paris 13/11/2002 Conclusion  Points faibles  Problèmes éventuels de robustesse & performance  Implémentation plus procédurale que objet  Exploitation depuis Java favorisée  Architecture interne discutable

19 Séminaire DocMining Paris 13/11/2002 Conclusion  Points forts  Package « complet »  Documentation technique et scientifique  Contraintes techniques « faibles »  Portable sous Linux & Window  Langage d’interface (java et C/C++)  Interfaçage système « aisé » (XML et dérivés « SVG, XGMML»)


Télécharger ppt "Séminaire Doc Mining Paris 13/11/2002 PSI Librairie Adam Sébastien Delalandre Mathieu Héroux Pierre."

Présentations similaires


Annonces Google