La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Compression de documents scannés par Codage vectoriel Extraction de composantes connexes et reconstitution de documents scannés dans un fichier PDF à laide.

Présentations similaires


Présentation au sujet: "Compression de documents scannés par Codage vectoriel Extraction de composantes connexes et reconstitution de documents scannés dans un fichier PDF à laide."— Transcription de la présentation:

1 Compression de documents scannés par Codage vectoriel Extraction de composantes connexes et reconstitution de documents scannés dans un fichier PDF à laide dun codage vectoriel proposé par R. Kachouri, M. Akil Proposition de projet I4, ESIEE, Novembre 2012

2 2 Codage vectoriel de documents scannés : Motivation Contexte du projet : Compression de documents scannés Contexte du projet : Compression de documents scannés Suite à une dématérialisation de documents, le contexte de ce projet consiste à assurer la compression des documents scannés à laide dun codage vectoriel en sappuyant sur un dictionnaire de formes représenté comme une police de caractères dans le fichier PDF résultat. Objectif du projet : Codage vectoriel de documents scannés Objectif du projet : Codage vectoriel de documents scannés Lobjectif de ce projet est daugmenter le taux de compression tout en assurant un taux d'erreur de lecture par l'OCR « Tesseract » au pire comparable à celui obtenu en lisant directement les images fournies en entrée à cette méthode. Codage vectoriel

3 Interface de test pour la méthode de reconnaissance 3

4 4 Compression de documents scannés par Codage vectoriel Cahier de charge Objectif du projet : il sagira de : Objectif du projet : il sagira de : étudier les algorithmes préalablement identifiés dextraction, de description et de reconnaissance de composantes connexes dans un document scanné étudier les algorithmes préalablement identifiés dextraction, de description et de reconnaissance de composantes connexes dans un document scanné prendre en main la librairie HARU utile pour la reconstitution des caractères reconnus dans un fichier PDF (codage vectoriel) prendre en main la librairie HARU utile pour la reconstitution des caractères reconnus dans un fichier PDF (codage vectoriel) générer une image derreur (différence entre limage originale et le texte reconstitué), utilisée comme masque pour la reconstitution finale du document scanné générer une image derreur (différence entre limage originale et le texte reconstitué), utilisée comme masque pour la reconstitution finale du document scanné développer la chaine de codage vectoriel en C, puis mettre au point une spécification OpenCL de la méthode développée pour effectuer un démonstrateur sur GPU développer la chaine de codage vectoriel en C, puis mettre au point une spécification OpenCL de la méthode développée pour effectuer un démonstrateur sur GPU

5 Carte GPU NVIDIA Tesla c2050 5

6 6 Compression de documents scannés par Codage vectoriel Compétences requises Compétences requises étude algorithmique étude algorithmique Maitrise de loutil Matlab Maitrise de loutil Matlab programmation avec des langages de haut niveau C/C++ programmation avec des langages de haut niveau C/C++ Compétences acquises Compétences acquises Méthode des « centroides hiérarchiques » pour la reconnaissance de caractères Méthode des « centroides hiérarchiques » pour la reconnaissance de caractères Librairies de traitement dimages (Devil, openCV) Librairies de traitement dimages (Devil, openCV) Librairie de codage vectoriel (Lib HARU) Librairie de codage vectoriel (Lib HARU) Spécification OpenCL Spécification OpenCL Implémentation sur GPU Implémentation sur GPU


Télécharger ppt "Compression de documents scannés par Codage vectoriel Extraction de composantes connexes et reconstitution de documents scannés dans un fichier PDF à laide."

Présentations similaires


Annonces Google