La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Restauration des Images de Documents Anciens A. Meziane Cerist

Présentations similaires


Présentation au sujet: "Restauration des Images de Documents Anciens A. Meziane Cerist"— Transcription de la présentation:

1 Restauration des Images de Documents Anciens A. Meziane Cerist

2 CONTEXTE DE CE PROJET Je vous prie dutiliser cette présentation à des fins strictement personnelles Merci

3 UTILISATEURS POTENTIELS Bibliothèque Nationale dAlgérie Centre Nationale des Archives Centre National du Manuscrit (ADRAR)

4 GRSDT vient de dévoiler les 34 PNR et lancera un appel en janvier 2011 PNR12 TIC Axe 1: production et gestion de documents multimédia Thème 3: reconnaissance des documents écrits Thème 4: archivage des documents anciens PNR25 Culture et Civilisation Axe 3: Les arts Thème 4: La calligraphie et les manuscrits Thème 5: Numérisation du patrimoine culturel Algérien

5 INTRODUCTION Depuis quelques années, on numérise quotidiennement des quantités importantes de documents issus du patrimoine. Cette révolution technologique a ouvert de nouveaux domaines de recherche comme la restauration des images.

6 La numérisation des documents du patrimoine Le support physique des documents écrits a beaucoup évolué: -supports rigides (le bois, la pierre, le marbre, les galets, les tablettes de cire ou dargile) -supports souples (le papyrus, le parchemin, le cuir, le papier). -Le papier: moins coûteux et plus commode, mais, fragile dont la conservation est difficile. Linvention de limprimerie moderne au XVème siècle a marqué le début dune nouvelle ère de production et de diffusion massive du savoir Le document électronique est aujourdhui le vecteur de diffusion le plus utilisé dans le monde. Les données numériques ne remplaceront jamais les supports physiques traditionnels, elles ne sont quune représentation plus ou moins fidèle des documents originaux. Par conséquent, la «copie numérique» ne constitue pas une alternative pérenne à la conservation du patrimoine culturel.

7 Propriétés du document numérique – Facilité de reproduction – Indépendance du support physique – Facilité de consultation – Préservation et conservation des documents originaux

8 La numérisation seule ne suffit pas. Il faut quelle cohabite avec le développement doutils informatiques destinés à améliorer les conditions daccès et de recherche. -Lanalyse dimages de documents est un domaine de recherche actif à la frontière de la reconnaissance des formes et de lanalyse dimages. -Lanalyse dimages de documents permet aujourdhui de retrouver des mots dans les manuscrits imprimés ou bien de reconnaître les mots si on dispose de dictionnaires. -La numérisation permet de réaliser une «copie numérique» des documents ; mais, pour un grand nombre de ces documents, la numérisation arrive trop tard et beaucoup de documents ont été numérisés en mauvais état. -En plus de la détérioration physique des documents anciens, les images montrent des dégradations dues au processus même de numérisation.

9 Les images de documents sont des images particulières : – Ce sont des images de traits qui forment des structures complexes qui doivent être préservées comme les lettres. – Les informations sont concentrées sur des parties très réduites de limage. La simple perte dune partie infinitésimale peut rendre un texte illisible. – Il existe une certaine continuité le long des lignes de mêmes intensités. – La distribution statistique des couleurs montre des classes rarement séparables linéairement. – La proximité colorimétrique entre les différentes couches dinformation rend particulièrement difficile leurs séparations quand elles sont mélangées comme la séparation entre le recto et le verso par transparence. – Les dégradations sont aléatoires et donc rarement modélisables et prédictibles. Les méthodes à base dapprentissage ou de modélisation sont généralement limitées au traitement dune seule dégradation sur des documents particuliers. – Les dégradations peuvent se superposer de façon non-linéaire rendant très difficiles leurs séparations.

10 Scanners sans vitre Scanner avec lumière froide Scanner avec plateau pour préserver la reliure du livre Types de scanners utilisés pour la numérisation

11 Exemples dimages de documents anciens

12 12 Dégradations des images de documents anciens – Absence de travaux complets sur les dégradations des images de documents anciens. – Besoin dune typologie des dégradations pour: mieux traiter les images de documents, guider les travaux de restauration.

13 Dégradations physiques du document Dégradations chimiques

14 Dégradations physiques du document Dégradations biologiques Les micro-organismes, Les insectes, Les rongeurs

15 Dégradations physiques du document Dégradations physiques dorigine humaine

16 16 Origines des dégradations - qualité du papier, qualité du papier, - acidité de lencre,… acidité de lencre,… Louvrage -résolution,résolution, -compression trop forte,compression trop forte, -présence de courbures..présence de courbures.. numérisation La numérisation La numérisation - humidité du lieu de stockage, humidité du lieu de stockage, - insectes, rongeurs,… insectes, rongeurs,… naturels Les phénomènes naturels Les phénomènes naturels Lhomme - annotations annotations -Soulignements..Soulignements..

17 17 une typologie des dégradations DégradationsDégradations du fond des formes globalesglobales Passage en interférence du verso sur le recto Passage en interférence du verso sur le recto Annotations diverses… Annotations diverses… Dégradations sous forme de couches Dégradations sous forme de couches Procédure de restauration par des méthodes de segmentation /classification Variation de léclairage Variation de léclairage Présence de courbures et dinclinaisons… Présence de courbures et dinclinaisons… Dégradations sous forme de transformation globale Dégradations sous forme de transformation globale Procédure de restauration par des transformations inverses Dégradations aléatoires de linformation Dégradations aléatoires de linformation Extrapolation de linformation perdue Extrapolation de linformation perdue Réparation des traits Réparation des traits Pertes de linformation Pertes de linformation Caractères dégradés… Caractères dégradés…

18 Dégradations dues à la capture Dégradations matérielles Les limites technologiques de la numérisation de documents (Léchantillonnage spatial, Une quantification des intensités lumineuses) Les limites de la numérisation des microfilms (le microfilm est une copie qui a perdu définitivement toute linformation colorimétrique et une grande partie de linformation sur la luminosité)

19 Dégradations dues à la capture Dégradations numériques Linadéquation de la résolution à la taille des textes Perte de la topologie avec le déplacement aléatoire dune grille de résolution

20 Dégradations dues à la capture Dégradations numériques Linadéquation de la résolution à la taille des textes Problème dune faible résolution sur une image de trait

21 Dégradations dues à la capture Dégradations numériques Choix de la compression avec perte Aspect destructif de la compression JPEG ; de gauche à droite respectivement : limage originale et ses versions compressées avec un facteur de qualité 50 % et 10 %.

22 classification non-causale des dégradations 1-Dégradations uniformes c olorimétriques ou géométriques comme linclinaison, les variations uniformes des couleurs ou de la luminosité ; elles regroupent les défauts issus dune transformation globale de limage qui peut agir uniformément soit sur la localisation des pixels (inclinaison, courbure) soit sur leurs valeurs (transformation de la couleur ou correction de la luminosité). La restauration revient, dans le cas présent, à définir la transformée inverse qui permettra de se rapprocher de linformation telle quelle létait à lorigine. La restauration sera donc possible avec des méthodes globales qui appliquent les mêmes traitements sur toute limage.

23 classification non-causale des dégradations 2-Dégradations non-uniformes a-Les dégradations du fond

24 classification non-causale des dégradations 2-Dégradations non-uniformes b-Les dégradations des formes

25 La restauration physique vieillissement, modification des couleurs, porosité du papier, acidité de lencre, humidité et variation de la température de stockage, présence dinsectes, sinistres... La restauration numérique inclinaison du document, courbure apparente le long de la reliure.., des défauts optiques (éclairage non-homogène, netteté de limage...), des défauts électroniques (bruit et qualité du capteur), des défauts informatiques (traitements destructifs de limage sans sauvegarde des originaux, compression avec perte...) ou même des défauts extérieurs dus aux conditions de la prise dimage (présence déléments non-désirés, extérieurs au document). La restauration virtuelle complémentaire à la restauration physique. Elle permet par exemple de retrouver la couleur dorigine, datténuer le verso quand il traverse le recto, de remplir les trous, denlever les taches ou de corriger la courbure après la restauration de la reliure.

26 Les méthodes de restauration virtuelle 1-Méthode supervisée 2-Méthode non supervisée

27 Méthode supervisée Utilisation du recto et du verso Séparation recto/verso par recalage Suppression des taches en transparence par recalage

28 (a)Le recto dun document de test (b) Le recto du document restauré avec une fuite significative du verso après application de la méthode Suppression des taches en transparence par recalage

29 Séparation recto/verso par analyse de lorientation analyse de lorientation à base de la transformée en ondelettes (a) (b) (c) (d) Suppression des taches en transparence par analyse de lorientation : (a) image de test, (b) image associée à lorientation 135°, (c) image associée à lorientation 45°, (d) image restaurée de (a)

30 Séparation recto/verso par analyse de la couleur quatre classes (fond, texte, texte coloré et texte du verso) nécessite une phase dapprentissage sur une portion représentative dune page. (a) Image dorigine (b) Image finale de recto séparée du verso

31 Séparation par une approche de segmentation en régions de couleur Séparation recto/verso par segmentation et agrégation de régions couleurs : Résultats de la sur-segmentation en régions, image dégradée et restaurée

32 Restauration des formes par modèle (a) Image originale (b) Résultat pour K=2, le nombre de classes Exemple de modèle : Taille du texte, la résolution, la translation, la rotation, le changement déchelle, le défaut de jet dencre.

33 Restauration des formes par prototypage Cas de dégradations de la lettre «e» : (a) caractère idéal ; (b),(c) et (d) caractères dégradés avec structure du «e» conservée, (e) et (f) caractères dégradés avec structure confuse : (e) «e» ou «c», (f) «e» ou «o» À partir de la superposition de toutes les formes dégradées dune même lettre, on construit le modèle de la forme idéale de la lettre.

34 Restauration géométrique de la courbure Défauts géométriques de la photographie dun livre ouvert à gauche et sa version restaurée à droite (source I2S)

35 Méthodes de restauration non-supervisées Restauration du recto/verso par séparation de sources Utilise lACP Intérêt: Approche ne nécessite ni linformation du verso, ni un modèle, ni un apprentissage Suppression des taches en transparence par analyse de la couleur : (a) image de synthèse, (b) image restaurée de (a), (c) image réelle, (d) image restaurée de (c)

36 Restauration des formes par morphologie mathématique Effets des opérateurs morphologiques sur les images binaires

37 Restauration Colorimétrique Restauration de la dégradation colorimétrique par ajustement du contraste Changement de la valeur de luminance, correction gamma et recalage dhistogramme

38 Restauration des Formes par Diffusion Les différents modèles de diffusion pour réduire le bruit, lisser les contours, restaurer la continuité des traits rehausser la netteté des formes.


Télécharger ppt "Restauration des Images de Documents Anciens A. Meziane Cerist"

Présentations similaires


Annonces Google