Restauration des Images de Documents Anciens A

Slides:



Advertisements
Présentations similaires
« A la découverte des manuscrits du Moyen Âge »
Advertisements

PROGRAMME TERMINALE CGRH PARTIE B
SÉCURISATION DE DOCUMENTS ÉLECTRONIQUES PAR TATOUAGE
Transition image classique image numérique
Une approche informationnelle de la restauration d’images
2. Echantillonnage et interpolation des signaux vidéo
Modélisation 3D Réalisation d'une image de synthèse
A Pyramid Approach to Subpixel Registration Based on Intensity
TABLEAU SYNOPTIQUE.
Introduction à limagerie numérique Acquisition, Caractéristiques, Espaces couleurs, Résolution.
LES METIERS ET LES DOMAINES DE LA RECHERCHE
La photo numérique S. Laurent – Actic Hautil – 2004 /2005.
Support Initiation Publisher 2010
Introduction au Numérique…
IMAGES NUMERIQUES Qu’est-ce qu’une image numérique ?
Prétraitement de l’image
Chapitre 6 : Restauration d’images
Réalisateur : PHAM TRONG TÔN Tuteur : Dr. NGUYEN DINH THUC
3 avril 2007IFAP - Débat thématique "Conservation numérique"1 Conservation des publications électroniques et du dépôt légal Catherine Lupovici Département.
Chapitre 2 : Filtrage Professeur. Mohammed Talibi Alaoui
Evaluation de la qualité des documents anciens
Opérateurs morphologiques
Construction de modèles visuels
Traitements à base d’histogrammes Cours 6
* solutions pour linformation numérique ajlsm Exploiter, diffuser et conserver vos images numériques – Aspects techniques Martin Sévigny / AJLSM / 10 et.
Photoshop3 Revenir sur les calques et leur utilisation. Exercice sur lintégration des images et leur intégration de diverses façons Enregistrement, exportation.
Introduction au traitement d’images Simulation sous Matlab
Le filtrage d’images.
SCHNEIDER Laurent NOYER Vincent TEISSIE Alexis
Modélisation géométrique de base
Conditions aux Frontières Ouvertes
Soutenance de stage 16 Mai au 5 Août 2011
Soutenance de stage 16 Mai au 5 Août 2011
Soutenance de stage 16 Mai au 5 Août 2011
Analyse et le traitement de données chromatiques Correction d’affadissement Travail de synthése à partir de la thèse de Majed CHAMBAH.
OPTIQUE GÉOMETRIQUE.
Présenté par : Jabli Mohamed Amine Brahim Raddaoui
Le TBI à l'école maternelle
* solutions pour l’information numérique ajlsm Exploiter, diffuser et conserver vos images numériques – Aspects techniques Martin Sévigny / AJLSM / 10.
HOPITAL PUBLIC - INTERMEDICA 2002
Introduction aux bibliothèques numériques Alain Jacquesson Bibliothèque publique et universitaire Ville de Genève Vers
Arkhênum Patrimoine du Futur. Répartitions par types d’erreurs mineures.
Traitement d’images Prétraitements.
Modèles Mathématiques et représentation discrètes pour la description des images couleur Luc Brun.
Les réseaux de neurones à réservoir en traitement d’images
Institut de sciences et technologies Département d’informatique
Formalisation de la politique qualité
L’image numérique : concepts et principes de traitement
Méthodes et techniques
Introduction au Traitement d’image
Bibliothèque nationale de France Mai 2006 La bibliothèque numérique européenne ELAG 2006, Bucarest 27 avril 2006 Lucien SCOTTI, directeur des affaires.
Les réseaux de neurones à réservoir en traitement d’images
Vision humaine Propriétés de la vision
La valorisation de l’information scientifique Colloque IFAN, 27 novembre 2007.
GPA-779 Application des systèmes experts et des réseaux de neurones.
D écouverte de la photo numérique et de la retouche d’image Automne Polyphoto.
L’enseignement de l’Analyse Fonctionnelle et Structurelle S 5 en S. T
Conception des pages Web avec
INTRODUCTION AUX BASES DE DONNEES
V. Méthode historique et documents
Modèle traditionnel L’enseignant emmagasine la connaissance, l’assimile et la retransmet aux étudiants dans le processus de transmission traditionnel.
Adobe Photoshop CS2 Morand-Pinçon David Michaut Charlotte SI28 – Ecriture intéractive et multimédia R R.
Présentation du Logiciel Photoshop 6.0
Introduction aux Interfaces Homme-Machine
Exemple et critique d’un système de vision simple Patrick Hébert (dernière révision septembre 2008) Référence complémentaire: Shapiro et Stockman: chap.
LAMOUR Mathieu Présentation du logiciel SI28 Automne 2004.
Garcia Patrick - Moutel Mathieu. SOMMAIRE Introduction à Photoshop Les différents formats d’images L’espace de travail Les calques Les filtres.
TECHNOLOGIE – Avril 2008 Projet de programme 4 e : Thème : Confort et domotique Equipement intérieur Equipement extérieur Electroménager Vidéo, photo Son.
Ondelettes Philippe RAVIER Laboratoire PRISME Université d’Orléans 5A EEO option AA.
CNRS Images / Photothèque 2008 La Photothèque du CNRS.
Transcription de la présentation:

Restauration des Images de Documents Anciens A Restauration des Images de Documents Anciens A. Meziane Cerist ameziane@cerist.dz

CONTEXTE DE CE PROJET Je vous prie d’utiliser cette présentation à des fins strictement personnelles Merci

UTILISATEURS POTENTIELS Bibliothèque Nationale d’Algérie Centre Nationale des Archives Centre National du Manuscrit (ADRAR)

GRSDT vient de dévoiler les 34 PNR et lancera un appel en janvier 2011 PNR12 TIC Axe 1: production et gestion de documents multimédia Thème 3: reconnaissance des documents écrits Thème 4: archivage des documents anciens PNR25 Culture et Civilisation Axe 3: Les arts Thème 4: La calligraphie et les manuscrits Thème 5: Numérisation du patrimoine culturel Algérien

INTRODUCTION Depuis quelques années, on numérise quotidiennement des quantités importantes de documents issus du patrimoine. Cette révolution technologique a ouvert de nouveaux domaines de recherche comme la restauration des images.

La numérisation des documents du patrimoine Le support physique des documents écrits a beaucoup évolué: -supports rigides (le bois, la pierre, le marbre, les galets, les tablettes de cire ou d’argile) -supports souples (le papyrus, le parchemin, le cuir, le papier). -Le papier: moins coûteux et plus commode, mais, fragile dont la conservation est difficile. L’invention de l’imprimerie moderne au XVème siècle a marqué le début d’une nouvelle ère de production et de diffusion massive du savoir Le document électronique est aujourd’hui le vecteur de diffusion le plus utilisé dans le monde. Les données numériques ne remplaceront jamais les supports physiques traditionnels, elles ne sont qu’une représentation plus ou moins fidèle des documents originaux. Par conséquent, la «copie numérique» ne constitue pas une alternative pérenne à la conservation du patrimoine culturel.

Propriétés du document numérique – Facilité de reproduction – Indépendance du support physique – Facilité de consultation – Préservation et conservation des documents originaux

La numérisation seule ne suffit pas La numérisation seule ne suffit pas. Il faut qu’elle cohabite avec le développement d’outils informatiques destinés à améliorer les conditions d’accès et de recherche. -L’analyse d’images de documents est un domaine de recherche actif à la frontière de la reconnaissance des formes et de l’analyse d’images. -L’analyse d’images de documents permet aujourd’hui de retrouver des mots dans les manuscrits imprimés ou bien de reconnaître les mots si on dispose de dictionnaires. -La numérisation permet de réaliser une «copie numérique» des documents ; mais, pour un grand nombre de ces documents, la numérisation arrive trop tard et beaucoup de documents ont été numérisés en mauvais état. -En plus de la détérioration physique des documents anciens, les images montrent des dégradations dues au processus même de numérisation.

Les images de documents sont des images particulières : – Ce sont des images de traits qui forment des structures complexes qui doivent être préservées comme les lettres. – Les informations sont concentrées sur des parties très réduites de l’image. La simple perte d’une partie infinitésimale peut rendre un texte illisible. – Il existe une certaine continuité le long des lignes de mêmes intensités. – La distribution statistique des couleurs montre des classes rarement séparables linéairement. – La proximité colorimétrique entre les différentes couches d’information rend particulièrement difficile leurs séparations quand elles sont mélangées comme la séparation entre le recto et le verso par transparence. – Les dégradations sont aléatoires et donc rarement modélisables et prédictibles. Les méthodes à base d’apprentissage ou de modélisation sont généralement limitées au traitement d’une seule dégradation sur des documents particuliers. – Les dégradations peuvent se superposer de façon non-linéaire rendant très difficiles leurs séparations.

Types de scanners utilisés pour la numérisation Scanners sans vitre Scanner avec lumière froide Scanner avec plateau pour préserver la reliure du livre

Exemples d’images de documents anciens Etant la diversité des documents et les dégradations qu’ils contiennent..

Dégradations des images de documents anciens Absence de travaux complets sur les dégradations des images de documents anciens. Besoin d’une typologie des dégradations pour: mieux traiter les images de documents, guider les travaux de restauration.

Dégradations physiques du document Dégradations chimiques

Dégradations physiques du document Dégradations biologiques Les micro-organismes, Les insectes, Les rongeurs

Dégradations physiques du document Dégradations physiques d’origine humaine

Origines des dégradations qualité du papier, acidité de l’encre,… L’ouvrage L’homme annotations Soulignements.. Origines des dégradations humidité du lieu de stockage, insectes, rongeurs,… Les phénomènes naturels résolution , compression trop forte, présence de courbures.. La numérisation Les dégradations des images de documents ont principalement 4 origines… Toutes ces dégradations vont contribuer à la dégradation de la copie numérisée.

une typologie des dégradations du fond des formes globales Passage en interférence du verso sur le recto Annotations diverses… Variation de l’éclairage Présence de courbures et d’inclinaisons… Pertes de l’information Caractères dégradés… Dégradations sous forme de couches Procédure de restauration par des méthodes de segmentation /classification Afin de classifier, ces différentes dégradations, je propose la typologie suivante Dégradation du fond (image du papier): la présence de certains artefacts dans le fond dégrade énormément le document. Ces artefacts sont associées )à différents types de dégradations (annotations diverses, passage en transparence). Ces différentes dégradations se présentent sous forme de couches superposées à différents niveaux de gris. Restaurer le document revient alors à utiliser des méthodes de segmentation/classification. Dégradation des formes (images des traits, caractères, dessins..) Ces dégradations apparaissent sur les caractères (rupture des traits, caractères tronqués, vide dans les traits…). Les trous sur le support sont associés à ce type de dégradation s’il engendre des pertes de l’information. La compression JPEG est aussi une autre forme de cette dégradation puisqu’elle peut induire des dégradations de caractères. Cette classe est caractérisée par une perte aléatoire de l’information . Restaurer revient ici à réparer les formes des traits ainsi qu’à extrapoler l’information perdue pour améliorer les performances de l’analyse de ses images. Une autre classe associée aux dégradations globales qui affectent tout le document. Cette classe est caractérisée par l’application d’une transformation sur la copie d’origine. Cette transformée peut agir soit sur la localisation des pixels (inclinaison, dégradation courbure) soit sur sa valeur ( transformation de la couleur) . Restaurer revient ici à définir la transformée inverse qui réussit à trouver ou même à se rapprocher de l’information telle qu’elle l’était à l’origine. Dégradations aléatoires de l’information Extrapolation de l’information perdue Réparation des traits Dégradations sous forme de transformation globale Procédure de restauration par des transformations inverses

Dégradations dues à la capture Dégradations matérielles Les limites technologiques de la numérisation de documents (L’échantillonnage spatial, Une quantification des intensités lumineuses) Les limites de la numérisation des microfilms (le microfilm est une copie qui a perdu définitivement toute l’information colorimétrique et une grande partie de l’information sur la luminosité)

Dégradations dues à la capture Dégradations numériques L’inadéquation de la résolution à la taille des textes Perte de la topologie avec le déplacement aléatoire d’une grille de résolution

Dégradations dues à la capture Dégradations numériques L’inadéquation de la résolution à la taille des textes Problème d’une faible résolution sur une image de trait

Dégradations dues à la capture Dégradations numériques Choix de la compression avec perte Aspect destructif de la compression JPEG ; de gauche à droite respectivement : l’image originale et ses versions compressées avec un facteur de qualité 50 % et 10 %.

classification non-causale des dégradations 1-Dégradations uniformes colorimétriques ou géométriques comme l’inclinaison, les variations uniformes des couleurs ou de la luminosité ; elles regroupent les défauts issus d’une transformation globale de l’image qui peut agir uniformément soit sur la localisation des pixels (inclinaison, courbure) soit sur leurs valeurs (transformation de la couleur ou correction de la luminosité). La restauration revient, dans le cas présent, à définir la transformée inverse qui permettra de se rapprocher de l’information telle qu’elle l’était à l’origine. La restauration sera donc possible avec des méthodes globales qui appliquent les mêmes traitements sur toute l’image.

classification non-causale des dégradations 2-Dégradations non-uniformes a-Les dégradations du fond

classification non-causale des dégradations 2-Dégradations non-uniformes b-Les dégradations des formes

La restauration physique vieillissement, modification des couleurs, porosité du papier, acidité de l’encre, humidité et variation de la température de stockage, présence d’insectes, sinistres... La restauration numérique inclinaison du document, courbure apparente le long de la reliure.., des défauts optiques (éclairage non-homogène, netteté de l’image...), des défauts électroniques (bruit et qualité du capteur), des défauts informatiques (traitements destructifs de l’image sans sauvegarde des originaux, compression avec perte...) ou même des défauts extérieurs dus aux conditions de la prise d’image (présence d’éléments non-désirés, extérieurs au document). La restauration virtuelle complémentaire à la restauration physique. Elle permet par exemple de retrouver la couleur d’origine, d’atténuer le verso quand il traverse le recto, de remplir les trous, d’enlever les taches ou de corriger la courbure après la restauration de la reliure.

Les méthodes de restauration virtuelle 1-Méthode supervisée 2-Méthode non supervisée

Méthode supervisée Utilisation du recto et du verso Séparation recto/verso par recalage Suppression des taches en transparence par recalage

Le recto d’un document de test (b) Le recto du document restauré avec une fuite significative du verso après application de la méthode Suppression des taches en transparence par recalage

Séparation recto/verso par analyse de l’orientation analyse de l’orientation à base de la transformée en ondelettes (a) (b) (c) (d) Suppression des taches en transparence par analyse de l’orientation : (a) image de test, (b) image associée à l’orientation 135°, (c) image associée à l’orientation 45°, (d) image restaurée de (a)

Séparation recto/verso par analyse de la couleur quatre classes (fond, texte, texte coloré et texte du verso) nécessite une phase d’apprentissage sur une portion représentative d’une page. (a) Image d’origine (b) Image finale de recto séparée du verso

Séparation par une approche de segmentation en régions de couleur Séparation recto/verso par segmentation et agrégation de régions couleurs : Résultats de la sur-segmentation en régions, image dégradée et restaurée

Restauration des formes par modèle Exemple de modèle : Taille du texte, la résolution, la translation, la rotation, le changement d’échelle, le défaut de jet d’encre. (a) Image originale (b) Résultat pour K=2, le nombre de classes

Restauration des formes par prototypage À partir de la superposition de toutes les formes dégradées d’une même lettre, on construit le modèle de la forme idéale de la lettre. Cas de dégradations de la lettre «e» : (a) caractère idéal ; (b),(c) et (d) caractères dégradés avec structure du «e» conservée, (e) et (f) caractères dégradés avec structure confuse : (e) «e» ou «c», (f) «e» ou «o»

Restauration géométrique de la courbure Défauts géométriques de la photographie d’un livre ouvert à gauche et sa version restaurée à droite (source I2S)

Méthodes de restauration non-supervisées Restauration du recto/verso par séparation de sources Utilise l’ACP Intérêt: Approche ne nécessite ni l’information du verso, ni un modèle, ni un apprentissage Suppression des taches en transparence par analyse de la couleur : (a) image de synthèse, (b) image restaurée de (a), (c) image réelle, (d) image restaurée de (c)

Restauration des formes par morphologie mathématique Effets des opérateurs morphologiques sur les images binaires

Restauration Colorimétrique Changement de la valeur de luminance, correction gamma et recalage d’histogramme Restauration de la dégradation colorimétrique par ajustement du contraste

Restauration des Formes par Diffusion Les différents modèles de diffusion pour réduire le bruit, lisser les contours, restaurer la continuité des traits rehausser la netteté des formes.