Arkhênum Patrimoine du Futur. Répartitions par types d’erreurs mineures.

Slides:



Advertisements
Présentations similaires
Votre logo à insérer ici
Advertisements

Définitions Analyse documentaire
E-learning Evolutif Albarelli Corinne Behem Patrice Guillot Jérôme
Les Evolutions et la Maintenance
Réflexivité et réseaux d’ information
3/26/2017 7:29 PM Taxonomie et gouvernance Organiser le patrimoine informationnel des entreprises © 2006 Microsoft Corporation. All rights reserved. This.
Introduction Pour concrétiser l’enseignement assisté par ordinateur
Atelier régional des Nations Unies sur lévaluation des recensements et les enquêtes post censitaires, Tunis, décembre 2009 Appariement Pres. 7.
Application de réseaux bayésiens à la détection de fumées polluantes
Utiliser le TBI Hitachi
ANTILLES décembre 2009 Thierry Bosso
La décennie qui vient de sécouler a en effet été fortement marquée par « lirrésistible ascension » de la notion de compétences dans le champ de léducation.
Proposition de projet I4, ESIEE, Novembre 2012
Système de gestion de bases de données. Modélisation des traitements
Notice d’utilisation ( activités word phase 1 )
FORMATION STMG Sciences de Gestion Avril 2012.
Evaluation des performances en entreprise
Quelques règles à respecter pour concevoir une présentation dynamique et sobre Dans un cadre scolaire D. G. Formation APEP
Chapitre 4 : la gestion électronique des documents
Créer un index.
Traitement de textes WinWord 3 e année Sciences économiques, de gestion et commerciales Présenté par NEHAR Attia.
Vuibert Systèmes dinformation et management des organisations 6 e édition R. Reix – B. Fallery – M. Kalika – F. Rowe Chapitre 2 : Les applications fonctionnelles.
Méthode de scénarisation
Evaluation de la qualité des documents anciens
EVALUATION EVALUATION DES MANUELS SCOLAIRES Evaluer signifie :
Le Travail Collaboratif ...
Type de contenu. © Partouche David / 2007 version 0.1 Colonne de site Une colonne de site permet de définir un champs qui sera exploitable au sein de.
Faire un exposé Méthodologie.
SCIENCES DE L ’INGENIEUR
Test et débogage Tests unitaires. Gestion d’erreurs. Notion d’état, de pré-condition et de post-condition. Assertion. Traces de programme. Débogueur et.
MOT Éditeur de modèles de connaissances par objets typés
Présentation du mémoire
Module 2 : Préparation de l'analyse des performances du serveur
Mise en oeuvre des MMCs L'utilisation des MMCs en reconnaissance des formes s'effectue en trois étapes : définition de la topologie de la chaîne de Markov,
Le scanner Après installation du scanner Configuration.
École de bibliothéconomie et des sciences de linformation 1 Gestion de linformation électronique (GIE) Maîtrise en sciences de linformation EBSI Université.
Technologie au cycle central
École de bibliothéconomie et des sciences de l’information 1 Gestion de l’information électronique (GIE) Maîtrise en sciences de l’information EBSI Université.
Traitement de textes WinWord 3 e année Sciences économiques, de gestion et commerciales Présenté par NEHAR Attia.
Module 8 : Surveillance des performances de SQL Server
Jeu de Librairies Virtuelles « DLL » Windows pour la réalisation de programmes informatiques.
Traitement de la parole : Synthèse et reconnaissance
Processus 7 – Fiabilisation de l’information et système d’information comptable 25/11/2014 BTS CG.
Lancement de Microsoft Word
MEMOIRE INDUSTRIEL ESIEA
La métacognition Pourquoi ?
Bureautique M1 Mise en forme évoluée 2.
Présentation Finale Spirit 07 / 03 / 2011 Groupe Vert 1 Equipe Verte.
QUALITÉ DES DONNÉES la méthode générale
Titre de votre session Votre logo à insérer ici Prénom NOM Fonction ORGANISME.
Décision incertaine et logistique : Grille typologique
Comment utiliser les collections LWW et La collection Lippincott Contient tous les titres Lippincott Williams & Wilkins journals (plus de 200) Comprend,
Séminaire Ma-Démarche-FSE
Le Traitement Automatique des Langues (TAL)
Informatique et Sciences du Numérique
Video.
Contribution CMS.Eolas
Gestion des documents internes avec SQL Server 2005 Date de publication : janvier 2006.
Retour aux fondamentaux
Le conseil en mobilité Graziana BOSCATO, DCIO Strasbourg
ISO 9001:2000 Interprétation Article 7 Réalisation du produit
Traitement de texte : notions avancées
1 Présentation de DREAMWEAVER (1) Gaël TREMEAU GI05 Printemps 2006.
Analyse - Architecture des sites Web Chaptire 7 - Plan de maintenance du site Internet.
TECHNOLOGIE – Avril 2008 Projet de programme 4 e : Thème : Confort et domotique Equipement intérieur Equipement extérieur Electroménager Vidéo, photo Son.
RÉNOVATION BTS Comptabilité et Gestion 2015 Atelier situations professionnelles & PGI Autour du P2 et du cas FRANCOBOIS P. PARISOT G. DUBAIL.
Formation SGA Module Budget Durée : 1 jour. Sommaire Formation Budget 1.Notions de base 2.Accéder au budget – Chemin d’accès au fichier Excelarator –
Atelier n°3 : Schéma de diffusion des données sur l’eau dans les bassins 24 mars 2011.
Transcription de la présentation:

Arkhênum Patrimoine du Futur

Répartitions par types d’erreurs mineures

Répartitions par types d’erreurs majeures

Niveau d’erreurs mineures sur 50 dossiers

Niveau d’erreurs majeures sur 50 dossiers

Répartition des temps de contrôle

Objectifs  R ATIONALISATION DE LA CHAÎNE DE NUMÉRISATION La rationalisation de la chaîne de numérisation passe par la capacité de s’auto adapter en fonction des caractéristiques des documents et ainsi appliquer les bons paramètres de numérisation. Ce processus devra comprendre des systèmes de détection de problèmes et d’alertes, ainsi qu’un système de traçabilité adapté.  A NALYSE DE LA STRUCTURE ET DU CONTENU DU DOCUMENT Une analyse de la structure et du contenu du document permettra de ne plus considérer une page isolée du reste de l’ouvrage mais de l’insérer dans un contexte permettant de tester la cohérence des éléments reconnus (numéros de pages, de figures, présence d’un sommaire, d’un titre, etc.) et d’alerter en cas de problème ou de doute.  M ISE EN PLACE D ’ OUTILS DE PRÉDICTION DE PERFORMANCES La mise en oeuvre de prédiction de performances permettra l’application de traitements adaptés selon le type de document et de difficulté rencontrée. En cela, le traitement de l’image sera un point central pour l’amélioration des performances globales.

Spécifications Un tel scanner intelligent doit répondre aux besoins suivants :  Gestion multi-format: Capacité â gérer les formes de documents patrimoniaux (livres, journaux, cartes estampes, documents d’archives, objets de musées, photographies, etc.)  Action ordonnancée, paramétrage dynamique. Système intelligent d’adaptation avec des règles non figées évolutives suivant un retour d’expériences (anciens paramètres, cadences, formats, performances)  Supervision système et alerte Gestion de la non qualité (manque, flou, colorimétrie, mauvais format taux de reconnaissance insuffisant, alerte qualité etc.),  Traçabilité Enregistrement relatif à la qualité : Scanners, timing, anomalies, main d’œuvre.  Optimisation des ressources: Capacité de reprise automatique des scénarios de travail en cas de défaillance.

Modélisation  Une modélisation du document se basera en partie sur sa typologies mais aussi l’agencement des contenus (probabilité de succession des segments «titre» puis «table des matières», etc.)  Cette modélisation prendra en compte plusieurs points de vue ainsi pour le « livre » le point de vue de succession des pages, celui de la présence ou non d’objets documentaires comme les titres, la table des matières, les index, la succession logique du texte (aspects linguistiques) ainsi que les caractéristiques de certains éléments du document (illustration souvent accompagnée d’une légende, etc.)  Cette modélisation devra prendre en compte les modèles de documents afin de détecter certaines erreurs (suites de pages incorrectes, etc.). La modélisation des liens entre ces éléments (pagination dans la table des matières, niveau des titres, etc.) permettra d’alerter l’opérateur humain d’incidents potentiels.

Métadonnées et contrôle  Il serait judicieux que cette opération d’analyse d’image mettant en œuvre, OCR, segmentation, analyse linguistique, puisse également contribuer a l’indexation des documents.  En effet aujourd’hui l’extraction ou la saisie de ces données, et le contrôle visuel des images nécessitent un traitement manuel par des opérateurs, ce qui constitue un travail long et coûteux compte tenu de la diversité des documents. Ces extractions d’informations doivent nous permettre à la fois d’enregistrer les métadonnées dans l’image mais aussi de contrôler l’exhaustivité de la numérisation, la qualité des images et les taux de reconnaissance afin de valider la qualité de la production.  Il faut donc mettre en place un système interactif d’apprentissage de la structure du document.

Gestion dynamique des contrôles  Avec un jeu test il faudra valider les paramètres proposés et les faire évoluer par exemple avec la procédure suivante:  Un document type est scanné. L’opérateur procède â un appariement entre modèle sémantique et options de segmentation et de reconnaissance proposées par le système automatique.  Le système repère la variabilité entre ce premier document et les suivants en demandant â l’opérateur de confirmer les cas douteux jusqu’à une convergence (confiance supérieure à un seuil).  Une détection automatique des blocs et des informations est effectuée. Les informations sont caractérisées à l’aide de méthodes linguistiques et proposées à l’opérateur qui valide ou modifie.