OPTIMA, 6 novembre 2008, BnF 1 un outil daide à la transcription Thomas PALFRAY Stéphane NICOLAS Thierry PAQUET L aboratoire d I nformatique, T raitement.

Slides:



Advertisements
Présentations similaires
Ministère de l’Economie, des Finances et de l’Emploi Parcours 3  - « Interface Offre de formation » Story-board Version 0.1 Micropole – Univers.
Advertisements

Produit Gammes Nomenclatures Modules Techniques Prix de Revient Prix de Vente Modules Techniques Client Marges Mise en route Temps Unitaire Prix (Ex:
Introduction aux Web Services Partie 1. Technologies XML
1 Modéliser Ou comment RE-présenter sa connaissance.
Eléments de Génie Logiciel
Les Evolutions et la Maintenance
Architecture Technique de la plate-forme CASTORE
Le"cartable électronique"®
Affichage interactif, bidimensionnel et incrémental de formules mathématiques Hanane Naciri et Laurence Rideau INRIA Sophia Antipolis CARI'2000.
Thème 3 : plate-forme de modélisation et de gestion de référentiels XML étapes modélisation des structures (UML) gestion du référentiel de modélisation.
Niveau Intermédiaire 12/01/ Visualiser votre groupe de TD ( Visualiser mon emploi du temps) 12/01/
Le developpement web  Préparé par : ASSAL Lamiae JAMALI Zakarya
1/22 Présentation Dechou & CO Développement dun programme de gestion dascenseurs Spécifications fonctionnelles générales.
JXDVDTEK – Une DVDthèque en Java et XML
TER Gestionnaires de contenu en ligne
Site Internet 29 Mai Le site internet aujourdhui 2.
GIBII Logiciel développé par la cellule C.A.T.I.C.E. de lAcadémie de Bordeaux Présentation concernant la version 6 de GIBII, adaptée par la Matice de Poitiers.
Le codage de l ’information
06 Juillet 2009 Projet Checker daccessibilité de fichiers SVG Rami BALI Toufic HADDAD Aroussia MAADI Encadrants Annie DANZART Christine POTIER Jérôme HUGUES.
contrat Creative Commons Paternité-Pas d'Utilisation Commerciale- Partage des Conditions Initiales à l'Identique.
JOME, un Composant Logiciel pour le Télé-Enseignement des Mathématiques via le WEB, Compatible OpenMath et MathML Laurent DIRAT OVE / I3S-UNSA.
Stage réalisé à l ’INRA d ’AVIGNON
Conception d’une application de gestion de fiches études
Interface Homme Machine IHM Pro
Langage SysML.
Soutenance de stage · Par : Guillaume Prévost · Entreprise : Cynetic
Introduction aux Web Services Partie 1. Technologies HTML-XML
Dream Factory: Enguerran Poulain Paul Fontaine Akram Benayaha
Formation Centra - GDE.
Que faut-il pour créer et soutenir une banque de données Denis Guedez Thomson Reuters ABJS VjBS - Zürich 11 Avril 2008 denis.guedez[at] thomson.com.
Etude des Technologies du Web services
XML-Family Web Services Description Language W.S.D.L.
Plugin B pour JEdit Matthias Meusburger Antoine Acquaviva
Sommaire Objectif de Peakup Principes de fonctionnement
Lycée Louis Vincent Séance 1
GWT UML Un modeleur UML en GWT
Dessin Vectoriel Collaboratif
Attestation de reprise à temps partiel thérapeutique maladie
Recherche Documentaire et traitement de l’information
SYSTEMES MIXTES MOBILES ET COLLABORATIFS
Arts visuels, informatique Réalisation des maquettes de la suite de l’histoire. Les maquettes sont photographiées. Traitement des images, réalisation.
Jonathan Montois Cyrille Kriegel
Projet de Master première année 2007 / 2008
NORMALISATION DES LANGAGES DE PROGRAMMATION des Automates Programmables Industriels CEI Jean-Jacques DUMÉRY -1-
Solvent eXtraction Database - INTERNET -
NORMALISATION DES LANGAGES DE PROGRAMMATION des Automates Programmables Industriels CEI
JEE 5 F.Pfister 2 institut eerie JEE – Une plateforme serveur  Développement et exécution d'applications réparties.
‘‘Open Data base Connectivity‘‘
Biologie – Biochimie - Chimie
La refonte des sites d’appui Ce qui change pour vous.
1 Architecture orientée service SOA Architecture orientée service SOA (Service Oriented Architecture)
Méthodologie pour la structuration semi- automatique d’un corpus lexicographique bilingue : le cas du dictionnaire français-kabyle Mahfoud MAHTOUT Université.
Outil de gestion des cartes grises
Contenus riches et logique d'industrialisation Contenus riches et logique d'industrialisation Modélisation, production, génération, gestion Stéphane Crozat.
L’identité numérique : outil de bonne gouvernance
Supports de formation au SQ Unifié
Institut Supérieur des Sciences Appliquées et de Technologie Sousse
Algorithmique et programmation (1)‏
Technologies web et web sémantique TP3 - XML. XML eXtensible Markup Language (langage extensible de balisage) – Caractéristiques: méta-langage = un langage.
Introduction au Génie Logiciel
SMIL Synchronized Multimedia Integration Language
Thibault ROY Université de Caen / Basse-Normandie Laboratoire GREYC – Equipe ISLanD Apport d’outils d’informatique documentaire à l’analyse de forums de.
Interface de génération de blason Projet STLM.GIBERT / M.LIPPMANN.
Iup MIAGe 3° année Projet MIAGe Toulouse – Groupe 21 Charte graphique.
PSPA : une plateforme de simulation en physique des accélérateurs Les journées informatique de l’IN2P3-IRFU octobre.
Interface de génération de blason
Le diagramme de composants
Introduction à SVG Scalable Vector Graphic. Informations ● Plus d'informations ici (draft, tutoriaux, outils... ): –
Interface de génération de blason
PROJET DE SESSION DANS LE CADRE DU COURS: SCG Réalisation d’applications en SIG PRÉSENTÉ PAR: Marie-Andrée Levesque 18 AVRIL 2006.
Transcription de la présentation:

OPTIMA, 6 novembre 2008, BnF 1 un outil daide à la transcription Thomas PALFRAY Stéphane NICOLAS Thierry PAQUET L aboratoire d I nformatique, T raitement de l I nformation et des S ystèmes EA 4108 Université de ROUEN Faculté des sciences Saint-Etienne du Rouvray

OPTIMA, 6 novembre 2008, BnF 2 un outil daide à la transcription Les ambitions dOPTIMA Valorisation des grands corpus modernes Transcription de lavant texte, réputé illisible Conception des outils numériques fondamentaux Transcription Classement

OPTIMA, 6 novembre 2008, BnF 3 Transcription ? Un résultat visible lisible une explicitation sans interprétation une preuve

OPTIMA, 6 novembre 2008, BnF 4 Transcription ? Une source numérique rendue accessible au classement accès aux parties de documents décrire le contenu au-delà du visuel penser la transcription comme une base de données

OPTIMA, 6 novembre 2008, BnF 5 1- Un langage pour décrire les contenus textuels et graphiques 2- Une interface daide à lencodage 3- Visualisation des images Haute Définition 4- Visualisation des transcriptions (diplomatique?) Expression des besoins

OPTIMA, 6 novembre 2008, BnF 6 1. Langage dencodage Définition informatique dune transcription Repose sur XML: langage des BD semi-structurées HNML + GustaveML + besoins spécifiques DTD établie début 2008 Dernières modifications aout 2008

OPTIMA, 6 novembre 2008, BnF 7 Ajout interlinéaire : Flaubert - Proust Balise Interligne Elle permet d'indiquer quel interligne est utilisé (Supérieur ou Inférieur). Pour un interligne situé dans le corps de texte, on utilise le mot du corps de texte pour indiquer à la visualisation diplomatique ou débute l'interligne. Exemple: l'interligne débute après le i de "villa" Codage: vi de Cale o loco lla 1. Langage dencodage

OPTIMA, 6 novembre 2008, BnF 8 bloc de texte : Proust Balise Bloc On utilise le type bloc de texte pour délimiter les blocs composant le document. Le transcripteur indique les positions successives des points entourant le bloc. La forme est de type polyèdre, ainsi, quelque soit la forme du bloc, on peut délimiter celui-ci et le visualiser sur la diplomatique. Codage: [coordonnées des points du bloc] 1. Langage dencodage

OPTIMA, 6 novembre 2008, BnF 9 bloc image : Braudel Balise bloc On utilise un type de bloc particulier, appelé bloc "Image". Le transcripteur indique ainsi que le contenu de ce bloc n'est pas un texte, mais un tampon que l'on ne peut rendre avec une transcription. La portion d'image ainsi délimitée est ajoutée à la visualisation diplomatique du document transcrit. Codage: [coordonnées des points du bloc] 1. Langage dencodage

OPTIMA, 6 novembre 2008, BnF 10 ajout en marge : Flaubert - Proust Non géré actuellement 1. Langage dencodage

OPTIMA, 6 novembre 2008, BnF Langage dencodage <!DOCTYPE transcription [ … ]>

OPTIMA, 6 novembre 2008, BnF Interface daide à lencodage 1. Saisie du texte et aide à lencodage

OPTIMA, 6 novembre 2008, BnF Visualisation des images HD Fonctionnalités images zoom rotation saisie de blocs mesure

OPTIMA, 6 novembre 2008, BnF 14 Faire passer un système décriture non standard dans un système dédition électronique normalisé Transcription diplomatique ? linéarisée diplomatique horizontale diplomatique horizontale avec éléments graphiques diplomatique inclinée régulière diplomatique inclinée régulière avec éléments graphiques Très dépendant de lutilisateur et du corpus Accepter une certaine distorsion 4. Visualisation des transcriptions

OPTIMA, 6 novembre 2008, BnF Visualisation des transcriptions

OPTIMA, 6 novembre 2008, BnF 16 Plateforme Java : - dev indépendant de la machine - permet la manipulation des images HD - pas de technologies Web - IHM en SWING - rendu codé en SVG et visualisé avec BATIK (Apache) Choix Technologiques

OPTIMA, 6 novembre 2008, BnF 17 - Format de Transcription Numérique: achevé (version 1) - Saisie du balisage: achevée (version 1) - Sauvegarde: en cours de validation - Visualisation diplomatique: 40% achevé - Test et validation : à continuer !! Utilisateurs = Testeurs Bilan et Perspectives

OPTIMA, 6 novembre 2008, BnF 18 - Un outil numérique ambitieux au regard du temps disponible (1 an) - Un prototype en passe dêtre achevé grâce à des échanges réguliers - A transformer en une réelle application informatique validée Génie Logiciel = Cycle de production industrielle - Transcrire la masse? Bilan et Perspectives