Numérisation de la presse Belge Projet fédéral D/00/02 Alain Goossens Bibliothèque royale de Belgique
Le projet en bref Titres concernés Principes clés du projet Situation en novembre 2008 Exploitation Démo Conclusion
Le projet en bref (1) Numérisation de 30 titres de la presse belge Pourquoi, parmi les collections de la Bibliothèque royale, choisir les journaux comme principal axe de numérisation ? Période couverte : début du journal jusque 1950 Volume : 3.000.000 pages En plus : presse clandestine et censurée des deux conflits mondiaux Volume : 35.000 pages Choix opéré par le CEGES et la KBR
Le projet en bref (2) Cadre : projet de numérisation du patrimoine fédéral 9 projets 15.000.000 € 2005-2008, reports sur 2009 autorisés Investissement de l’Etat pour ce projet : 2.272.000 € Futur ? En discussion actuellement Souhait de la politique scientifique : un large PPP
les titres concernés (1) Le Courrier de l’Escaut (1829-1950) Le Journal de Charleroi (1837-1950) L’Indépendance belge (1843-1940) Het Handelsblad (1844-1950) La Meuse (1855-1950) La Gazette de Charleroi (1878-1950) De Gentenaar (1879-1950) Vooruit (1884-1950) Le Peuple (1885-1950) Het Nieuws van den dag (1885-1950) Het laatste Nieuws (1888-1950) De Gazet van Antwerpen (1891-1950) Het Volk (1891-1950) Le Vingtième Siècle (1895-1940) L’avenir du Luxembourg (1897-1950)
Titres concernés (2) La Dernière Heure (1906-1950) De Standaard (1914-1950) De Volksgazet (1914-1950) La Libre Belgique (1915-1950) La Nation belge (1918-1950) Vers l’Avenir (1918-1950) De Schelde (1918-1936) La Wallonie (1919-1950) Le Drapeau Rouge (1921-1950) De Rode Vaan (1921-1950) Grenz Echo (1927-1950) De dag (1934-1944) Le Pays Réel (1936-1944) Volk en Staat (1937-1944) La Cité nouvelle (1937-1950) + presse clandestine et censurée des deux conflits mondiaux
Principes clés du projet Scinder numérisation et exploitation Confier via appel d’offre européen la numérisation à un sous-traitant Scinder exploitation intranet et Internet Négocier l’exploitation Internet avec les ayant droits Assurer la conservation pérenne du patrimoine numérisé
Situation en novembre 2008 Juillet 2007 : lancement de l’appel d’offre Depuis janvier 2008 : numérisation + OCR + segmentation Depuis janvier 2008 : réflexion sur le stockage et l’accès Seuls (KBR + CEGES) ? (oui, mais insuffisant) De façon concertée avec les autres ESF ? (toujours ouvert) Via PPP, avec les éditeurs ? (toujours ouvert + auteurs + journalistes + ???) Depuis juillet 2008 : exploitation (en fait… exploitations : cf slides suivants…)
Exploitation (1) Interne : = missions de base de la bibliothèque Externe : complexe, pcq nouvelles missions… mais on progresse Belge : Belgica@kbr.be Internationale : RFBNN Internationale : Europeana …
Exploitation (2) De la totalité des pages numérisées : dans les murs de la bibliothèque Partielle ou totale : sur Internet
Exploitation (3) Gratuite : dans les murs de la bibliothèque Gratuite : sur Internet pour les journaux libres de droits Gratuite ou payante : sur Internet pour les journaux sous droits
Démo Outils mis en place à la Bibliothèque royale (en développement) http://mara.kbr.be/calendarapp/calendar1fr.php http://mara.kbr.be/nutch/KBRSearch.php
Conclusion (1) La numérisation prend plus de temps que prévu Phase de démarrage = long dialogue… Cadences difficiles à soutenir >< qualité OCR erratique Contrôle qualité nécessaire et long… Très bonne volonté de nos partenaires Le marché public nous protège très bien
Conclusion (2) Le défi de l’exploitation est passionnant, mais complexe car neuf Pour la Bibliothèque Pour les représentants des auteurs, des journalistes Pour les représentants des éditeurs Globalement, les coûts de numérisation + exploitation sont et seront toujours supérieurs aux recettes futures Le plus important = obtenir la sécurité juridique, via accord le plus large possible entre ayant droits, et conscience des droits et devoirs respectifs de tous ! La complexité croît encore lorsqu’on se place dans la perspective d’un PPP global à tous les ESF, pour tout type de documents patrimoniaux numérisés
Conclusion (3) Une seule plateforme d’exploitation ne suffit pas La redondance permettra de toucher plus d’internautes Via l’association privé-public, des plateformes à modalité d’accès et de services divers peuvent éclore. Il n’y a aucune incompatibilité avec les missions de base des bibliothèques
Conclusion (4) Au-delà de la numérisation et des formes d’exploitation, la préservation numérique est un vrai défi également Notre approche : Formats ouverts (le + possible) Lien structurel entre les formats + métadonnées Stockage multiple + monitoring : On-line (serveur, Bibliothèque royale) Near on-line (tape, Bibliothèque royale) Off-line (disque + tape, hors site)
Contacts : Coordination : alain.goossens@kbr.be Technique : elisabeth.mazur@kbr.be Presse belge : marc.dhoore@kbr.be Presse clandestine et censurée : dirk.luyten@cegesoma.be jan.laplasse@cegesoma.be