Introduction à la structuration des documents: les applications M2: Gestion des connaissances
Plan De lutilité à structurer les documents Les archives ouvertes
De lutilité à structurer les documents: les pages web Tout document numérique est structuré Exemple: les pages web –Code source dune page web réelle (site du GRESEC)
De lutilité à structurer les documents: les pages web Site officiel du laboratoire GRESEC Bienvenue au Gresec Exemple de page HTML simple
Exemple dapplication Calcul du PageRank
Indices utilisés Mots-clés des liens – mot-clé pertinent... Noms et attributs « alt » des images – Se prémunir contre les spam… – Vous pouvez poster ici vos avis… … etc.
De lutilité à structurer les documents: les fils RSS
Le Point – Société Fil RSS de la page Société du journal Le Point Affaire Neyret - L'homme arrêté à Cannes avait un casier vierge malgré une condamnation Stéphane Alzraa, écroué vendredi à Grasse, dans les Alpes- Maritimes, dans le... Mon, 03 Oct :14: _23.php Le procès en appel de Jérôme Kerviel aura lieu en juin Jérôme Kerviel, lourdement condamné en 2010 pour une perte record à la… Mon, 03 Oct :14: lieu-en-juin _23.php jpg_ JPG
Michel Neyret mis en examen La garde à vue de Michel Neyret s'est achevée ce matin à 6 heures. Il a été... Mon, 03 Oct :53: _23.php
Les Archives ouvertes Historique et objectifs Fonctionnement Applications –Bibliothèques –Communautés scientifiques Exemples à explorer
Historique et objectifs L'OAI-PMH –Open Archives Initiatives Protocol for Metadata Harvesting –Protocole de moissonnage OAI Archive –« classique » –E-prints –ICI: réservoir, lieu ressource
Historique et objectifs Ouverte: –« gratuit » –« libre » (architecture technique) –ICI: libre et parfois gratuit
Quest-ce que cest? Historique: –Années 90: bases pre-print, post-print –Standards inter opérables –Convention de Santa Fé 1999 Fédérer les initiatives Développer les échanges Mise en place du protocole OAI-PMH
Historique et objectifs Caractéristiques: Dépasser les barrières du « web invisible » Interopérabilité des ressources Mise à jour simplifiée Encourager ladoption des standards Dublin Core Intégrer des ressources de types et dorigines diverses
Comment ça marche? Facilitation des échanges entre: Fournisseurs de données Fournisseurs de services Avantages Réservoirs denregistrements Sans déplacer ou dupliquer les documents Exemple: bibliothèque Visibilité du fonds propre Portail documentaire spécialisé Partenariats: catalogues collectifs, etc.
Fonctionnement Concepts de base: Ressource Item Enregistrement Lot
Fonctionnement
Éléments essentiels Entrepôt Moissonneur Agrégateur
Fonctionnement Protocole: –Soumission des requêtes en HTTP Identify ListMetadataformats ListSets ListIdentifiers GetRecord ListRecords –Réponses en XML (métadonnées)
Applications Bibliothèque: –Entrépôt: Valorisation du fonds électronique –Moissoneur: Portail spécialisé, catalogue collectif, etc. Outils libres:
Applications Services: –Agrégateurs encyclopédiques: OAIster (Univ.Michigan) –Grands répertoires thématiques: Michael (fonds européen culturel numérique) PictureAustralia (patrimoine pictural et photo) BNSA (banque numérique du savoir dAquitaine) France-Généalogie
Exemples Les OAI scientifiques: car tout commence là… Exemples: ArXiv X: –Physique, mathématiques, etc. –P.Ginsparg (Los Alamos, puis Univ.Cornell) MathDoc: –Mathématiques, UJF Liste plus complète sur:
Exemples Mise en valeur du fonds propre Partie OAI du projet GALLICA – Projet American Memory, (Bibliothèque nationale du Congrès) –
Exemples Agrégation de fonds thématiques – type portail : Projet européen Michael – Picture Australia – Et…sur Grenoble, Aladin: –
Exemples Agrégation de fonds type catalogue OAIster: – ArXiv: –