StatutLogiciel libre Communauté dutilisateurs Importante communauté dutilisateurs francophones (France Euro Méditerranée). Logiciel inter-UNT francophone.

Slides:



Advertisements
Présentations similaires
Vers une généralisation du projet et évolution des fonctionnalités
Advertisements

Tutoriel - Les Ressources du BCH
Module 5 : Implémentation de l'impression
Le struts validator – framework de validation
GESTION D’IMPRISSION SOUS WINDOWS & LINUX
Point sur le CMS Web InfoGlue et nouveau canal « lecture des annonces » ESUP-days Journées du 22 et 23 juin à Paris.
03/05/05 - RB1 inJAC Présentation générale. 03/05/05 - RB 2 Lapproche ESUP du CMS Avoir un référentiel de documents structurés, intégré au portail en.
13/04/05 - RB1 Montpellier 24/03/2005 Les interactions entre le SSO ESUP et le mécanisme de propagation d'identité
Esup-Days juin 2006 Démarche de gestion électronique de documents à l'échelle de l'établissement Thierry Bédouin – CRI Rennes 1 Véronique Prévet.
CSIESR-Arles 16/05/06 -F. JANNIN- B. SOR inJAC ESUP et OAI-PMH Le CMS détablissement dESUP.
Nouvelle version du canal Esup MonDossierWeb
Projet ORI-OAI Outil de Référencement et dIndexation Réseau de portails OAI ESUP-Day Paris, 5 juillet 2007.
CIUEN Palais des Congrès de Bordeaux, 12 décembre 2008 Projet ORI-OAI Outil de Référencement et dIndexation Réseau de portails OAI Normalisation et référencement.
Projet ORI-OAI Outil de Référencement et dIndexation Réseau de portails OAI ESUP-Day Paris, 26 janvier 2007.
Projet ORI-OAI Réseau de portails OAI Printemps dUNIT 24 mai 2007.
Projet ORI-OAI Réseau de portails OAI 27/03/2007.
Projet ORI-OAI Réseau de portails OAI Séminaire indexation Paris, 27 mars 2007.
SITools Présentation de l’outil (1/2)
La diffusion des métadonnées de la thèse
VLC UMVF Fiche Veille Statut Logiciel gratuit, open source
Moteur de recherche Google
Une solution personnalisable et extensible
Domaines nominaux XSLT
version Beta Marie Calberg Ninni Louhelainen SLFN7
Copyright © – ESUP-Portail esup-commons : où en est-on ? Pascal Aubry IFSIC / Université de Rennes 1
TP 3-4 BD21.
Assistance à distance Parfois on se sent bien seul face à un problème informatique surtout si on n’est qu’un simple utilisateur. Lorsqu'un problème survient.
Systèmes d’exploitation
Formation Microsoft® Office Access 2007
Annuler les corrections automatiques Annuler les corrections automatiques « Régler » les CSS « Régler » les CSS Définir le site et utiliser une technologie.
Les outils d’intégration continue
Active Directory Windows 2003 Server
Etude des Technologies du Web services
SECURITE DU SYSTEME D’INFORMATION (SSI)
XML-Family Web Services Description Language W.S.D.L.
Module 1 : Préparation de l'administration d'un serveur
Algorithmique et Programmation
La création de sinistre, la sélection à des fins de consultation, modification ou impression sont accessibles grâce à la barre de menu à gauche de l'écran.
1 Sécurité Informatique : Proxy Présenter par : Mounir GRARI.
Archimède : dépôt institutionnel de la Bibliothèque de lUniversité Laval Par Rida Benjelloun Chef de la section recherche.
Chap 4 Les bases de données et le modèle relationnel
Administration de bases de données spatiales avec SavGIS
Le Travail Collaboratif ...
Des outils pour le développement logiciel
Notions sur le XML Réfs : manuel p 149. Introduction Le XML (eXtensible Markup Language) est un standard d'échange de données. Il fait partie comme le.
Standards pour les ressources documentaires description – organisation – diffusion – production Séminaire Normes et standards pour les TICE Saint-Clément-les-Places.
Création d'un projet Web avec Netbeans
PhP-MySQL Pagora 2012/2013 CTD 1 - Presentation de moi ^^
Module 2 : Préparation de l'analyse des performances du serveur
Le cœur du projet : objectifs Lélaboration dune base de corpus (principalement oraux) regroupant des données de langues de différentes natures –Une approche.
Document élaboré à Centrale Paris par Pascal Morenton LES TECHNOLOGIES DU WEB 1. LES PHASES D UN DEPLOIEMENT DE RESEAUX 2. LE LANGAGE HTML 3. LE LANGAGE.
Exporter – Graver - Présenter  C'est grâce aux collections que "Exporter graver présenter" prend tout son sens  On peut y exporter un ensemble d'images,
1 Architecture orientée service SOA Architecture orientée service SOA (Service Oriented Architecture)
PHP 5° PARTIE : LES COOKIES
Elabore par BELKADHI ABIR BEN HASSEN SALMA CHEBBI MARWA
JDBC L'API JDBC est utilisée pour utilisée pour intéragir avec une base de données.
0 Objectifs de la session n°1  Revenir sur toutes les bases théoriques nécessaires pour devenir un développeur Web,  Découvrir l’ensemble des langages.
ENGIMA.
Expose sur « logiciel teamviewer »
Yonel GRUSSON1 Installation d'une imprimante sous Windows 200x Server.
Migration De Frantiq Vers Koha
Formation sur la publication des données de biodiversité dans le réseau GBIF et leur aptitude à être utilisées, édition 2011 Comment le DwC-A a changé.
Master 1 ère année Sécurité des Systèmes Informatique 1 Gestion de modules  Un module est un morceau de code qui peut être chargé à la volée dans le noyau.
S'initier au HTML et aux feuilles de style CSS Cours 5.
FTP : File Transfer Protocol (protocole de transfert de fichier ) est un protocole de communication destiné à l'échange informatique de fichiers sur.
Module 3 : Création d'un domaine Windows 2000
En route vers le déploiement . . .
CPI/BTS 2 Programmation Web Les sites dynamiques Prog Web CPI/BTS2 – M. Dravet – 02/10/2003 Dernière modification: 02/10/2003.
Introduction Module 1.
Transcription de la présentation:

StatutLogiciel libre Communauté dutilisateurs Importante communauté dutilisateurs francophones (France Euro Méditerranée). Logiciel inter-UNT francophone développé par UNIT. NatureOutil de référencement et d'indexation en réseaux de portails compatibles OAI-PMH Caractéristiques fonctionnelles Recherche simple avancée et thématique sur les metadonnées recherche sur texte intégral Référencement collaboratif des documents Gestion des différents formats de metadonnées (LOM-fr, Dublin Core, …) Archivage du document natif des auteurs Gestion de version Ouverture sur les réseaux avec échange de metadonnées via le protocole OAI/PMH Caractéristiques techniques Développement en Java/J2e Environnement Linux Urlwww.ori-oai.org Url de téléchargementhttp:// Fiche Veille ORI-OAI

Installation de version définitive UMVF Niveau installateurIngénieur Temps dinstallationPour la version professionnelle (non démo) 1 journée dinstallation 4 jours de configuration Temps de paramétrageTrès variable en fonction des ambitions du site. De quelques jours dans un usage « par défaut » à quelques semaines. Logiciel complémentaireScript en langage Ruby pour lUMVF : moulinette qui transforme les notices de Cismef Rouen en notices acceptées par le logiciel ORI-OAI pour avoir une chaîne complère. 10 jours Rédaction1 jour Installation Veille ORI-OAI

Pré-requis ORI-OAI est consitué d'un ensemble d'applications J2EE, ce sont les modules ORI-OAI. Ces modules fonctionnent sur un conteneur de servlet J2EE. Le conteneur de servlet J2EE conseillé (car utilisé en développement et en production par les établissements développeurs/testeurs) est le serveur web Tomcat - Jakarta. On conseille l'utilisation de Java 5 et de Tomcat 5.5. On conseille l'installation d'un serveur Tomcat par module pour plus de confort (même si on peut faire tourner tous les modules sur un seul serveur Tomcat) : les différents modules s'inter-connectent entre eux via WebService. On conseille l'utilisation d'un environnement Linux (à un environnement Windows) même si on peut aussi envisager de faire tourner ces applications sur d'autres environnements non testés pour le moment (Mac Os par exemple). Dans le cadre de l'installation de tous les modules sur une seule machine, 4Go de RAM sont recommandés, 8Go est cependant certainement idéal : certains modules requièrent en effet un volume important de Mémoire Vive pour fonctionner au mieux (c'est le cas de l'éditeur de métadonnées). Enfin, certains modules d'ORI-OAI s'appuient sur un serveur SQL (MySQL est recommandé - la base doit supporter les transactions, le storage InnoDB de MySQL est à utiliser), un serveur XML (base de données eXist) et un LDAP (testé avec OpenLdap, mais tout serveur répondant au protocole LDAP est censé convenir). Sources: Installation Veille ORI-OAI

ORI-OAI se décompose en 7 modules : ORI-OAI-workflow pour la gestion des documents locaux ORI-OAI-harvesting pour la moisson d'autres entrepôts via le protocole OAI-PMH ORI-OAI-indexing pour l'indexation des ressources ORI-OAI-search pour la recherche de documents locaux et distants ORI-OAI-vocabulary qui gère les différentes classifications et vocabulaires ORI-OAI-repository pour exposer les fiches de métadonnées via le protocole OAI-PMH ESUP-serveur-WebDAV développé dans le cadre de ESUP Portail, et proposé comme système de stockage de documents dans ORI-OAI L'architecture du système ORI-OAI dans sa version 1.0 est présentée sur la diapositive suivante : Description Veille ORI-OAI Sources:

Description Veille ORI-OAI

Intérêt pour lUMVF Veille ORI-OAI LUMVF se doit de faire évoluer son indexation suivant la logique internationale. Elle doit utiliser le logiciel commun des UNT développé par UNIT (ORI-OAI). Par ailleurs, dans le cadre du projet Mère-enfant, le Ministère des Affaires Etrangères nous a demandé que la banque de données centrale multimedia des DU soit indexée ORI-OAI. Pour pouvoir utiliser ce logiciel, il fallait développer un module complémentaire qui transforme les standards actuels dindexation de lUMVF, de Cismef et de Rennes, en standard acceptable par le logiciel ORI-OAI; ceci, pour avoir un workflow complet.

Veille ORI-OAI Annexe Spécification dune moulinette UMVF Cismef vers ORI-OAI

Etude Veille ORI-OAI Notices CISMEF -> LOM -> ORI-OAI Cette étude porte sur l'exportation des fiches CISMEF en fiches LOM puis à leur intégration dans un ORI-OAI de Démonstration. 1. LOM / LOMFR / SUPLOMFR /... Le format LOM est utilisé car pour chacun des autres formats, le schéma XML n'existe actuellement pas. Ce qu'il faut en retenir, c'est que d'un point de vue technique, faire du LOMFR / SUPLOMFR n'est à ce jour pas possible, le passage de LOM en LOMFR / SUPLOMFR ne sera qu'une question technique de très faible ampleur, n'aura aucun effet (ou quasiment) pour l'étude faite ici. 2. Export en LOM des fiches CISMEF Afin d'automatiser ensuite le processus, il est important de réaliser en premier lieu une transformation manuelle d'une notice CISMEF type en une notice LOM : c'est durant cette phase que l'on définit une correspondance entre le format donné par CISMEF et le LOM. La difficulté étant de choisir une correspondance qui respecte au mieux les recommandations LOM tout en perdant le moins d'informations possible par rapport aux fiches CISMEF initiales. C'est l'exposition en format RDF (intégré dans le HTML) des fiches CISMEF qui permet ensuite d'automatiser le procédé facilement.

Veille ORI-OAI 2.1. Conception (manuelle) d'un export de test : Fiche de test. Il est important dès cette première phase d'exploiter les informations données au niveau de l'export RDF (et non pas au niveau du HTML). Vous pouvez retrouver les fichiers utilisés/créés durant cette première phase dans le répertoire cismef_fiche_test. (zip en téléchargement)zip en téléchargement La fiche html a été récupéré directement depuis cette url rouen.fr/html/nl/22/ html. rouen.fr/html/nl/22/ html On en a retiré la partie RDF pour concevoir le fichier XML _rdf.xml (simple coupé/collé). Le fichier _lom.xml a ensuite été réalisée manuellement. Quelques notes pour cet export de _rdf.xml en _lom.xml : Après un premier jet, les correspondances ont été affinées en regardant l'échantillon des 10 fiches mis à disposition (cf le fichier cismef_listing.txt). La description donnée en RDF peut parfois ressembler à un ensemble de mots-clés (séparés par des virgules), c'est le cas de _rdf.xml mais sur d'autres fiches, on récupère véritablement un texte descriptif. Donc on a logiquement préféré l'utilisation de la balise lom:description à la balise lom:keyword. Les mots-clés (subject) RDF correspondent à des mots-clés contrôlés issus d'un thésaurus spécifique (MESH/F-MESH). Ils ont ainsi toute leur place dans la partie classification du lom (avec l'objectif renseigné à discipline). Dans lom:keyword on a choisi de placer le CISMeFType Quelques éléments (très peu) n'ont pas été repris (pas de correspondance en LOM, pourrait figurer dans un schéma spécifique UMVF/CISMEF étendant le LOM (?)). C'est le cas, de cismef:Parrain, cismef:Departement, cismef:Pays. On pourrait aussi les ajouter à la description.... Etude

Veille ORI-OAI 2.2. Moulinette/Script pour automatiser l'export vers LOM. On a choisi le langage Ruby pour programmer le script d'export. Ce script, en Ruby, a l'avantage d'être simple à comprendre, concis, donc facile à reprendre, à étendre, etc. Multi-plateforme, le script peut tourner sous windows, mac-os, linux. On peut subdiviser le script en 5 parties. La première partie, outre la déclaration des librairies requises, définit des variables constantes permettant d'établir une correspondance entre les vocabulaires RDF et ceux issus du LOM. Cette correspondance ne peut se faire (a priori, en tout cas par rapport aux éléments que l'on a) que de manière empirique. Aussi lors d'une exportation d'un ensemble autre que l'échantillon actuel, il sera très certainement nécessaire de compléter les différents mapping (c'est à dire déclarer les correspondances manquantes entre les vocabulaires) (1). (1) Le script signale en sortie standard par ce type de message : ### WARN: Map_formats doesn't know : zip le fait qu'il manque une correspondance (dans ce cas la, il faut définir la correspondance de zip à application/zip [cf RFC2048, cf le document IEEE spécifiant la LOM] La partie get_cismef_html lit le fichier cismef_listing.txt, récupère les fichiers ainsi listés via une requête HTTP pour les placer dans le répertoire cismef_html. Une conversion est nécessaire de l'encodage ISO vers l'encodage UTF-8 : d'une manière générale, UTF-8 est fortement conseillé notamment dans une optique d'échange, de partage de fichiers XML. Etude

Veille ORI-OAI La partie extract_cismef_rdf extrait simplement la partie RDF du fichier HTML pour les placer dans le répertoire cismef_rdf. On notera pour simple information que l'on a du cependant modifier le préfixe d'un espace de noms, pour une raison X ou Y l'utilisation de value en tant que préfixe pose un problème au parser Ruby ReXML. On a simplement remplacé le préfixe value par val (ce qui n'a aucune conséquence). La partie convert_rdf_lom est la partie la plus importante : c'est ici que l'on transforme les fichiers RDF en fichiers LOM. C'est donc ici que l'on peut affiner, faire évoluer la correspondance RDF->LOM si on le souhaite. On notera que l'on procède en fait en « remplissant » le fichier cismef_lom_template.xml que l'on utilise comme patron de conception pour les fichiers LOM (il peut ainsi permettre de positionner des valeurs génériques pour toutes les fiches LOM produites). Les fichiers LOM ainsi produits sont stockés dans le répertoire cismef_lom. Enfin la dernière partie constitue la fonction principale. C'est elle qui est appelée lorsqu'on lance le script : 'ruby cismef_export.rb'. Elle appelle simplement séquentiellement les 3 fonctions ci-avant. Les 3 fonctions données avant stockant leurs résultats directement dans des répertoires spécifiques, une fois récupérés tous les fichiers RDF, et pour affiner, modifier la correspondance RDF->LOM en fonction des fichiers importés on peut par exemple commenter l'appel aux 2 premières fonctions pour lancer uniquement l'export RDF->LOM. Etude

Veille ORI-OAI Notes : les classifications MESH/F-MESH sont à améliorer : on n'a pas pu correctement programmer la correspondance entre les termes MESH et F-MESH. En effet dans les RDF de Cismef, nous n'avons pas l'information de corrélation entre les termes MESH/F-MESH : ces termes sont donnés dans 2 blocs séparés et sont triés par ordre alphabétique (les correspondances anglais/français ne sont ainsi pas dans le même ordre). Pour y remédier, le plus simple serait de faire en sorte que dans les fiches RDF de Cismef, l'ordre des éléments français/anglais coïncident, ce qui devrait résoudre directement ce problème (le script d'export devrait normalement ne pas être modifié pour autant). Etude

Veille ORI-OAI 1.3. Validation des fiches LOM Il est possible de valider les fichiers LOM via le schéma XML LOM. Les fichiers LOM doivent nécessairement être valides par rapport au schéma XML LOM pour qu'ils puissent être considérés comme respectant la LOM (ce n'est cependant pas une condition suffisante : le format VCARD n'est par exemple pas vérifié...). Pour valider un fichier LOM on peut simplement utiliser la librairie Xerces (librairie Java). Dans le dossier validate_xml, on fournit une distribution de Xerces avec une ligne de commande (verif.sh) : depuis ce répertoire validate_xml, on peut appeler./verif.sh $1 ou directement la ligne java -classpath xerces-2_9_0/xercesImpl.jar:xerces-2_9_0/xercesSamples.jar:xerces-2_9_0/xml-apis.jar dom.Counter -s -n -v -f $1 où $1 est le fichier à valider. Si l'on souhaite valider tous les fichiers du répertoire en une seule commande sous linux, on pourra ainsi lancer depuis validate_xml quelque chose du type : find cismef_lom -name "*.xml" -exec./verif.sh {} \; -print Notez que le schéma est alors récupéré depuis le schemaLocation (connection web) donné dans chaque fiche XML LOM, pour chaque fichier ce qui peut prendre du temps. On peut accélérer le processus en changeant (temporairement) le schemaLocation des fiches pour le positionner sur une copie du schéma LOM en local. [notez que pour les 10 fiches de l'échantillon ainsi exportées, on s'est bien sûr assuré qu'elles passaient au validateur]. Etude

Veille ORI-OAI 3. Démonstrateur ORI-OAI On rappelle que les différents modules ORI-OAI sont libres et open-sources. C'est également le cas pour le code qui permet de construire le démonstrateur ORI-OAI lui-même (accessible librement via l'entrepôt subversion) Par rapport au démonstrateur standard, on a : modifié les logos modifié les configurations des modules ori-oai-indexing et ori-oai-search pour prendre en compte la discipline de type MESH/F-MESH, ainsi que le module vocabulaire pour qu'il fournisse via le module ori-oai-indexing un vocabulaire simple des termes MESH/F-MESH fait en sorte d'initialiser le module ori-oai-workflow avec les fiches de l'export de notre échantillon (petite manipulation non triviale pour intégrer cela dans le démonstrateur, dans une installation standard l'appel de la target ant importmetadatas est plus directe). publié ces fiches pour qu'elles soient connues du moteur d'indexation Notes : Les configurations faites ici seraient à améliorer pour une installation et une mise en exploitation : il faudrait notamment construire un fichier de vocabulaires présentant les termes MESH/F-MESH cela afin de : proposer une navigation thématique plus ergonomique dans l'interface de recherche proposer des sets oai-pmh en relation avec cette classification proposer une aide à la saisie dans l'éditeur de métadonnées. De plus en terme de classification, les différentes UNT ont pris l'option d'utiliser la classification dewey comme classification pivot, il serait ainsi intéressant de renseigner cela dans les fiches LOM. D'une manière générale, les fiches LOM sont certainement à compléter au moins en partie afin d'exploiter au mieux le LOM. On notera enfin que actuellement, le module ori-oai-workflow est difficilement maniable si un utilisateur doit gérer seul un nombre très important de ressources (par exemple 6000 fiches)... ce n'est sans doute pas bloquant mais le module ori-oai-workflow devrait cependant évoluer pour améliorer cela rapidement (cf les tickets du module ori-oai-workflow sur la plateforme sourcesup.cru.fr). Etude