SFX, OpenURL et la métarecherche François-Xavier Paré Bibliothécaire système Université de Montréal 5 octobre 2005
Plan de la présentation 1)Qu’est-ce que SFX ? 2)Avant SFX 3)Avec SFX 4)En coulisse… –Principes de fonctionnement –Administration du système –Implantation et autres considérations Bonus ! : La métarecherche et les portails
Qu’est-ce que SFX ? Logiciel acquis par l’UdeM en 2002 Permet de faire le pont entre la notice bibliographique d’un article et le texte de cet article en format électronique: SFX Base de données (index) Article en texte intégral
Avant SFX Difficultés: –Demande la compréhension de plusieurs concepts par l’usager (!) –Plusieurs points de rupture potentiels (erreurs de saisie, etc.) –Processus relativement long Notice repérée dans un index Recherche au catalogue (au titre du périodique) Recherche sur le site de l’éditeur Texte intégral De la notice au texte intégral, 4 étapes parfois ardues…
Avec SFX: Processus accéléré et simplifié Notice repérée dans un index Recherche au catalogue (au titre du périodique) Recherche sur le site de l’éditeur Texte intégral De quatre étapes “complexes” à deux SFX
Avec SFX: Processus accéléré et simplifié Notice repérée dans un index Texte intégral De quatre étapes “complexes” à deux 1 2 SFX
En coulisse: Comment ça fonctionne Notice repérée dans un index Texte intégral SFX Source Cible Serveur SFX
En coulisse: Comment ça fonctionne Notice repérée dans un index Texte intégral SFX Lien OpenURL (norme NISO) ctal%20properties%20of%20refined%20box%20dimension%20on%20functional %20graph&aufirst=Meifeng&auinit1=M&aulast=Dai&coden=CSFOEH&date=200 5&epage=1379&genre=article&issn= &issue=4&pages= &spage=1371&stitle=Chaos%20Solitons%20Fractals&title=Chaos,%20Solit ons%20and%20Fractals&volume=23 Ce lien est envoyé au serveur SFX, qui va l’interpréter.
En coulisse: Comment ça fonctionne Notice repérée dans un index Texte intégral SFX Lien OpenURL Le serveur SFX: –Interprète l’OpenURL reçu (métadonnées) –Consulte la base de connaissances (inventaire local) –Détermine quel(s) lien(s) offrir –Affiche le menu SFX avec les liens appropriés
Comment SFX décide-t-il s’il doit offrir un lien ? Selon l’ISSN ou le Titre du périodique – Est-on abonné au périodique ? Selon la Date, le Volume, le Numéro – A-t-on accès à ce numéro en particulier ? $obj->parsedDate(">=",1999,25,1) Si oui à ces deux questions, un lien sera offert. Sinon, pas de lien…
Construction du lien vers le plein texte SFX connait la syntaxe de lien appropriée pour les différents fournisseurs/éditeurs. Exemples: –Emerald: bin/cgi?body=linker&reqidx= X(2005)57:1L.85 bin/cgi?body=linker&reqidx= X(2005)57:1L.85 –Ovid: =PASSWORD&PAGE=fulltext&D=ovft&MODE=ovid&NEWS=N& SEARCH= is+and+56.vo+and+6.ip+and+492.pg =PASSWORD&PAGE=fulltext&D=ovft&MODE=ovid&NEWS=N& SEARCH= is+and+56.vo+and+6.ip+and+492.pg –Institute of Physics:
Construction du lien vers le plein texte La syntaxe peut aussi varier en fonction des métadonnées disponibles. Exemple (Swetswise): –ISSN: –ISSN et Volume: &vol= &vol=56 –(…) –Idéalement: ISSN, Année, Volume, Numéro, 1ère page.
Construction du lien vers le plein texte En résumé: Notice repérée dans un index Texte intégral SFX Lien OpenURLLien formaté sfxlocal?genre=article&issn= &volume=52&issue=1&spage =523 _db?issn= &vol=52&iss=1&page=523&F T=1 ENTRÉE SORTIE
La base de connaissances SFX Contient des informations sur: –260+ ensembles de périodiques –Des milliers de périodiques –Syntaxes de liens, couvertures, etc. Représente tous les périodiques disponibles sur le marché –Nous devons donc indiquer au logiciel SFX ceux auxquels nous sommes abonnés…
SFX – Module d’administration web Démonstration…
Autres services du menu SFX Recherche dans Atrium Formulaire de PEB Autres recherches: –Catalogues d’autres bibliothèques montréalaises –Google Scholar –OAIster –ISI Journal Citation Reports Télécharger la notice dans EndNote/ProCite
Produits “dérivés” de SFX Formulaire Obtenir un article: – Liste des périodiques électroniques: – z/defaulthttp://opurl.bib.umontreal.ca:9003/sfx_local/a- z/default
SFX – Avantages et limites Avantages: –Plus simple pour les usagers: Plus rapide Évite les erreurs de saisie –Mise en valeur de ressources électroniques acquises à fort prix…
SFX – Avantages et limites Limites: –La capacité à se rendre au plein texte dépend: Des métadonnées offertes par la source (quantité suffisante, exactitude) De l’organisation du site cible (syntaxe d’URL prévisible ou non) –Difficile de rester entièrement à jour dans la base de connaissances (malgré mises à jour mensuelles…) –Une application de plus à gérer pour le Bureau des systèmes (implantation, maintenance, mises à jour logicielles, coût, etc.)
La métarecherche et les portails de bibliothèque
Avant la métarecherche (maintenant !) Des dizaines de bases de données disponibles Chaque base (ou plateforme) a une interface distincte, qu’il faut apprivoiser pour chercher correctement On cherche dans une seule base à la fois –Il faut donc reprendre la même recherche dans plusieurs bases…
Avec la métarecherche Une seule requête est envoyée simultanément à plusieurs bases de données Les résultats sont ramenés dans une seule interface, en une liste consolidée
La métarecherche: fonctionnement Métamoteur Base de données X Base de données Y Base de données Z Requête
La métarecherche: fonctionnement Métamoteur Base de données X Base de données Y Base de données Z Résultats X + Y + Z Résultats Z Résultats Y Résultats X
Scénario: Envoi d’une requête 1- L’usager choisit les bases qu’il veut interroger 2- L’usager entre une requête dans le métamoteur 3- Le métamoteur traduit la requête et l’envoie à chaque base choisie, dans le protocole approprié.
Traduction de la requête Il s’agit ici d’une communication machine-machine (métamoteur-base de données). Les deux machines doivent donc s’entendre sur un protocole commun afin de pouvoir “se comprendre” –Z39.50, passerelle XML, etc. Le nom des champs est souvent différent d’une base à l’autre, d’où la nécessité de “traduire” la requête. –Exemple: Title, Titre, TI, 245$a, …
Traduction de la requête Exemple de requête: Titre = Guerre et paix Métamoteur Base de données X Base de données Y Base de données Z TI=Guerre et paix 245$a=Guerre et paix Guerre et paix
Traduction de la requête La syntaxe et le protocole appropriés pour chaque base de données sont connus du métamoteur. –Ces informations sont contenues dans une base de connaissances (comme dans SFX…)
Scénario: Envoi d’une requête (suite et fin) 4- La recherche effectuée dans chaque base de données. 5- Chaque base retourne des résultats (ou un message d’erreur…) dans son propre “langage”. 6- Le métamoteur doit traduire les résultats dans un langage commun. 7- Les résultats seront ensuite jumelés en une seule liste, dédoublonnés, triés, puis affichés pour l’usager. –Bouton SFX pour arriver au plein texte…
Tri des résultats - pertinence Pour des raisons de performance, on ne ramène que quelques dizaines de résultats au métamoteur –On en ramène plus au besoin. Les premiers résultats envoyés sont généralement triés par date Le métamoteur tente le tri par pertinence…
Différents niveaux d’efficacité… Certaines bases permettent de ramener les résultats dans l’interface du métamoteur –Z39.50, passerelles XML Mais ce n’est pas toujours le cas… –“Screen scraping” –Nombre de résultats seulement (Found [x] results)
Autres fonctionnalités des métamoteurs La bibliothèque peut: –Organiser les bases de données par catégories. –Créer à l’avance des sous-ensembles de bases de données pour l’usager (Médecine, Sciences humaines, …) Le métamoteur peut gérer l’authentification pour l’accès aux bases de données, selon certains critères. En s’inscrivant, l’usager peut sauvegarder des notices dans un dossier personnel, créer une liste de bases de données préférées, créer des alertes (DSI), etc. Portail de bibliothèque –Interfaces adaptées à certains groupes d’usagers.
Métamoteurs – Avantages et limites Avantages: –Simplicité et économie de temps pour l'usager Moins de recherches à effectuer Moins d’interfaces à apprivoiser –Utilisation de ressources précédemment négligées –Options de personnalisation
Métamoteurs – Avantages et limites Limites: –Difficile de rester entièrement à jour dans la base de connaissances (malgré mises à jour mensuelles…) –Toutes les bases n'ont la même capacité à accepter les requêtes et retourner les résultats –Problèmes de tri (pertinence) –Une autre application à gérer...
Un débat… Les métamoteurs cachent la complexité des interfaces de chaque base de données (fonctions avancées, particularités) Plus facile (“Google-like”) Trop facile ? –Problèmes aux cycles supérieurs, marché du travail ?