La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Autour des autorités Journées ABES 2012 Yann Nicolas.

Présentations similaires


Présentation au sujet: "Autour des autorités Journées ABES 2012 Yann Nicolas."— Transcription de la présentation:

1 Autour des autorités Journées ABES 2012 Yann Nicolas

2 IDREF ET LES AUTRES Réseaux dautorités

3 Sudoc Notices bibliographiques IdRef Notices dautorité

4 Sudoc Notices bibliographiques IdRef Notices dautorité theses.fr Calames Articles open access Bib. Num. Cours en ligne

5 Sudoc Notices bibliographiques IdRef Notices dautorité theses.fr Calames Articles open access Bib. Num. Cours en ligne BnFViaf ORCIDISNI Dautres référentiels dautorité globaux ? Référentiels locaux

6 Fichier dautorités virtuel et international Projet OCLC, LC, DnB et BnF jusquen 2012 Service OCLC depuis Mise en correspondance de fichiers dautorités préexistants (dont BnF, IdRef, etc.) Pas de possibilité directe de création, ni de modification

7

8 International Standard Name Identifier Norme ISO (ISO 27729) Un ID unique pour les acteurs des industries créatives Dabord pour la gestion des droits Pas dattribution dID directe Passer par une agence denregistrement (Qui ?) VIAF représente limmense majorité de la base ISNI

9 Open Researcher Contributor Identification Initiative Cible : auteurs scientifiques Initiative des éditeurs Rôle important de Thomson Reuters, qui commercialise la base de citations Web of Science Les chercheurs pourront directement se créer et modifier leur profil et leur ID Du producteur au consommateur revendeur

10 Coexistence des référentiels Soit la concurrence sauvage entre autorités Locales Globales Soit il faut relier ces référentiels entre eux Mais comment ? Différents modèles possibles :

11 Chaque référentiel est lié à chaque autre

12 Un référentiel central, lié à chaque autre

13 Des référentiels à différents niveaux

14 ABC Identifiants à vocation locale Identifiants à vocation globale Sudoc theses.fr Calames Preprints, postprints Cours en ligne Édition électronique CRIS ID Univ. ID Labo ID école ORCID ISNI XYZ Identifiants à vocation régionale BnF IdRef VIAF DNB (All.) DAI (NL)

15 AUTOMATISER LE LIEN AUX AUTORITÉS IDREF SudocAD

16 Projet SudocAD Projet de recherche 2010-2011 Avec des chercheurs du LIRMM (Montpellier 2) : » informatique > intelligence artificielle > représentation de la connaissance Soutien financier dADONIS (CNRS) Objectif : automatiser le lien aux autorités Sudoc Corpus de test : articles de Persée Approche : web sémantique (raisonnement)

17 On extrait de la notice darticle quelques informations pour constituer une sorte dautorité Persée. Il sagit ensuite de trouver lautorité IdRef qui lui ressemble le plus. Date Langue revue Domaine article Nom de lauteur « Autorité» Persée

18 Beaucoup dappelés Rechercher « Christian Schmidt » Minimiser le risque de passer à côté : – nomComplet_a:schmidt,christian – nomComplet_a:schmidt,c. – nomComplet_a:schmidt,c – nomComplet_a:schmidt,christian* – nom_a:schmidt AND prenom_a:c – etc. 39 candidats

19 Pour en savoir plus sur chacune des 39 autorités candidates, on puise dans les notices bibliographiques liées Puis on compare cette autorité enrichie à lautorité Persée Date Langue Sujets Rameau Domaine Nom Date Langue Sujets Rameau Domaine

20 StrongMediumWeakPoorNeutralUnrelatedImpossible Peu délus Chaque autorité candidate est classée dans une des 7 catégories

21 Dans quels cas générer automatiquement un lien à une des autorités candidates ? Différents algorithmes possibles Notre algorithme préféré : 14G2 : liage automatique si un seul candidat dans la catégorie de liage la meilleure parmi Strong et Medium

22 Evaluation de lalgorithme 14G2 77% de bonnes décisions – 58% : décision juste de créer un lien – 19% : décision juste de ne pas créer de lien Mauvaises décisions : – 20 % : décision incorrecte de ne pas créer de lien – 1,9% : décision incorrecte de créer un lien 73% des liens à créer sont créés 4% des liens créés sont mauvais Apparemment, pas plus que chez les humains !

23 Comparaison avec le programme actuel de liage automatique dans le Sudoc SudocAD 14G2Sudoc aujourdhui Parmi les liens créés, combien sont faux ? 4%20% Parmi les liens à créer, combien sont effectivement créés ? 73%43% * Chiffres à confirmer

24 Enseignements de SudocAD Résultats très encourageants Double Exploitation possible : Liage automatique Aide à la décision Marges de progression identifiées : Amélioration de la comparaison des domaines Amélioration de la comparaison des noms Exploitation dautres propriétés comme : » Indexation matière » Co-auteurs » Rôles Les erreurs de lien présentes Sudoc font errer SudocAD Rapport final : http://www.abes.fr/Sudoc/Projets-en-cours/SudocADhttp://www.abes.fr/Sudoc/Projets-en-cours/SudocAD

25 La suite Continuer les expérimentations avec les programmes de SudocAD Nouveaux corpus : HAL, licences nationales Pas dutilisation en production tout de suite Aller plus loin dans le cadre dun nouveau projet de recherche : Qualinca Projet ANR (2012-2015) Avec des labos dinformatique (LIRMM, LIG, LRI) et lINA Sur la qualité des liens dans un catalogue et dans le contexte du web de données » Mesurer la qualité des liens actuels » Générer de nouveaux liens


Télécharger ppt "Autour des autorités Journées ABES 2012 Yann Nicolas."

Présentations similaires


Annonces Google