Télécharger la présentation
La présentation est en train de télécharger. S'il vous plaît, attendez
Publié parAlbert Nguyen Modifié depuis plus de 9 années
1
Une Globale Bibliothèque Digitale pour la Physique de Haute Energie Annette Holtkamp CERN-UNESCO School on Digital Libraries – Dakar, Nov 2011
2
2 HEP communauté l communauté très interconnectée n 20-30k chercheurs actives publiant 10k articles/an n large collaborations (jusqu'à 5000 membres) n très international (même petits groupes) n auteurs = lecteurs l échange rapide d’informations essentielle n envoi postal de pretirages depuis 60’s n longue tradition d'accès ouvert n >90% de HEP articles publiés en journaux aussi sur arXiv l dominance de systèmes d'information développés par la communauté n arXiv n SPIRES
3
Dominance of community services 3 From 2007 survey of 2,000 physicists. Gentil-Beccot et al, Information Resources in High-Energy Physics: Surveying the Present Landscape and Charting the Future Course. J.Am.Soc.Inf.Sci.60:150-160,2009 arXiv:0804.2701
4
SPIRES (1974-) 4 l réseau de bases de donnees n HEP littérature, conférences, institutions, expériences, hepnames, jobs l SLAC – DESY – Fermilab Collaboration l SPIRES-HEP n métadonnées pour 850k objets, ~800 nouvelles notices par semaine records n prétirages, articles publiés, conférence contributions, livres, littérature grise n depuis 1974, web serveur depuis 1991 n 100k recherches/jour l metadonnées haut de gamme, traitées manuellement l couverture compréhensive l grande acceptance, engagement des utilisateurs Mais: l technologie démodée des70‘s
5
5 run by (2007-) http://inspirehep.net
6
6 Contenu bibliographique l SPIRES contenu (+ part de CDS): articles publiés, conference proceedings, prétirages, notes d’expériences, theses l par-delà SPIRES: transparences, multimédia, logiciel, données de recherche… l par-delà 1974 l plus de matériaux de disciplines voisines astrophysique, physique nucléaire, mathématique… cité par HEP articles
7
7 Archive de textes intégrales l tous les articles en libre accès n esp. matériaux en danger de disparaitre l thèses: action dédiée n recherche dans archives institutionelles / sites d’expériences n email aux auteurs n page de soumission (prévu) l articles d'accès restreint n “archive caché” n accords avec Springer et APS l matériaux historiques n digitalisation d’anciens séries de prétirage ou series de conférences. l par-delà articles n transparences, multimédia, logiciels, wikis…
8
8 Recherche l 3 modes de syntax: n Google-like freetext search („Dakar supersymmetry“) n Spires syntax („find aff Dakar and t supersymmetry“) n Invenio syntax („affiliaton:‘Dakar‘ title:supersymmetry“) l recherche en texte integrale recherche complex de seconde ordre Example: Cherche les articles d‘auteurs de Benin qui citent des articles écrits par d‘auteurs de Dakar et cités eux-memes plus de 10 fois affiliation:Benin refersto:affiliation:dakar cited:10->100
9
9 Recherche de texte integrale - fragments
10
10 Page détaillée d’une notice l résumé l mots-clefs l publication info l vignettes de figures l divers formats d’exportation l tabs for n references n citations n fulltext n full-sized plots with captions
11
11 Notice détaillées avec figures
12
Figures détaillées
13
Extraction de figures l figures extraites de sources LaTeX (arXiv) l légendes recherchables n caption:neutrino a venir bientot: l extraction de pdf l phrase du texte integrale qui référence la figure
14
Extraction de références refextract: module pour extraire références de pdf MARC sous-zones (Inspire) $o numéro de la référence $h auteurs $a DOI $u Uniform Resource Identifier $r report number $s journal publication $m reste non identifié
15
refextract exemple fulltext: [3] V. A. Bednyakov, N. D. Giokaris, and A. V. Bednyakov, “On Higgs mass generation mechanism in the standard model,” Phys. Part. Nucl., vol. 39, pp. 13–36, 2008. MARC: 999C5 $$hV. A. Bednyakov, N. D. Giokaris, and A. V. Bednyakov $$m"On Higgs mass generation mechanism in the standard model” $$o[3] $$sPhys.Part.Nucl.,39,13 web: On Higgs mass generation mechanism in the Standard Model - Bednyakov, V.A. et al. Phys.Part.Nucl. 39 (2008) 13-36. hep-ph/0703280 [HEP-PH]
16
16 Analyse de citations l références l référencé par passé l référencé concuremment avec l self-citations l histoire de citation (développement temporale) référencé par références référencé concuremment avec passé futur
17
Citation analysis: Example
18
18 Page d’auteur l histoire d’affiliations l co-auteurs l mot-clefs fréquents l types de publications l analyse de citations
19
Profile d’auteur
20
Profile d’auteur: Resume de citations
21
21 HEPNAMES
22
22 HEP taxonomie structure hierarchique d‘importants HEP concepts (dynamical symmetry breaking) offrant n synonymes (dynamically broken) n termes reliés (spontaneous symmetry breaking) n termes plus/moins généraux (symmetry breaking) n définitions n domaines de sujet (high-energy physics – theory)
23
23 Keyword extraction arXiv:0903.3933 Author keywords: quantum cosmology -> quantum cosmology wheeler-dewitt equation -> tunneling probability -> tunneling positive cosmological constant -> cosmological constant Composite keywords: 10 transformation, canonical [22, 24] 9 potential, symplectic [22, 33] 3 tensor, energy-momentum [3, 3] 2 quantization, canonical [8, 24] 2 symmetry, gauge [4, 2] 2 oscillator, harmonic [2, 2] 1 dimension, 2 [0, 33] 1 fluid, pressure [22, 2] 1 operator, differential [16, 1] 1 inflation, open [4, 1] 1 field theory, scalar [0, 1] Single keywords: 19 wave function 14 tunneling 13 Wheeler-DeWitt equation 13 cosmological constant 8 zero mode 7 Robertson-Walker 7 quantum cosmology 6 variational 5 Schroedinger equation 4 boundary condition 4 Poisson bracket 4 phase space Acronyms: WDW Wheeler-DeWitt equation Core keywords: Wheeler-DeWitt equation quantum cosmology
24
24 Taxonomie: applications l rapide génération automatique de mots-clefs n permettant e.g. alertes immediates n ameliorés manuellement plus tard l selection automatique d‘articles pertinents pour HEP n pas de retard a cause de selection manuelle en disciplines voisines l algorithme de recherche amelioré (prévu) n recherche de „SUSY“ trouve aussi „supersymmetry“ n amplifier/limiter une recherche l user tagging (prévu) n ameliorer la classification generee par Inspire n ameliorer la taxonomie
25
25 Identification d’auteurs l INSPIRE author id n compatible avec d’autres schémas d’identification n participation active en ORCID l desambiguisation algorithmique n exploitant e.g. lab id’s, histoire d’affiliations, co-auteurs et plus n ~260k differents auteurs identifiés l association automatique d’articles avec auteurs n exploitant info sur affiliations, co-auteurs, sujets, références G. Chen: 963 docs, 21 real authors, only 22 docs not assigned, 97.2% success rate n INSPIRE-id composant de listes d’auteurs des larges collaborations
26
26 Crowdsourcing: Claim My Paper
27
27 Crowdsourcing: Claim My Paper
28
Claim my Paper interface
29
Claim my Paper interface
30
30 Crowdsourcing: references
31
31 Crowdsourcing: references
32
Projets en developpement l crowdsourcing n Page de soumissions pour theses n mise a jour avec des notes de publications n interface pour ajouter mot-clefs l analyse de documents n extraction d’auteurs, affiliations, titres, resume l recognition of affiliations
Présentations similaires
© 2024 SlidePlayer.fr Inc.
All rights reserved.