La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Une Globale Bibliothèque Digitale pour la Physique de Haute Energie Annette Holtkamp CERN-UNESCO School on Digital Libraries – Dakar, Nov 2011.

Présentations similaires


Présentation au sujet: "Une Globale Bibliothèque Digitale pour la Physique de Haute Energie Annette Holtkamp CERN-UNESCO School on Digital Libraries – Dakar, Nov 2011."— Transcription de la présentation:

1 Une Globale Bibliothèque Digitale pour la Physique de Haute Energie Annette Holtkamp CERN-UNESCO School on Digital Libraries – Dakar, Nov 2011

2 2 HEP communauté l communauté très interconnectée n 20-30k chercheurs actives publiant 10k articles/an n large collaborations (jusqu'à 5000 membres) n très international (même petits groupes) n auteurs = lecteurs l échange rapide d’informations essentielle n envoi postal de pretirages depuis 60’s n longue tradition d'accès ouvert n >90% de HEP articles publiés en journaux aussi sur arXiv l dominance de systèmes d'information développés par la communauté n arXiv n SPIRES

3 Dominance of community services 3 From 2007 survey of 2,000 physicists. Gentil-Beccot et al, Information Resources in High-Energy Physics: Surveying the Present Landscape and Charting the Future Course. J.Am.Soc.Inf.Sci.60:150-160,2009 arXiv:0804.2701

4 SPIRES (1974-) 4 l réseau de bases de donnees n HEP littérature, conférences, institutions, expériences, hepnames, jobs l SLAC – DESY – Fermilab Collaboration l SPIRES-HEP n métadonnées pour 850k objets, ~800 nouvelles notices par semaine records n prétirages, articles publiés, conférence contributions, livres, littérature grise n depuis 1974, web serveur depuis 1991 n 100k recherches/jour l metadonnées haut de gamme, traitées manuellement l couverture compréhensive l grande acceptance, engagement des utilisateurs Mais: l technologie démodée des70‘s

5 5 run by (2007-) http://inspirehep.net

6 6 Contenu bibliographique l SPIRES contenu (+ part de CDS): articles publiés, conference proceedings, prétirages, notes d’expériences, theses l par-delà SPIRES: transparences, multimédia, logiciel, données de recherche… l par-delà 1974 l plus de matériaux de disciplines voisines astrophysique, physique nucléaire, mathématique… cité par HEP articles

7 7 Archive de textes intégrales l tous les articles en libre accès n esp. matériaux en danger de disparaitre l thèses: action dédiée n recherche dans archives institutionelles / sites d’expériences n email aux auteurs n page de soumission (prévu) l articles d'accès restreint n “archive caché” n accords avec Springer et APS l matériaux historiques n digitalisation d’anciens séries de prétirage ou series de conférences. l par-delà articles n transparences, multimédia, logiciels, wikis…

8 8 Recherche l 3 modes de syntax: n Google-like freetext search („Dakar supersymmetry“) n Spires syntax („find aff Dakar and t supersymmetry“) n Invenio syntax („affiliaton:‘Dakar‘ title:supersymmetry“) l recherche en texte integrale recherche complex de seconde ordre Example: Cherche les articles d‘auteurs de Benin qui citent des articles écrits par d‘auteurs de Dakar et cités eux-memes plus de 10 fois affiliation:Benin refersto:affiliation:dakar cited:10->100

9 9 Recherche de texte integrale - fragments

10 10 Page détaillée d’une notice l résumé l mots-clefs l publication info l vignettes de figures l divers formats d’exportation l tabs for n references n citations n fulltext n full-sized plots with captions

11 11 Notice détaillées avec figures

12 Figures détaillées

13 Extraction de figures l figures extraites de sources LaTeX (arXiv) l légendes recherchables n caption:neutrino a venir bientot: l extraction de pdf l phrase du texte integrale qui référence la figure

14 Extraction de références refextract: module pour extraire références de pdf MARC sous-zones (Inspire) $o numéro de la référence $h auteurs $a DOI $u Uniform Resource Identifier $r report number $s journal publication $m reste non identifié

15 refextract exemple fulltext: [3] V. A. Bednyakov, N. D. Giokaris, and A. V. Bednyakov, “On Higgs mass generation mechanism in the standard model,” Phys. Part. Nucl., vol. 39, pp. 13–36, 2008. MARC: 999C5 $$hV. A. Bednyakov, N. D. Giokaris, and A. V. Bednyakov $$m"On Higgs mass generation mechanism in the standard model” $$o[3] $$sPhys.Part.Nucl.,39,13 web: On Higgs mass generation mechanism in the Standard Model - Bednyakov, V.A. et al. Phys.Part.Nucl. 39 (2008) 13-36. hep-ph/0703280 [HEP-PH]

16 16 Analyse de citations l références l référencé par passé l référencé concuremment avec l self-citations l histoire de citation (développement temporale) référencé par références référencé concuremment avec passé futur

17 Citation analysis: Example

18 18 Page d’auteur l histoire d’affiliations l co-auteurs l mot-clefs fréquents l types de publications l analyse de citations

19 Profile d’auteur

20 Profile d’auteur: Resume de citations

21 21 HEPNAMES

22 22 HEP taxonomie structure hierarchique d‘importants HEP concepts (dynamical symmetry breaking) offrant n synonymes (dynamically broken) n termes reliés (spontaneous symmetry breaking) n termes plus/moins généraux (symmetry breaking) n définitions n domaines de sujet (high-energy physics – theory)

23 23 Keyword extraction arXiv:0903.3933 Author keywords: quantum cosmology -> quantum cosmology wheeler-dewitt equation -> tunneling probability -> tunneling positive cosmological constant -> cosmological constant Composite keywords: 10 transformation, canonical [22, 24] 9 potential, symplectic [22, 33] 3 tensor, energy-momentum [3, 3] 2 quantization, canonical [8, 24] 2 symmetry, gauge [4, 2] 2 oscillator, harmonic [2, 2] 1 dimension, 2 [0, 33] 1 fluid, pressure [22, 2] 1 operator, differential [16, 1] 1 inflation, open [4, 1] 1 field theory, scalar [0, 1] Single keywords: 19 wave function 14 tunneling 13 Wheeler-DeWitt equation 13 cosmological constant 8 zero mode 7 Robertson-Walker 7 quantum cosmology 6 variational 5 Schroedinger equation 4 boundary condition 4 Poisson bracket 4 phase space Acronyms: WDW Wheeler-DeWitt equation Core keywords: Wheeler-DeWitt equation quantum cosmology

24 24 Taxonomie: applications l rapide génération automatique de mots-clefs n permettant e.g. alertes immediates n ameliorés manuellement plus tard l selection automatique d‘articles pertinents pour HEP n pas de retard a cause de selection manuelle en disciplines voisines l algorithme de recherche amelioré (prévu) n recherche de „SUSY“ trouve aussi „supersymmetry“ n amplifier/limiter une recherche l user tagging (prévu) n ameliorer la classification generee par Inspire n ameliorer la taxonomie

25 25 Identification d’auteurs l INSPIRE author id n compatible avec d’autres schémas d’identification n participation active en ORCID l desambiguisation algorithmique n exploitant e.g. lab id’s, histoire d’affiliations, co-auteurs et plus n ~260k differents auteurs identifiés l association automatique d’articles avec auteurs n exploitant info sur affiliations, co-auteurs, sujets, références G. Chen: 963 docs, 21 real authors, only 22 docs not assigned, 97.2% success rate n INSPIRE-id composant de listes d’auteurs des larges collaborations

26 26 Crowdsourcing: Claim My Paper

27 27 Crowdsourcing: Claim My Paper

28 Claim my Paper interface

29 Claim my Paper interface

30 30 Crowdsourcing: references

31 31 Crowdsourcing: references

32 Projets en developpement l crowdsourcing n Page de soumissions pour theses n mise a jour avec des notes de publications n interface pour ajouter mot-clefs l analyse de documents n extraction d’auteurs, affiliations, titres, resume l recognition of affiliations


Télécharger ppt "Une Globale Bibliothèque Digitale pour la Physique de Haute Energie Annette Holtkamp CERN-UNESCO School on Digital Libraries – Dakar, Nov 2011."

Présentations similaires


Annonces Google