Citations Le traitement automatisé des citations au CERN Jean-Philippe Schmitt.

Slides:



Advertisements
Présentations similaires
[Nom du présentateur] [Titre/position/statut du présentateur] Webinaire pour [nom du groupe] [Nom de l'institution] [Date]
Advertisements

Support.ebsco.com Guide dUtilisation Rapports et statistiques EBSCOadmin.
ZOTERO logiciel de gestion bibliographique
« Les Mercredis du développement » Introduction Office « 12 » Présenté par Bernard Fedotoff Microsoft Regional Director Agilcom.
Automatisation des processus dans IIJCan par François HARVEY (Programmeur-analyste)
Blackwell Synergy et Ingenta Revues en texte intégral en ligne.
Oxford University Press Revues en ligne. Service : Oxford Journals Online Licence : nationale, pour toutes bibliothèques universitaires, de recherche.
AJOL (African Journals Online). Editeur : Divers Nom du service : AJOL (African Journals Online) Sommaires et résumés à la disposition de tout utilisateur.
Traduction française des formats UNIMARC
Les ressources documentaires électroniques : Cemadoc et le portail IST Emilie Gentilini Journée des nouveaux arrivants 3 mai 2010.
création : 1 er janvier par S. Abravanel-Jolly et A. Astegiano-La Rizza, MCF, HDR, Lyon 3, Directrices.
Présentation de la base de données Science Direct
Définition : C'est un format de données qui permet de réaliser des sommaires Un « flux RSS » est un fichier texte qui contient les titres des derniers.
ARC RAPSODIS Reconnaissance Automatique de la Parole Suivie et Orientée par Des Informations Syntaxico-Sémantiques PAROLE – METISS – TALARIS – TEXMEX –
Nouveau blog. WordPress connexion Nommez votre blog.
Guide d’utilisation Ariane & Pubmed.
Projets de numérisation des bibliothèques du gouvernement Bernie Gloyn Le 1er juin 2012 Bibliothèque de Statistique Canada Projet de numérisation
Cours 16 LA BIBLIOGRAPHIE
Chapitre 3 INTERNET Web.
Localisation dans le Sudoc des ressources électroniques JABES 2012.
Doctorat/Web of Science Les nouveautés du Web of Science Formations Master et Doctorants Voir aussi
Présentation des outils de recherche dinformations scientifiques.
Chercher et trouver Module 1 Déroulement : Souhaiter la bienvenue
Module Sherpa : Recherche documentaire
WikiViz La visualisation dun réseau sémantique Travail de diplôme 2005 Urs Richle / 31 it.
BIO1530 Lab2 Littérature scientifique. Objectifs de lexercice Après avoir complété cet exercice, vous devriez être en mesure de: Déterminer si une publication.
Lédition en libre accès pour la physique des Hautes Energies Anne gentil-Beccot CERN scoap3.org
Le défi du libre accès pour la Physique des particules Anne Gentil-Beccot CERN scoap3.org.
Scoap 3 Le défi du libre accès pour la Physique des particules Anne Gentil-Beccot CERN scoap3.org
Le Service dInformation Scientifique du CERN Le CERN La communication scientifique: acteurs, enjeux, spécificités Le rôle du SIS Les défis.
Ingrid Geretschläger and Jocelyne Jerdelet/CERN ETT-SIS-DM1 La litterature grise : importation et gestion au SIS u Dans le passé, échange entre.
Le Web of Knowledge 5. Nouvelle interface + Nouvelles fonctionnalités Le Web of Knowledge 5 Nouvelle interface + Nouvelles fonctionnalités.
Introduction à lutilisation des corpus 2. Comment constituer un corpus?
Alexandra Bujold Marie-Pier Moreau Alix Pampalon
DIVISION ST PROJET NOTES DE COUPURE u E. Cochet, E. Sanchez-Corral u Avec la collaboration de T. Pettersson et J. Muller / EST.
Littérature scientifique
Le langage du Web CSS et HTML
Words of the Month automne 2008 Fall 2008 Mots du mois Internet.
MEMOIRE INDUSTRIEL ESIEA
LA GESTION DOCUMENTAIRE BTS Assistant de direction 2e année, Janvier 2007.
Rédaction des références bibliographiques
Formation des Rédacteurs Contributeurs à la Communication Diocésaine sur Internet 30 novembre 2005 Le site Internet du Diocèse de Fréjus-Toulon:
Ressources Electroniques d’Oxford University Press.
La veille bibliographique. L’expérience du CDD de l’ISPED
MCM 2007 Santé de la reproduction et l‘internet - une introduction Dirk Schoonbaert Bibliothèque IMT 16 mai, 2007.
2005 Adobe Systems Incorporated. All Rights Reserved. 1 Solutions Adobe Acrobat Génération de fichiers PDF accessibles Lionel Lemoine
Bienvenue sur le portail d’information scientifique des unités CNRS en
Travaux Parlementaires Guide d’utilisation 28/07/
Pour mieux vieillir ensemble EndNote 201 Trucs et astuces en vue d’une publication Par Marie-Marthe Gagnon Bibliothécaire Mars 2015.
Analyse du sujet -1- Eléments issus de la lecture du sujet
Savoir-être : Fréquenter le CDI
Pour mieux vieillir ensemble EndNote Bâtir sa bibliothèque Par Marie-Marthe Gagnon Bibliothécaire Mars 2015.
Création d’un site Web -Création « Graphique » de pages Création « Graphique » de pagesCréation « Graphique » de pages -Le graphisme Le graphismeLe graphisme.
Les systèmes de gestion de contenu
Jocelyne Jerdelet - Sandrine Reyes CERN-DSU-SI 1 La Théorie sur la "voie verte" de l'Open Access.
Le français dans tous les sens
Présenter une bibliographie en lycée
Plateformes d’éditeurs Editeurs commerciaux : pluridisciplinaires : Elsevier, Springer, Wiley spécialisés en chimie : Thieme Sociétés savantes de chimie:
Bibliothèque J.N. Desmarais Comment exporter dans RefWorks septembre 2005.
SOURCES BIBLIOGRAPHIQUES
Faire un dossier documentaire
DREAMWEAVER SEANCE 1 Axel JACQUET GM05 – Julien VAN MOORLEGHEM GM05 A2008 Écriture interactive & multimédia Présentation Dreamweaver 8.
Dreamweaver CS4 séance 1 Ahmed Aryan – Isma Teir.
Séance Bibliographie - 2 -
Bibliothèque Centrale de l’École Polytechnique La Recherche Documentaire Economie - HSS Session pratique Ressources Documentaires en Economie-Gestion Vanessa.
Outils bibliographiques Philippe Carrère, UAG 2013.
1 Chercher et trouver sa documentation sur Internet L1 DC Expression et communication Intervention du Par Sylvie Doyon, documentaliste.
Le Service d’Information Scientifique du CERN Le CERN La communication scientifique: acteurs, processus, spécificités Le rôle du SIS Les défis.
IUT « A » P. Sabatier – Université Toulouse III Le projet tuteuré en 2 ème année RECHERCHES BIBLIOGRAPHIQUES Département Chimie IUT Paul Sabatier Site.
HAL Matisse
Transcription de la présentation:

Citations Le traitement automatisé des citations au CERN Jean-Philippe Schmitt

Quelques définitions Citations –Références citées (exemple)exemple Corpus traité –Documents en texte intégral (preprints et rapports internes)

Pourquoi exploiter les citations ? Faciliter la navigation en améliorant l’intégration des ressources (grises et publiées)navigation Permettre une recherche dans les citationsrecherche Estimer l’importance d’un documentimportance –Pour un auteur, en général, pour la bib.

3 étapes I.Extraction des références a.Conversion des fichiers PDF b.Extraction de la zone des références c.Reconstruction de lignes corrompues II.Reconnaissance des citations a.Adresses Internet b.Numéros de rapports c.Périodiques Scientifiques III.Génération des liens

I/a. Conversion formats d’origine (LaTeX, PostScript, Word…) => PDF PDF => texte (pdftotext)PDFpdftotext

I/b. Extraction des références Titre de section / fin [1]…… [2]……

I/b. Extraction des références [9] Preparing the LaTeX List of Publications from the SPIRES BibTeX output. Page 8 Le Meur, JY et al. From Fulltext Documents to Structured Citations: the CERN Treatment [10] LIGHT project, Page 9 Le Meur, JY et al. From Fulltext Documents to Structured Citations: the CERN Treatment.

I/c. Reconstruction de lignes [9] I. Fruhwirth, J.M. Grimstrup, Z. Morsli, L. Popp, M. Schweda, hep- th/ [10] R. Jackiw, Nucl. Phys. Proc. Suppl. 108, 30 (2002); hep-th/ [11] Z. Guralnic, R. Jackiw, S.Y. Pi and A.P.Polychronakos, Phys. Lett. B 517, 450 (2001); hep-th/

II/a. Adresses Internet The CERN Web site Le script detecte en enregistre toutes les structures ftp://…, etc.

II/b. Numéros de rapports Racine(institut) + année + numéro –CERN-TH –SLAC-PUB-6100 –quant-ph/ –… Le script détecte des racines prédéfinies et répertoriées, puis les numéros sont traités et standardisés (CERN-TH/ => CERN-TH )

II/c. Périodiques scientifiques Reconnaissance du titre –Formes abrégées, mais non standardisées –Utilisation d’une base de connaissance (« knowledge base »). 800 titres, 1800 entréesknowledge base –Les titres reconnus sont remplacés par les titres conformes à la norme ISO 4

II/c. Périodiques scientifiques Reconnaissance de la « numération » –L’ordre et la forme varient. La numération est standardisée : –volume (année) page JHEP 12, 139 (2000) J. High Energy Phys. : 12 (2000) 139 –Ibid. : mention remplacée par le titre standard [2] W.H. Zureck, Phys. Rev. D 24, 1516 (1981); W.G. Unruh and W.H. Zureck, ibid. 40, 1071 (1989) devient… [2] W.H. Zureck, Phys. Rev., D : 24 (1981) 1516; W.G. Unruh and W.H. Zureck, Phys. Rev., D : 40 (1989) 1071.

III. Génération des liens « link manager » calcule les URL à partir des références extraites et standardisées Triplet titre, volume, page Autres paramètres : –Etats de coll. –Abonnements de la bib.

III. Génération des liens Exemple « GoDirect »GoDirect –Phys. Rev., D : 40 (1989) 1071 – DOI: /PhysRevD Nucl. Phys., B : 528 (1998) 185

Résultats Total No. Citations Total No. Recognitions = Internet Addresses + Report Numbers + Journal Titles %0.44%13.10%66.88% 18.6% ( )

Un peu de lecture… Jean-Blaise Claivaz, Jean-Yves Le Meur, Nicholas Robinson, "From Fulltext Documents to Structured Citations: CERN's automated Solution", High Energy Physics Library Webzine, issue 5, November