La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Theses.fr tutoriel Isabelle Mauger Perez et Aurélien Charot, ABES Journées ABES – 20 juin 2012.

Présentations similaires


Présentation au sujet: "Theses.fr tutoriel Isabelle Mauger Perez et Aurélien Charot, ABES Journées ABES – 20 juin 2012."— Transcription de la présentation:

1 theses.fr tutoriel Isabelle Mauger Perez et Aurélien Charot, ABES Journées ABES – 20 juin 2012

2 UNE APPLICATION EN PRODUCTION DEPUIS LE 11 JUILLET 2011 theses.fr : des données, une interface, des services

3 Que trouve-t-on aujourdhui dans theses.fr ? Toutes les données validées dans STAR – Description de thèses soutenues à partir de 2006 – Indexation du texte intégral – Accès au texte intégral dans 70% des cas (8 019 thèses) Toutes les données de STEP lorsquune certaine finesse de description est atteinte – Description de thèses en préparation depuis personnes – Une base de données de personnes qualifiées par les thèses qui leur sont liées – Exemple : jazz Brésiljazz Brésil

4 Les pages de thèses soutenues Les pages de thèses en préparation sous réserve dun lien IdRef-autorités Sudoc, – Les pages de personnes – Les pages dorganismes Les pages « finales »

5 Les pages de thèses soutenues Les pages de thèses en préparation sous réserve dun lien IdRef-autorités Sudoc, – Les pages de personnes – Les pages dorganismes Les pages « finales »

6 Les pages de thèses soutenues Les pages de thèses en préparation sous réserve dun lien IdRef-autorités Sudoc, – Les pages de personnes – Les pages dorganismes Les pages « finales »

7 Les pages de thèses soutenues Les pages de thèses en préparation sous réserve dun lien IdRef-autorités Sudoc, – Les pages de personnes – Les pages dorganismes Les pages « finales »

8

9 Les trois onglets de recherche Toutes les thèses – Deux restrictions possibles : uniquement les thèses soutenues uniquement les thèses soutenues accessibles en ligne Thèses en préparation – Restriction possible : uniquement les thèses en préparation dont la soutenance est prévue dans les 6 prochains mois Personnes : docteurs, directeurs de thèse, membres du jury – Restriction possible : uniquement les personnes en lien avec une thèse soutenue ou en préparation depuis moins de 5 ans

10 Au choix de lutilisateur Consultation par lencart de recherche – Requête sur les métadonnées et le texte intégral Consultation par lencart de recherche puis raffinement par utilisation des facettes date de soutenance,établissement discipline,école doctorale, langue de la thèse,directeur de thèse, domaine Consultation par navigation pure via les facettes

11 Page daccueil :

12 Page de résultats obtenue après utilisation de lencart de recherche

13 Page de résultats obtenue après raffinement par la facette Etablissement

14 Page de la thèse soutenue obtenue en cliquant sur le titre

15 Page dun organisme obtenue en cliquant sur le nom de lorganisme

16 Page de la thèse en préparation obtenue en cliquant sur le titre

17 Page dune personne obtenue en cliquant sur le nom de la personne

18 Les services Rebonds vers des applications du web 2.0 via AddThis Recommandations – des flux ATOM par défaut thèses soutenues récemment, soutenues récemment accessibles en ligne, nouvelles thèses en préparation, annonces de soutenance – et des flux personnalisables : flux de recherche – Zotero – format txt – format csv – formats « machines »

19 Un service particulier : Rendre possible un cercle vertueux : lutilisateur entre en contact avec le producteur pour signaler une erreur Depuis avril 2012 Mail au correspondant STEP ou au correspondant STAR

20 Les données brutes Ouvertes, réutilisables via une API. – pour une liste de résultats : ajouter &format=xml ou &format=json ou &format=atom ou &format=csv ou &format=txt en paramètre de lurl de recherche – pour une page finale : ajouter.xml (ou.rdf ) à lurl de la page Ce principe permet dajouter autant de formats que nécessaire. Exemple : récupérer la description de la thèse 2010MON30067 – dans linterface dans linterface – en rdf/xml en rdf/xml Exemple : récupérer la liste de toutes les thèses soutenues à Toulouse 2 et accessibles en ligne dans lED Science du langage. – dans linterface dans linterface – en xml (solr) en xml (solr) – en json en json

21 theses.fr et Google Description de toutes les pages de theses.fr dans un fichier sitemap pour faciliter lindexation des robots 77% du trafic provient des moteurs de recherche

22 Quelques chiffres

23 Plus de détails Le cercle vertueux de theses.fr : mise en relation de lutilisateur et du producteur de données, Punktokomo, 10 avril 2012 Le cercle vertueux de theses.fr : mise en relation de lutilisateur et du producteur de données theses.fr : comment fonctionne longlet « personnes » ?, Punktokomo,19 janvier 2012 theses.fr : comment fonctionne longlet « personnes » ?, theses.fr : lAPI XML de recherche, Punktokomo, 22 juillet 2011lAPI XML de recherche theses.fr : lAPI XML des personnes, Punktokomo, 12 juillet 2011lAPI XML des personnes theses.fr : lAPI XML des thèses, Punktokomo, 12 juillet 2011lAPI XML des thèses theses.fr : les technologies utilisées, Punktokomo, 12 juillet 2011les technologies utilisées

24 UN PROJET DOTÉ DE MOYENS SPÉCIFIQUES JUSQUA FIN 2012 theses.fr : les prochains développements

25 Quelles fonctionnalités demain dans theses.fr ? (1) Une interface en trois langues – Français, anglais, italien Un module de recherche avancée – exclure la recherche dans le texte intégral – ne pas tenir compte de la pertinence définie par défaut (pondération des index) – faciliter la recherche exacte Calendrier : fin septembre 2012

26 Quelles fonctionnalités demain dans theses.fr ? (2) Des services accessibles sur authentification – paniers – alerte mail – … Des services spécifiques pour les personnes reconnues comme étant lauteur dune thèse – mise en relation : être contacté via theses.fr – accès aux statistiques de sa page de thèse – … Impossibilité doffrir de tels services pour les directeurs de thèse Calendrier : fin 2012

27 Que trouvera-t-on demain dans theses.fr ? (1) Toutes les données du Sudoc relatives aux thèses de doctorat françaises soutenues depuis 1985 Toutes ? Non. Celles qui passent avec succès lalgorithme de chargement qui a pour but de les « FRBriser ». Regroupement des notices Sudoc en familles composées de : – la notice mère (la notice de la thèse originelle telle que validée par le jury : zone 105$m) – Éventuellement, les notices enfants (les notices de reproduction : zone 105$bv) Chaque famille aura une page propre : Conséquence pour theses.fr : recherche de lexhaustivité depuis Calendrier : fin septembre 2012.

28 Que trouvera-t-on demain dans theses.fr ? (2) Toutes les données de TEL et lindexation du texte intégral sous réserve que le lien à la thèse originelle ait été trouvé. Principe : chargement de toutes les données de TEL dans le Sudoc par moissonnage oai-pmh de TEL. – Création de notices probablement assez pauvres (pas de liens IdRef) mais avec laccès au texte intégral. Algorithme « FRBrisateur » de chargement dans theses.fr – Si la notice mère est trouvée, ajout dans theses.fr de laccès au texte intégral Conséquence pour theses.fr : faciliter laccès au texte intégral sur le web Calendrier : fin 2012

29 Que trouvera-t-on demain dans theses.fr ? (3) Des liens vers le catalogue des « thèses à la carte » de lANRT de Lille Principe : envoi régulier (mensuel ?) de la liste de NNT disponibles dans « thèses à la carte ». Conséquence pour theses.fr : faciliter laccès au texte intégral avec la possibilité de commander un fac-similé de la thèse. Calendrier : soumis aux contraintes de lANRT, sans doute fin 2012.

30 Que trouvera-t-on demain dans theses.fr ? (4) Les données de Thésa pour les thèses en préparation au sein détablissements relevant de la CGE et non utilisateurs de STEP. Principe : envoi régulier (mensuel ?) des données par lINIST. Conséquence pour theses.fr : recenser toutes les thèses en préparation Calendrier : soumis aux contraintes de lINIST, sans doute fin 2012.

31 Que trouvera-t-on demain dans theses.fr ? (5) Des liens vers les données non-documentaires issus des partenaires associatifs du projet : IntelliAgence-ABG par exemple. – Cvthèque – Offres demploi – … Conséquence pour theses.fr : servir les docteurs et les doctorants au-delà de leur travail académique Calendrier : soumis aux contraintes de l IntelliAgence- ABG, sans doute fin 2012.

32 Journées ABES – 20 juin 2012


Télécharger ppt "Theses.fr tutoriel Isabelle Mauger Perez et Aurélien Charot, ABES Journées ABES – 20 juin 2012."

Présentations similaires


Annonces Google