Datapoc Journées professionnelles Collex-Persée Vendredi 5 avril 2019

Slides:



Advertisements
Présentations similaires
Conseil du livre1 Conseil du livre Bilan 2009 Ministère de la Communauté française Service général des lettres et du livre.
Advertisements

1 Comité de suivi régional du SINP LR - 8 juin 2012 Comité technique du SINP LR Montpellier, 8 juin 2012.
L’ÉTUDE DE CAS, OU COMMENT NE PAS ÊTRE À CÔTÉ DE LA PLAQUE AVEC L’INDUCTION.
OpenArticles : Libérez votre savoir ! Mise en place d'un service libre et gratuit de dépôt et d'accès aux articles scientifiques David Larlet – Janvier.
Au cœur du réseau Sortir de l'hôpital en situation palliative
Données ouvertes et Web de données : enjeux et perspectives pour BAnQ Jean-François Gauvin Marielle St-Germain Direction de l’architecture et de la conception.
Enseigner autrement les mathématiques au travers du socle commun et des nouveaux programmes Un collège réformé, adapté et contextualisé.
Pourquoi inquiète-t-il les acteurs de terrain?
Projet Educatif Artistique et Culturel
Recherche d’informations
Impact de la réforme du collège sur les SEGPA.
LE NOUVEAU PHYLOGENE LYON le 08 décembre 2008
Le réseau GBIF et le point nodal GBIF France
Formation BTS CG – Parc Chabrières
EFESE-F Partie 1.1 : Quelques retours sur les travaux réalisés à l’étranger (volets biophysiques) La manière dont le volet biophysique de l’évaluation.
Politique de dépôt et de services dans ProdInra
Adéquation de la prise en charge des grands prématurés selon la distance du domicile à la maternité de type III la plus proche en Ile-de-France Catherine.
Formation sur la publication des données de biodiversité dans le réseau GBIF et leur aptitude à être utilisées , édition 2011 Comment le DwC-A a changé.
Le Louvre.
Direction Régionale Tanger- Tétouan مديــرية جهــة طنجــة – تطــوان
Diplôme National du Brevet
Du côté des textes et programmes…
04/06/2018 École de bibliothéconomie et des sciences de l'information
BTT – Bruit Transports Terrestres
La technologie au Diplôme National du Brevet
Mise en situation professionnelle – capes documentation 2017– 9 juin
Tableau de bord des risques
Caroline LAURENT, Véronique PETIT
CONSEIL PEDAGOGIQUE 24 NOVEMBRE 2015 Année scolaire 2014/2015.
Présentation du SINP DGALN/DEB/PEM4 - Juin 2013.
Evaluation de la formation
Rapport scientifique Travail de sciences Présenté à Marie Dumouchel
Institut Universitaire Virtuel de Formation des Maîtres
Fonds d’investissement étudiant (FIÉ)
L’ Herbier de l’INRA Guadeloupe
Comité de Pilotage Lundi 27 Novembre 2017.
Trouver des thèses juridiques
Présentation pour la Réunion du projet RESUMé
Techniques de diffusion électronique : L’annuaire statistique
d’une classe de Seconde
IDENTIFICATION NUMERIQUE
SIMM : Réflexions sur les besoins en référentiels.
Les Sciences Physiques
Le diplôme national du brevet La fin d’un parcours scolaire
Le Diplôme National du Brevet
Promotion d’IdRef IdRef - Autorités Coopérations bases interopérantes
Affichage et tri des résultats
Explorer le monde Se repérer dans le temps et dans l'espace
La recherche avancée.
Présentation 4 : Sondage stratifié
L’écriture d’un article scientifique
LES DONNEES HALIEUTIQUES EN NOUVELLE-CALEDONIE
Conduite d’une autoévaluation
Numérique et Sciences Informatiques
Système d'information géographiques des projets urbains Mise en œuvre
Comment la faire ? Quand la faire ?
Analyse des données et complémentarité des sources
Groupe de travail « Gestion des données de l’université »
Design, innovation et créativité
Histoire-géographie, géopolitique et sciences politiques
LES NOUVEAUX PROGRAMMES DE MATHÉMATIQUES
Chantier Algoliens, BULA
nouvelle interface de visualisation et de correction des liens
Numérique et Sciences Informatiques
Le socle commun de connaissances de compétences et de culture
Parcours adapté L’évaluation au service des apprentissages
Les données structurées et leur traitement
Le processus participatif
Thème 2 : XVe -XVIe siècles :
LPO Touchard-Washington
Transcription de la présentation:

Datapoc Journées professionnelles Collex-Persée Vendredi 5 avril 2019 Chloé Besombes, Simon Chagnoux Journées professionnelles Collex-Persée Vendredi 5 avril 2019 Journées Collex-Persée - 5 avril 2019

L’économie de la recherche en taxonomie à partir des collections naturalistes Journées Collex-Persée - 5 avril 2019

La cartographie Sudoc-SiGB Bibliothèques Collections de spécimens Calames Herbier Myriapodes Mammifères Ichtyologie HAL- Muséum Géologie Gouvernance: Direction des collections naturalistes (DGD-C) Gouvernance: Direction des bibliothèques (DGD-C) Publications scientifiques Historique: réunion DGD-C des bibliothèques et des collections naturalistes. Des bases de données en silos étanches structurées selon des pratiques différentes. Gouvernance différente. Standards de données, pratiques, Observations Listes nationales Référentiels Gouvernance: Service des Publications scientifiques (DGD-MJZ) Gouvernance: Inventaire national du patrimoine naturel (INPN) Journées Collex-Persée - 5 avril 2019

La cartographie Types de données communes (noms scientifiques des espèces, noms de personnes, localisation géographique, dates) Pratiques de production et de normalisation hétérogènes Des silos étanches entre eux mais ouverts sur des outils nationaux ou internationaux -> Evidemment, cela parle à la première diapo, et à l’économie de la recherche scientifique en Sciences naturelles -> Cela vient principalement de la manière dont ce sont construit ces différents silos au sein d’une institution Journées Collex-Persée - 5 avril 2019

Les référentiels au MNHN Publié par le MNHN: Taxref https://inpn.mnhn.fr/programme/referentiel-taxonomique-taxref Alimentés (exemples): http://www.marinespecies.org/ https://www.worldbirdnames.org/ https://www.fishbase.in/search.php http://www.ipni.org/ https://www.idref.fr/ …….. Journées Collex-Persée - 5 avril 2019

Le pivot: les personnes Présentes dans tous les systèmes d’informations Stables par rapport à d’autres types de données structurées dans des référentiels Hétérogènes selon les bases Journées Collex-Persée - 5 avril 2019

Les personnes dans les bases MNHN Base de données de spécimens Pas d’identifiants INPN Pas d’identifiants Bibliothèques ISNI, ORCID, Idref, IdHAL… Publications scientifiques ScopusID, ResearcherID, VIAF ou ORCID… PO2034 – Bibliothèques du MNHN Journées Collex-Persée - 5 avril 2019

Le corpus 467 noms Taxonomistes XVIIe – XXIe s Du jardin au Muséum : en 516 biographies, Philippe Jaussaud & Edouard-Raoul, Publications du Muséum national d’Histoire naturelle, 2004 Journées Collex-Persée - 5 avril 2019

Représentation du corpus dans Idref Premier travail d’alignement en collaboration avec l’Abes 85% de taux de couverture dans IdRef Ouverture d’un chantier qualité des données sur le corpus Autorités Liens aux notices bibliographiques Recherche des 15% restants Quid du passage à l’échelle? Journées Collex-Persée - 5 avril 2019

Le projet L1 : Jeu de données structurées L2 : Site et API L3 : Rapport sur les mécanismes L4 : Préconisations pour passage à l’échelle Journées Collex-Persée - 5 avril 2019

Les mécanismes 100 000 « récolteurs » différents pour 9 millions d’objets Unifier les noms de personne même lorsque les présentations sont différentes (« Jean-Baptiste Lamarck », « Lam. », « Lamarck, chevalier de Monet », « Lamarck, JB », « Lamarck », …) Désambiguïser les homonymes (exemple les « Jussieu ») Ces méthodes utiliseront des transformations syntaxiques mais peuvent aussi s’appuyer sur des heuristiques : prise en compte de l’âge de la personne au moment de la récolte, des co-auteurs d’une publication, de la géographie, du domaine de compétence, etc. Meise 700 noms reliés à 71% d’un herbier de 1.7 M Journées Collex-Persée - 5 avril 2019

Le site « people of collection » Une page pour chaque Naturaliste Journées Collex-Persée - 5 avril 2019

L’accès ouvert au données API ou ressources RDF Journées Collex-Persée - 5 avril 2019

L’évaluation par groupe utilisateurs Journées Collex-Persée - 5 avril 2019

Le passage à l’échelle Mécanismes scriptés et rejouables Estimation de la fiabilité des heuristiques Evaluation du cout humain de validation Mesure de l’impact sur les différents silos 100 000 recordedBy 150 000 scientificNameAuthorship Journées Collex-Persée - 5 avril 2019

Faire évoluer le SI Global de la biodiversité 1.1 milliard d’occurrences 43 421 jeux de données 1378 institutions Darwin Core recordedBy georeferencedBy identifiedBy scientificNameAuthorship nameAccordingTo Journées Collex-Persée - 5 avril 2019

Merci pour votre attention chloe.besombes at mnhn.fr simon.chagnoux at mnhn.fr Journées Collex-Persée - 5 avril 2019