Les grandes bases de données communiquent : le rôle des référentiels TAXREF Référentiel taxonomique pour la France Olivier Gargominy & Sandrine Tercerie.

Slides:



Advertisements
Présentations similaires
Démarche d’élaboration du DOCOB
Advertisements

Synthèses de la législation européenne: une introduction 2008.
Manuel Qualité, Structure et Contenus – optionnel
Session dorientation pour les membres du Comité Propositions dinscription.
Formation : « Méthodes d’inventaire et de suivi des populations de Cistude d’Europe »   Mardi 28 mai 2013 – Station biologique de la Tour du Valat (Arles)
- Qu'est ce qui te différencie d'autrui* ? (autrui = l'autre)
LA STATION BALNEAIRE DE CANET EN ROUSSILLON:
- Évaluations CM2 - Document Unique Réunion des directeurs 15 janvier 2010.
Présentation Mars 2007 Organet II: service de gestion du déroulement des épreuves dans les établissements centres d’examen Organet II est un produit pour.
FORMATION DES DIRECTEURS LES MISSIONS DE L ECOLE Lundi 22 septembre 2008 Louisette CAUX, IEN BOULOGNE.
Présentation du projet de plateforme web. Une plateforme web pour le pôle flore / habitats un outil de construction et danimation du pôle le socle structurant.
Modèle de Charte et adhésions Pôle dInformation pour la Flore et les Habitats.
Présentation du justificatif d’impôt sur le revenu et du service de vérification en ligne Direction régionale des finances publiques d’Auvergne et du.
Version mars Êtes-vous bien informé(e)s sur le SFPQ? Atelier de formation.
La science de la classification
Construire une base de données bibliographiques Elaborer un site web
Que faut-il pour créer et soutenir une banque de données Denis Guedez Thomson Reuters ABJS VjBS - Zürich 11 Avril 2008 denis.guedez[at] thomson.com.
SECURITE DU SYSTEME D’INFORMATION (SSI)
LITTERATURE SCIENTIFIQUE STRATÉGIES DE RECHERCHE PMSS
Par : Rodrigue Peyroche
Ministère de l'Écologie, de l'Énergie, du Développement durable et de l'Aménagement du territoire Plans Nationaux de.
Le portail documentaire de Paris 1
COPIL SINP 28/03/2014 PRÉSENTATION DES APPLICATIONS OGAM (WEB ET NOMADE)
La Biodiversité et la Classification
Le Travail Collaboratif ...
Atelier de travail ECOFOR « Base de données » Le Réseau Tela Botanica, ses principes Un réseau coopératif… où la libre contribution de chacun profite à
BIO1530 Lab2 Littérature scientifique. Objectifs de lexercice Après avoir complété cet exercice, vous devriez être en mesure de: Déterminer si une publication.
Livret d ’évaluation départemental 2009
Réalisé par Mr CALVO du Lycée Bon Secours à PERPIGNAN
La bibliothèque électronique. Préambule. Dans tous les cas, tout se passe toujours à partir de la page d’accueil du site web des BU.
L'Observatoire Naturaliste des Écosystèmes Méditerranéens Une plateforme collaborative sur la nature méditerranéenne.
Phylogénie : quelques docs
Réaliser et diffuser un projet intégrant les TIC
Viabilité Réduire, réutiliser, recycler… Conservation Coaches Network Formation des coachs.
2014 Importer des données Excel vers Sitra. Pour quels usages ? Pour l’impression de votre brochure en langue étrangère, vous disposez de traductions.
Littérature scientifique
1 Comment utiliser les annexes 1 © Copyright Secrétariat CITES 2005 Convention sur le commerce international des espèces de faune et de flore.
Dossier social étudiant en ligne
Phase préparatoire Janvier Vous devrez élaborer une biographie d’un auteur littéraire qui est déjà mort.
Séances de liaison auprès des brevetés 2014 Montréal – le 11 juin 2014 Toronto – le 12 juin 2014 Conseil d’examen du prix des médicaments brevetés.
CONTRÔLE DES COMPTABILITÉS INFORMATISÉES
Ressources Internet liées à la CIB
 La République Démocratique du Congo a ratifié la convention internationale portant sur la diversité biologique le 15 septembre La Conférence des.
1 Convention sur le commerce international des espèces de faune et de flore sauvages menacées d’extinction Systèmes de production et de gestion des espèces.
Compétences des enseignants
Supports de formation au SQ Unifié
Annexe 2.1 Présentation du justificatif d’impôt sur le revenu et du service de vérification en ligne.
Bordeaux - Juin HAL – Le contenu / Les acteurs
Hatainville Les Moitiers d’Allonne – Tel : Website : stratic.online.com La démarche projet Mars 2001.
Guillaume GRECH Frédéric VEST
Centre d’archivage des documents traduits
Direction Régionale de l’Environnement DIRECTION REGIONALE DE L’ENVIRONNEMENT FRANCHE-COMTE Présentation du SINP Projet de plateforme du patrimoine naturel.
H2 Les traites négrières et l'esclavage au XVIII e s.
Formation nationale CHM, 2012, Antananarivo, Madagascar
HIERARCHISATION AU NIVEAU REGIONAL DES ENJEUX DE CONSERVATION DES ESPECES ANIMALES D’INTERET COMMUNAUTAIRE ET MENACEES Mars 2010.
Techniques documentaires et veille stratégique Anne Pajard, avril 2008
Missouri Botanical Garden Adresse: Lot VP31 Anjohy Tél (0) ou (0) Fax : (261)
Présentation de la taxonomie XBRL BE-fr-pfs-ci Bruxelles, le 25 janvier 2006 Camille Dümm Pascal Rodrique Centrale des bilans.
Formation nationale CHM, 2013, Abidjan, Côte d’Ivoire Le Centre d’échange d’information de la Convention sur la diversité biologique Par: Han de Koeijer.
La valorisation de l’information scientifique Colloque IFAN, 27 novembre 2007.
8eme Conférence de l’AFAPDP Jeudi 25 juin à Bruxelles (Belgique)
Gestion des documents internes avec SQL Server 2005 Date de publication : janvier 2006.
Formation GBIF France dans le cadre d’Ecoscope – Valoriser ses données d’observation sur la biodiversité : qualité, standards et publication Paris,
PROCESSUS D’AUDIT PLANIFICATION DES AUDITS
Présenter une bibliographie en lycée
Centre d’échange d’Information de la Convention sur la Diversité Biologique Madagascar CHM / CDB Madagascar Voahangy Raharimalala.
C o n s e r v a t o i r e b o t a n i q u e n a t i o n a l a l p i n Programme opérationnel interrégional FEDER Massif des Alpes Réunion plénière.
Convertisseur de codes alternatifs pour le référentiel des appellations de taxons ADD 18/09/2014.
IUT « A » P. Sabatier – Université Toulouse III Le projet tuteuré en 2 ème année RECHERCHES BIBLIOGRAPHIQUES Département Chimie IUT Paul Sabatier Site.
Directive Habitat Faune Flore présentation des résultats, lancement de la suite 03 juin 2015 _ am Pénil Caroline _ DCIE/CONTE.
Transcription de la présentation:

Les grandes bases de données communiquent : le rôle des référentiels TAXREF Référentiel taxonomique pour la France Olivier Gargominy & Sandrine Tercerie Service du Patrimoine naturel (SPN)

Pourquoi ?

Pourquoi ? On ne peut pas travailler sans désigner les objets sur lesquels on travaille = pas d’existence sans nom Nomen omen : le nom est présage Le nom, et donc le référentiel, est la porte d'accès à tous les attributs biologiques et non biologiques de l'espèce : représentations iconographiques, cartes de répartition, données sur l'anatomie, la biologie et l'écologie, textes réglementaires sur la pêche, échantillons dans les collections des musées, etc…

La description de la biodiversité Pourquoi ? La description de la biodiversité EN PRINCIPE, SIMPLE : Une espèce ne devrait idéalement être désignée que par un seul nom et un même nom ne devrait idéalement désigner qu'une seule espèce. 1,9 million d'espèces décrites = 1,9 million de noms La vandoise = Leuciscus leuciscus (Linnaeus, 1758)

2-3 millions d'entités / 4-6 millions de noms Pourquoi ? EN REALITE : Le cloisonnement politique, linguistique et culturel de la communauté scientifique a fait et fait que : une même espèce a pu / peut involontairement être désignée par des noms différents dans différentes parties de son aire de répartition ; un même nom a pu / peut servir à désigner des espèces différentes dans différentes régions du monde. La délimitation des taxons n'est pas une vérité révélée ; elle résulte d'observations, d'interprétations et d'hypothèses faites par des humains : qui se trompent parfois ; qui ne sont pas d'accord entre eux ; qui étudient plantes et animaux depuis 250 ans avec des moyens d'investigation qui ont varié au cours des temps. 2-3 millions d'entités / 4-6 millions de noms

La description de la biodiversité Pourquoi ? La description de la biodiversité Une même espèce a pu / peut involontairement être désignée par des noms différents dans différentes parties de son aire de répartition ; La vandoise : Leuciscus leuciscus (Linnaeus, 1758) en Europe Leuciscus baicalensis (Dybowski, 1874) en Sibérie et en Asie centrale.

La description de la biodiversité Pourquoi ? La description de la biodiversité Un même nom a pu / peut servir à désigner des espèces différentes dans différentes régions du monde. Leuciscus rostratus Valenciennes, 1844 : La vandoise de la Meuse pour Valenciennes (= L. leuciscus) La vandoise rostrée d'Aquitaine pour Roule (= L. burdigalensis) © Kottelat & Freyhof

Outil de communication Pourquoi ? Outil de communication "azote" en français "nitrogen" en anglais "Stickstoff" en allemand "dusik" en tchèque + clé vers les propriétés de l’objet

Textes réglementaires Pourquoi ? Territoires et espaces Fonctionnement de l’écosystème Textes réglementaires ENTITE BIOLOGIQUE NOM ATTRIBUTS Listes rouges Relations de parenté Caractères, structure, composition etc… Démographie

Comment ?

Comment ? Au 18ème siècle Accélération de l’exploration outre-mer Accélération du commerce des ressources naturelles

= une machine à laver la vaiselle Comment ? But original : la description EST le nom = le nom doit amener directement à l’espèce. = une machine = une machine à laver = une machine à laver la vaiselle

Comment ? Au 18ème siècle Les noms se multiplient et se complexifient Nécessité d’un standard de nommage => Système nomenclatural de Linné (1758) : Lave linge Lave vaisselle Un terme générique Un terme spécifique

Comment ? Classification Règne : Animalia © Gargominy Règne : Animalia Embranchement [= Phylum] : Mollusca Classe : Gastropoda Ordre : Pulmonata Famille Vertiginidae Genre Nesoropupa Espèce Nesoropupa duodecim Nomenclature : comment nommer les boites = code Taxonomie : faire des boites

Retour vers TAXREF

Le référentiel taxonomique est l'outil qui permet de savoir :     TAXREF Le référentiel taxonomique est l'outil qui permet de savoir : que les noms : Cyprinus leuciscus Linnaeus, 1758 C. grislagine Linnaeus, 1758 C. dobula Linnaeus, 1758 Leuciscus baicalensis (Dybowski, 1874) désignent une seule et même espèce de poisson : la vandoise. que le nom actuellement reconnu comme valide est : Leuciscus leuciscus (Linnaeus, 1758)

Le référentiel taxonomique est l'outil qui permet de savoir :     TAXREF Le référentiel taxonomique est l'outil qui permet de savoir : que la vandoise et la carpe Cyprinus carpio Linné, 1758 sont classées dans deux genres différents de la même famille, les Cyprinidae. qu'il existe en France quatre autres espèces de Leuciscus : L.  bearnensis (Blanchard, 1866) (la Vandoise du Béarn), endémique de France L.  burdigalensis Valenciennes, 1844 (la Vandoise rostrée), L.  idus (Linnaeus, 1758) (l’Ide mélanote), L.  oxyrrhis (La Blanchère, 1873) (la Vandoise au long-museau), endémique de France.

Objectifs et exigences de TAXREF Produire une liste de noms de référence pour les taxons de la faune, la flore et la fonge de France Permettre une interopérabilité entre les bases de données Diffusion (en particulier téléchargement libre) Liens avec les référentiels sources (FaEu, WoRMS, BDNFF…) Gérer des données et les évolutions nomenclaturales et taxonomiques dans les données Gestion de la synonymie Gestion de la hiérarchie taxonomique

Les producteurs de données TAXREF Les producteurs de données Bases de données validées, officielles et consensuelles Fauna Europaea, validée MNHN (SPN est Point Focal) WoRMS, validée MNHN FishBase , validée MNHN Base Nadeaud, validée MNHN etc. Publications scientifiques Hill M.O. et al. 2006. An annotated checklist of the mosses of Europe and Macaronesia. Journal of Bryology, 28: 198-267. Martiré, D. & Rochat, J. 2008. Les Papillons de La Réunion et leurs chenilles. Biotope, Mèze (Collection Parthénope) ; Muséum national d'Histoire naturelle, Paris. 496 pp. Peck, S.B. 2011. The beetles of Martinique, Lesser Antilles (Insecta: Coleoptera); diversity and distributions. Insecta Mundi, 178 : 1-57. Groupes d’expert Société Herpétologique de France Société Mycologique de France Société française d’Arachnologie

Portées taxonomique et géographique TAXREF Portées taxonomique et géographique Toutes espèces Fonge, flore, faune Marines et continentales France Métropole Outre-Mer

Une tâche à deux x deux faces TAXREF Une tâche à deux x deux faces Côté pile : la nomenclature et la taxonomie Nom disponible (nomenclature) Nom de référence (taxonomie) Côté face : occurrence et statut biogéographique Absente Accidentelle / Visiteuse Cryptogène Disparue Douteux Endémique Endémique éteinte Éteinte Introduite Introduite envahissante Introduite éteinte / disparue Introduite non établie (dont domestique) Mentionnée par erreur Présente (indigène ou indéterminé) Subendémique

Consolidation nationale TAXREF Consolidation nationale = s’assurer qu’une espèce commune à la Martinique, la Réunion et la Polynésie française, porte le même nom Stratégie « espèces envahissantes » « Escargot de Bourgogne » : Cantareus aspersus (dans le texte), Cornu aspersum (REU), Helix aspersa (NC)

Consolidation nationale TAXREF Consolidation nationale Exemple des trachéophytes des Antilles : 3 mois pour inclure 12 000 noms dont 2 mois pour consolider 1600 noms METROPOLE ANTILLES Panicum eruciforme  Sm., 1806 Panicum erucaeforme J.E. Smith, 1806 Leptochloa fascicularis (Lam.) A. Gray, 1848 Diplachne fascicularis (Lam.) P.Beauv., 1812 Erigeron bonariensis L., 1753 Conyza bonariensis (L.) Cronq., 1943 Sesamum orientale L., 1762 Sesamum indicum L., 1753 Citrus deliciosa Ten. Citrus reticulata Blanco, 1837

TAXREF

TAXREF Ajout d’un statut biogéographique pour FR  Inventaire national du Patrimoine naturel

TAXREF

TAXREF

TAXREF Pourquoi les référentiels nationaux existent et continueront d’exister ? Apporter des solutions au niveau national = s’adresser à une communauté = répondre à des besoins (en particulier programmes nationaux tels que ZNIEFF, Natura 2000, Espaces protégés, etc.) Aborder des groupes taxonomiques pour lesquels seule une connaissance régionale est disponible Offrir des possibilités de gestion des données beaucoup plus fines : synonymies d’usage

TAXREF GSD Référentiel national 20. Lacerta viridis (Laurenti, 1768) 21. Lacerta bilineata Daudin, 1802 20 1. Lacerta viridis (Laurenti, 1768) 2. Lacerta bilineata Daudin, 1802 1 20. Lacerta viridis (Laurenti, 1768) 21. Lacerta bilineata Daudin, 1802 1. Lacerta viridis auct. non (Laurenti, 1768) 2 2. Lacerta bilineata Daudin, 1802 (3. Lacerta viridis (Laurenti, 1768))

TAXREF Une seule espèce : Maculinea alcon (Denis & Schiffermüller, 1775) (CD_NOM = CD_REF = 54080) protégée en France. MAIS deux écotypes dont les stratégies de conservation sont différentes => nécessité d’individualiser les écotypes dans le cadre des inventaires. © François Séité © Luc Dietrich Ponte sur Gentiane pneumonanthe (habitat : prairie humide) Ponte sur Gentiane croisette (habitat : pelouse sèche) TAXREF renferme les CD_NOM des deux écotypes : 54083 pour Maculinea alcon rebeli (Hirschke, 1904) (sur pelouses sèches) 54082 pour Maculinea alcon alcon (Denis & Schiffermüller, 1775) (sur prairies humides)

Résultats

Résultats Nombre de noms (CD_NOM) disponibles dans TAXREF par année

Résultats Evolution de TAXREF

Résultats Etat d’avancement des listes de référence pour TAXREF v7.0 (Taxons continentaux) - GF: champignons (2,56%), Comité d’Orientation INPN, 21 mars 2013, Paris 35 35

Résultats Etat d’avancement des listes de référence pour TAXREF v7.0 (Insectes) Comité d’Orientation INPN, 21 mars 2013, Paris 36 36

Résultats Etat d’avancement des listes de référence pour TAXREF v7.0 (Taxons marins) Comité d’Orientation INPN, 21 mars 2013, Paris 37 37

Diffusion

Accès au référentiel : http://inpn.mnhn.fr Diffusion Accès au référentiel : http://inpn.mnhn.fr Consultation en ligne Téléchargement versions ( = stabilité) mise à jour annuelle minimum

Diffusion Diffusion de TAXREF Via un espace réservé au sein du site de l’INPN Inscription (connaissance des utilisateurs) Téléchargements partiel ou intégral du référentiel Suivi des changements entre deux versions (table TAXREF_CHANGES et document des sources (TAXREF_sources_vX.X)) Via des outils naturalistes Serena (RNF) Silene (CBN Med) BDN (ONF) « Outil naturaliste » (NaturParif)

Diffusion Téléchargements de TAXREF Nombre d’inscriptions à TAXREF depuis la v3.0

Diffusion Analyse des téléchargements de TAXREF Nombre de téléchargements de TAXREF en fonction de l'organisme d'appartenance des utilisateurs

Diffusion Analyse des téléchargements de TAXREF

Conclusion Référentiel taxonomique = indispensable pour gérer et partager les données sur la nature TAXREF = colonne vertébrale de l’INPN en téléchargement (libre et gratuit) intégrable à n’importe quel outil

INPN > Programmes > Référentiel Espèces : Merci INPN > Programmes > Référentiel Espèces : http://inpn.mnhn.fr/downloads/taxref-docs/TAXREFv7.0.pdf

Modifications et Biblio: comment participer à TAXREF

DOCS-Web

L’interface recherche:

L’ajout d’une référence bibliographique:

Comment faire remonter des modifications ?

Quel format ? Quel contenu ? Processus: d’abord rentrer la biblio dans DOCS-WEB et ensuite demander une modif en nous communiquant le CD_DOC associée. Beaucoup plus de gens peuvent avoir accès à DOCS-WEB qu’à TAXREF. CD_SUP et CD_REF sont indispensables pour savoir à quoi raccrocher les nouveaux taxons Intitulé complet de la référence ou CD_DOC 52

A éviter: Ne décrit pas correctement ce qui est expliqué dans l’article et ne permet pas de remplir TAXREF. 3 références ne sont pas nécessaires puisque l’on utilise la 1ère mention du nom.

Quels types de références pour quelles utilisations ? Ajout d’espèces dans TAXREF: descriptions d’espèces valides respectant les codes de nomenclature:

Quels types de références pour quelles utilisations ? Occurrences dans les territoires, noms vernaculaires: tout type de littérature peut être pris en compte. Par exemple pour les ZNIEFF, beaucoup de remontées d’occurrences mais qui comportent de nombreuses erreurs: donc il est impératif d’effectuer un travail bibliographique pour confirmer ces occurrences. 55

À éviter ! Quels types de références pour quelles utilisations ? Occurrences dans les territoires: tout type de littérature peut être pris en compte. À éviter !

Quels types de références pour quelles utilisations ? Statuts biogéographiques: publications scientifiques nécessaires.

Résultats: un travail de bibliographie qui sert à la justification des modifications dans TAXREF ET Une ressource disponible pour tous sur le site de l’INPN.

Utiliser TAXREF grâce à la réconciliation taxonomique (TAXREF-MATCH) 59

Objectifs

Helix pomatia L. CD_NOM = 64260 Objectifs Réconciliation Nom Référence TAXREF-MATCH Objectif de la réconciliation : pouvoir attacher un nom à une référence. = moteur de recherche (ex: « Apple » = ordinateur, pomme, New-York) ; différent d’une simple recherche. Objectif de TAXREF-MATCH : pouvoir rattacher un nom à un CD_NOM. Helix pomatia L. CD_NOM = 64260 … et tous les attributs de 64260 61

Deux utilisations possibles Objectifs Deux utilisations possibles Réconciliation pour un nom Réconciliation pour une liste de noms Réconciliation pour un nom = utilisée pour la recherche dans TAXREF-web Réconciliation pour une liste de noms = pour matcher des jeux de données avec TAXREF. Indispensable avant toute intégration/mise à jour de référentiels dans TAXREF, pour éviter de créer des doublons. 62

Cas simple Cas complexe Objectifs Tilapia zillii (Gervais, 1848) Gomphus pulchellus Selys Lepidonotus clava Montagu, 1808 Gomphus pulchellus Selys, 1840 Lepidonotus clava (Montagu, 1808) Cas complexe Tilapia zillii (Gervais, 1848) Tilapia zillei Tilapia zilli Gervais, 1849 Acerina zillii Gervais 1848 Coptodus zillii (Gervais, 1848) Problème de la réconciliation taxonomique : analyser si bonne ou mauvaise réconciliation. Même espèce ? Quel nom valide ? 63

Principes

Basée sur deux transformations Principes Basée sur deux transformations OPhiothrix Fragilis (Abildgaard, 1789) Normalisation Espaces excédentaires, Majuscules / minuscules, Accentuations, Virgule entre l’auteur et la date, Abréviations des auteurs, etc. Phonétique (dégradation) Terminaisons latines, Fautes d’orthographes (t versus th, etc.) normalisation OPHIOTHRIX FRAGILIS ABILDGAARD 1789 phonétisation Pour surmonter les différents obstacles à la réconciliation, deux transformations sont nécessaires : La normalisation = standardisation du nom pour supprimer la mise en forme et les caractères spéciaux et ne conserver que l’information brute contenue dans la chaîne de caractères. La phonétisation = dégradation du nom pour supprimer les fautes potentielles d’orthographe. OPIATRIX FRAGILA ABILDGARD 1789 65

Processus en plusieurs étapes Principes Processus en plusieurs étapes Setaria italicum (L.) P.Beauv., 1812 TAXREF Normalisation du nom Comparaison en normalisation Phonétique du nom Comparaison en phonétique Comparaison avec index de similarité et distance de Jaro-Winkler + Calcul de la correspondance en taxonomie supérieure SETARIA ITALICUM L. P. BEAUVOIS 1812 Pas de résultats Setaria italica (L.) P.Beauv., 1812 (CD_NOM= 123122) SITARA ITALICA L. P. BIAIVA 1812 Setaria italicum (L.) P.Beauv., 1812 Comparaisons avec les noms de TAXREF (et leur classification) à chaque étape du processus. Plantae, Poales, Poaceae Plantae, Poales, Poaceae => Famille 66

Processus en plusieurs étapes Principes Processus en plusieurs étapes Niveaux de réconciliation 1 - Nom complet normalisé 2 - Nom complet normalisé sans date 3 - Nom scientifique normalisé 4 - Phonétique Nom complet 5 - Phonétique Nom complet sans date 6 - Phonétique Nom scientifique 7 - Jaro-Winkler / similarité Processus séquentiel échappatoire Renvoie des meilleurs candidats pour éviter les choix subséquents inutiles Gain de temps de calcul SETARIA ITALICA L. P. BEAUVOIS 1812 SETARIA ITALICA L. P. BEAUVOIS SETARIA ITALICA SITARA ITALICA L. P. BIAIVA 1812 SITARA ITALICA L. P. BIAIVA SITARA ITALICA Etapes matérialisées en niveaux de réconciliation : 3 niveaux pour le nom normalisé (avec auteur et date; sans date; sans date ni auteur) 3 niveaux pour le nom en phonétique (avec auteur et date; sans date; sans date ni auteur) le dernier niveau pour les calculs de distance de similarité. Processus séquentiel échappatoire = renvoie les meilleurs résultats pour éviter d’avoir à parcourir les autres niveaux de réconciliation. Si résultats trouvés à un niveau donné, niveaux suivants non effectués.

Performances Principes Sans calculs de similarité : entre 2.5 s (correspondance exacte sans classification supérieure) et 15 s (phonétique et taxonomique et avec classification supérieure) par nom 100 noms en 5 mn Avec calculs des distances de similarité et de Jaro-Winkler : jusqu’à 22s par nom 100 noms en 16 mn

Comment lancer un TAXREF-MATCH ?

Une adresse unique : taxref.mnhn.fr/taxref-match Comment ? Une adresse unique : taxref.mnhn.fr/taxref-match Accès sous login et mot de passe

Deux TAXREF-MATCH disponibles : Comment ? Deux TAXREF-MATCH disponibles : version diffusée sur l’INPN (TAXREF v7.0) version de travail sur TAXREF-web

Import d’une liste de noms : format .txt ou .csv Comment ? Import d’une liste de noms : format .txt ou .csv

Import d’une liste de noms : format .txt ou .csv Comment ? Import d’une liste de noms : format .txt ou .csv

Import d’une liste de noms : format .txt ou .csv Comment ? Import d’une liste de noms : format .txt ou .csv

Import d’une liste de noms : format .txt ou .csv Comment ? Import d’une liste de noms : format .txt ou .csv > 2000 lignes pas de doublons dans le nom d’espèce encodage standard (ANSI/Windows-1252) ou UTF-8

Comment ?

Si fichier de moins de 10 lignes : Comment ? Si fichier de moins de 10 lignes : Résultats affichés à l’écran => choix du format et de l’encodage du fichier pour l’enregistrement 77

Si fichier de plus de 10 lignes : Comment ? Si fichier de plus de 10 lignes : Résultats envoyés par mail (lien de téléchargement) => choix du format (.csv ou .xml) et de l’encodage du fichier (Standard ou UTF-8) pour l’enregistrement 78

Analyses des résultats

Analyse des résultats informations fournies CD_NOM matchés dans TAXREF informations sur le match

Réconciliations de niveaux 1, 2 ou 3 (noms normalisés) Analyse des résultats Réconciliations de niveaux 1, 2 ou 3 (noms normalisés) = a priori toujours bonnes Cas de réconciliations simples : uniquement différences de parenthèses, d’abréviations d’auteurs ou de mention du sous-genre. un seul résultat de match par nom cité.

Réconciliations de niveaux 1, 2 ou 3 (noms normalisés) Analyse des résultats Réconciliations de niveaux 1, 2 ou 3 (noms normalisés) MAIS exceptions possibles : Dichrostachys cinerea (L.) Wight & Arn., 1834 Acacia polyacantha Willd., 1806 Difficulté de réconciliation lorsque les auteurs ne sont pas mentionnés… plusieurs résultats de match possibles. => Importance d’avoir le maximum d’informations pour le match ! En général : on considérera que la personne voulait désigner le nom de référence (à vérifier dans TAXREF). Remarque : exceptions généralement décelables par les résultats multiples retournés. 82

Réconciliations de niveaux 1, 2 ou 3 (noms normalisés) Analyse des résultats Réconciliations de niveaux 1, 2 ou 3 (noms normalisés) Cas très particulier : Torilis leptophylla (L.) Rchb.f., 1867 (CD_NOM=126861) Caucalis platycarpos L., 1753 (CD_NOM=89415) Pas de solution : il faut retourner à la donnée. 83

Réconciliations de niveaux 4, 5 ou 6 (noms en phonétique) Analyse des résultats Réconciliations de niveaux 4, 5 ou 6 (noms en phonétique) = davantage de vigilance requise Cas de réconciliations un peu plus complexes car différences d’écriture du nom… en général sans ambiguité mais vérification nécessaire. Un seul résultat de match par nom cité. 84

Réconciliations de niveaux 4, 5 ou 6 (noms en phonétique) Analyse des résultats Réconciliations de niveaux 4, 5 ou 6 (noms en phonétique) Mêmes types d’exceptions que pour les matchs précédents + différences possibles sur le rang : Potentielle erreur de rang dans le nom cité ? Sinon, il faut considérer que le match n’est pas bon et qu’il s’agit de taxons différents. 85

Réconciliations de niveaux 7 Analyse des résultats Réconciliations de niveaux 7 (calcul des distances de similarité et de Jaro-Winkler) Résultats multiples, vigilance accrue ! Résultats multiples d’où analyse plus longue et fastidieuse… Importance de renseigner au mieux le nom cité (avec auteur et si possible date) : plus le nom cité est complet, moins TAXREF-MATCH ne retourne de résultats (2 résultats avec auteur contre 7 sans) donc plus l’analyse est simple. 86

Réconciliations de niveaux 7 Analyse des résultats Réconciliations de niveaux 7 (calcul des distances de similarité et de Jaro-Winkler) Cas de noms quasiment identiques… … mais correspondant à 2 espèces différentes Attention à ne pas aller trop vite dans l’analyse… deux noms très proches ayant le même auteur, la même date et appartenant au même genre ne correspondent pas nécessairement à la même espèce ! Attention aussi aux copier-coller à partir de pdf : certaines fautes proviennent de mauvais copier-coller (ex: « rn » transformé en « m »). 87

En résumé Analyse des résultats Collecter le plus possible de données (auteur et classification, date) Pas de limite nette entre bonnes et mauvaises réconciliations (% de similarité uniquement informatif) TAXREF-MATCH adaptable pour l’INPN et pour TAXREF: Version uniquement avec matchs les plus sûrs (moins de résultats) Version avec tous les matchs possibles (beaucoup de résultats donc beaucoup de post-traitement !)

Merci