EQUIPE PROJET TAO Paris-Saclay 28 novembre 2014 Plateforme I/O CDS de Paris-Saclay GT Informatique Scientifique 7 janvier Karima Rafes, 6 janvier 2014
Center for Data Science de Paris Saclay LIDEX de Paris Saclay, crée en Mars laboratoires, ~250 chercheurs Objectif : créer une communauté de recherche en sciences des données Volet opérationnel/infrastructures : action Data 08/10/2014 Karima Rafes janvier 2015
SOMMAIRE Objectifs de l'action Data de CDS Phase 1 : Référencer les données Phase 2 : Mettre à disposition Phase 3 : Contribuer à la réflexion 1.Les mots clés de l’Open Data 2.Le Web, cette base de données 3.Plateforme CDS de Paris-Saclay 4.Les autres approches 08/10/2014 Karima Rafes janvier 2015
Objectifs de l'action Data de CDS 28 novembre 2014 Karima Rafes – LOD & DaaS IO-CDS- 4
Objectifs de l'action Data de CDS Phase 1 : Référencer les données sur le plateau de Paris-Saclay : Données ouvertes ou privées Données partagées entre chercheurs du plateau Phase 2 : Mettre à disposition des laboratoires sur le plateau les moyens de déployer eux-mêmes des données. Dans leur infrastructure Ou dans une infrastructure mutualisée Cloud pour les expérimentations (de technologies, d'interdisciplinarité...) Phase 3 : Contribuer à la réflexion et l'expérimentation de mise à dispositions des technologies du Web afin d’accélérer la recherche /10/2014 Karima Rafes janvier 2015
Objectifs en 1 image : mieux partager neuroscience Raw DataLinked Data neuroscience Linked Personal Data 08/10/2014 Karima Rafes janvier 2015
Objectifs en 1 image : mieux diffuser Publish neuroscience 08/10/2014 Karima Rafes janvier 2015
Une approche réaliste L’Université Paris Saclay est un échantillon représentatif de l’ensemble de l’activité scientifique dans son ensemble Très grande hétérogénéité : de la plate-forme de production de données locale aux grosses collaborations mondiales Multi-institutionnel Le positionnement institutionnel de CDS est transversal par nature et en devenir StandardAction Data CDS CentralisatriceCollaborative IntrusiveRespectueuse Automatisée (crawling) Volontaire Tout gratuit/payantNiveaux d’accès 08/10/2014 Karima Rafes janvier 2015
Référencer les données 1
Phase 1 : Référencer les données Inscription Regroupement Données 08/10/2014 Karima Rafes janvier 2015
28 novembre 2014 Karima Rafes – LOD & DaaS IO-CDS - 11 Details of datasets with tags With WikiData, we can link the datasets with Wikipedia With WikiData4Research, we can develop Wikipedia’s Gadget for the scientists and facilitate the exchange of data between scientists Map with the laboratories’ datasets of the Université Paris Saclay Platform I / O Data Center for Science of Paris-Saclay
Phase 1 : Commencer à les déclarer avec un niveau d’accès restreint 08/10/2014 Karima Rafes janvier 2015
Phase 1 : Comment les déclarer 08/10/2014 Karima Rafes janvier 2015
Pourquoi utiliser les URI de WikiData ? Démonstration avec les données de la chimie IDs des BDD de la chimie qui n’a rien à faire dans une encyclopédie Texte réutilisé par Google A terme les ID seront déplacés dans WikiData 08/10/2014 Karima Rafes janvier 2015
Pourquoi utiliser les URI de WikiData ? Démonstration avec les données de la chimie Chaque donnée possède une référence de son origine permettant d’arbitrer en cas de conflits 08/10/2014 Karima Rafes janvier 2015
Pourquoi utiliser les URI de WikiData ? Les données de WikiData deviennent : Génériques Disponibles Gratuites Dans le futur, elles seront : Fiables Disponible en temps réel Interopérable Modifiable à travers les outils des chercheurs Le pivot des ID dans les sciences Il faut commencer à relier les données des disciplines entre elles à travers cette futur base de connaissance global et ainsi mettre à profit dans nos futurs outils la convergence des bases de données. 6 janvier 2015 Karima Rafes - 16
Phase 1 : Déclarer les fichiers et les API Ajouter les fichiers/API 08/10/2014 Karima Rafes janvier 2015
Phase 1 : Déclarer un fichier 08/10/2014 Karima Rafes janvier 2015
2014, 570 Endpoints SPARQL dans le LOD 08/10/2014 Karima Rafes janvier 2015
Phase 1 : Rendre accessible les fichiers/API par les machines Exemple : 08/10/2014 Karima Rafes janvier 2015
Description de vos données : L’URL du service qui les héberge et le graphe 6 janvier 2015 Karima Rafes - 21
Phase 1 : Déclarer une API 08/10/2014 Karima Rafes janvier 2015
Phase 1 : Accès direct aux fichiers/API, au site web et à une adresse Type et lien vers le fichier Version à terme avec vérification : d’accès aux fichiers/API et à l’intéropérabilité des données. 2015/16 08/10/2014 Karima Rafes janvier 2015
Mettre à disposition 2
Phase 2: déployer vos données Choisir vos logiciels 08/10/2014 Karima Rafes - 25 DATABASE SYSTEM Interoperability SecurityPerformanceManagement TFT ? ? ? Contrôle qualité des logiciels de stockage RDF 1 Each day, we test the last build of Fuseki, Marmotta, Virtuoso, 4store… 6 janvier 2015
Phase 2: déployer vos données Automatiser le déploiement de vos données RDF data Sélection de la BDD RDF en fonction de vos critères 2 Sélection des données qui ont vocation à être partagées via le Web 08/10/2014 Karima Rafes janvier 2015
Phase 2: déployer vos données Automatiser la migration des données RDF RDF data 3 Migration automatique des données RDF 08/10/2014 Karima Rafes janvier 2015
Phase 2: déployer vos données Automatiser le déploiement des données RDF 4 Déploiement des données dans le Linked Data Science Simplification de travailler avec les données d’autres laboratoires 5 08/10/2014 Karima Rafes janvier 2015
Phase 2: déployer vos données Enregistrer les données WoT RDF Sciences City Open Data Web Agent data Permettre l’enregistrement de données en temps réel. 6 08/10/2014 Karima Rafes janvier 2015
Phase 3: déployer vos données dans le Cloud Réutiliser les outils du Web WoT RDF Sciences City Open Data Web Agent data Faciliter l’intégration de Web Agent pour aider les chercheurs 7 08/10/2014 Karima Rafes janvier 2015
Contribuer à la réflexion 3
Evénements Matinées CDS Inscription de vos données échanger sur l’avenir des données dans la recherche au sein de votre domaine. Journée initiation aux Wikis Comprendre et apprendre à collaborer à travers Wikipedia Décrire des données dans WikiData Faire une requête sur les données 08/10/2014 Karima Rafes janvier 2015
Projets de recherche Proposition WikiData for the research (H2020) 08/10/2014 Karima Rafes janvier 2015
Projets de recherche : La recherche en 2020 ? 28 novembre 2014 Karima Rafes – LOD & DaaS IO-CDS- 34
Projets de recherche : La recherche en 2020 ? 28 novembre 2014 Karima Rafes – LOD & DaaS IO-CDS- 35
Projets de recherche : La recherche en 2020 ? 08/10/2014 Karima Rafes janvier 2015
Merci Des questions ? EQUIPE PROJET TAO Paris-Saclay