Télécharger la présentation
La présentation est en train de télécharger. S'il vous plaît, attendez
Publié parAugustin Labbé Modifié depuis plus de 8 années
1
EQUIPE PROJET TAO Paris-Saclay 28 novembre 2014 Plateforme I/O CDS de Paris-Saclay https://io.datascience-paris-saclay.fr https://io.datascience-paris-saclay.fr GT Informatique Scientifique 7 janvier Karima Rafes, 6 janvier 2014
2
Center for Data Science de Paris Saclay LIDEX de Paris Saclay, crée en Mars 2014 35 laboratoires, ~250 chercheurs Objectif : créer une communauté de recherche en sciences des données Volet opérationnel/infrastructures : action Data http://www.datascience-paris-saclay.fr 08/10/2014 Karima Rafes - 2 6 janvier 2015
3
SOMMAIRE Objectifs de l'action Data de CDS Phase 1 : Référencer les données Phase 2 : Mettre à disposition Phase 3 : Contribuer à la réflexion 1.Les mots clés de l’Open Data 2.Le Web, cette base de données 3.Plateforme CDS de Paris-Saclay 4.Les autres approches 08/10/2014 Karima Rafes - 3 6 janvier 2015
4
Objectifs de l'action Data de CDS 28 novembre 2014 Karima Rafes – LOD & DaaS IO-CDS- 4
5
Objectifs de l'action Data de CDS Phase 1 : Référencer les données sur le plateau de Paris-Saclay : Données ouvertes ou privées Données partagées entre chercheurs du plateau Phase 2 : Mettre à disposition des laboratoires sur le plateau les moyens de déployer eux-mêmes des données. Dans leur infrastructure Ou dans une infrastructure mutualisée Cloud pour les expérimentations (de technologies, d'interdisciplinarité...) Phase 3 : Contribuer à la réflexion et l'expérimentation de mise à dispositions des technologies du Web afin d’accélérer la recherche. - 5 08/10/2014 Karima Rafes - 5 6 janvier 2015
6
Objectifs en 1 image : mieux partager neuroscience Raw DataLinked Data neuroscience Linked Personal Data 08/10/2014 Karima Rafes - 6 6 janvier 2015
7
Objectifs en 1 image : mieux diffuser Publish neuroscience 08/10/2014 Karima Rafes - 7 6 janvier 2015
8
Une approche réaliste L’Université Paris Saclay est un échantillon représentatif de l’ensemble de l’activité scientifique dans son ensemble Très grande hétérogénéité : de la plate-forme de production de données locale aux grosses collaborations mondiales Multi-institutionnel Le positionnement institutionnel de CDS est transversal par nature et en devenir StandardAction Data CDS CentralisatriceCollaborative IntrusiveRespectueuse Automatisée (crawling) Volontaire Tout gratuit/payantNiveaux d’accès 08/10/2014 Karima Rafes - 8 6 janvier 2015
9
Référencer les données 1
10
Phase 1 : Référencer les données https://io.datascience-paris-saclay.fr Inscription Regroupement Données 08/10/2014 Karima Rafes - 10 6 janvier 2015
11
28 novembre 2014 Karima Rafes – LOD & DaaS IO-CDS - 11 Details of datasets with tags With WikiData, we can link the datasets with Wikipedia With WikiData4Research, we can develop Wikipedia’s Gadget for the scientists and facilitate the exchange of data between scientists Map with the laboratories’ datasets of the Université Paris Saclay https://io.datascience-paris-saclay.fr Platform I / O Data Center for Science of Paris-Saclay
12
Phase 1 : Commencer à les déclarer avec un niveau d’accès restreint 08/10/2014 Karima Rafes - 12 6 janvier 2015
13
Phase 1 : Comment les déclarer 08/10/2014 Karima Rafes - 13 6 janvier 2015
14
Pourquoi utiliser les URI de WikiData ? Démonstration avec les données de la chimie IDs des BDD de la chimie qui n’a rien à faire dans une encyclopédie Texte réutilisé par Google A terme les ID seront déplacés dans WikiData 08/10/2014 Karima Rafes - 14 6 janvier 2015
15
Pourquoi utiliser les URI de WikiData ? Démonstration avec les données de la chimie Chaque donnée possède une référence de son origine permettant d’arbitrer en cas de conflits 08/10/2014 Karima Rafes - 15 6 janvier 2015
16
Pourquoi utiliser les URI de WikiData ? Les données de WikiData deviennent : Génériques Disponibles Gratuites Dans le futur, elles seront : Fiables Disponible en temps réel Interopérable Modifiable à travers les outils des chercheurs Le pivot des ID dans les sciences Il faut commencer à relier les données des disciplines entre elles à travers cette futur base de connaissance global et ainsi mettre à profit dans nos futurs outils la convergence des bases de données. 6 janvier 2015 Karima Rafes - 16
17
Phase 1 : Déclarer les fichiers et les API Ajouter les fichiers/API 08/10/2014 Karima Rafes - 17 6 janvier 2015
18
Phase 1 : Déclarer un fichier 08/10/2014 Karima Rafes - 18 6 janvier 2015
19
2014, 570 Endpoints SPARQL dans le LOD http://lod-cloud.net/versions/2014-08-30/lod-cloud_colored.png, 08/10/2014 Karima Rafes - 19 6 janvier 2015
20
Phase 1 : Rendre accessible les fichiers/API par les machines https://io.datascience-paris-saclay.fr/sparql Exemple : 08/10/2014 Karima Rafes - 20 6 janvier 2015
21
Description de vos données : L’URL du service qui les héberge et le graphe 6 janvier 2015 Karima Rafes - 21
22
Phase 1 : Déclarer une API 08/10/2014 Karima Rafes - 22 6 janvier 2015
23
Phase 1 : Accès direct aux fichiers/API, au site web et à une adresse email Type et lien vers le fichier Version à terme avec vérification : d’accès aux fichiers/API et à l’intéropérabilité des données. 2015/16 08/10/2014 Karima Rafes - 23 6 janvier 2015
24
Mettre à disposition 2
25
Phase 2: déployer vos données Choisir vos logiciels 08/10/2014 Karima Rafes - 25 DATABASE SYSTEM Interoperability SecurityPerformanceManagement TFT ? ? ? http://SPARQLSCORE.com Contrôle qualité des logiciels de stockage RDF 1 Each day, we test the last build of Fuseki, Marmotta, Virtuoso, 4store… 6 janvier 2015
26
Phase 2: déployer vos données Automatiser le déploiement de vos données RDF data Sélection de la BDD RDF en fonction de vos critères 2 Sélection des données qui ont vocation à être partagées via le Web 08/10/2014 Karima Rafes - 26 6 janvier 2015
27
Phase 2: déployer vos données Automatiser la migration des données RDF RDF data 3 Migration automatique des données RDF 08/10/2014 Karima Rafes - 27 6 janvier 2015
28
Phase 2: déployer vos données Automatiser le déploiement des données RDF 4 Déploiement des données dans le Linked Data Science Simplification de travailler avec les données d’autres laboratoires 5 08/10/2014 Karima Rafes - 28 6 janvier 2015
29
Phase 2: déployer vos données Enregistrer les données WoT RDF Sciences City Open Data Web Agent data Permettre l’enregistrement de données en temps réel. 6 08/10/2014 Karima Rafes - 29 6 janvier 2015
30
Phase 3: déployer vos données dans le Cloud Réutiliser les outils du Web WoT RDF Sciences City Open Data Web Agent data Faciliter l’intégration de Web Agent pour aider les chercheurs 7 08/10/2014 Karima Rafes - 30 6 janvier 2015
31
Contribuer à la réflexion 3
32
Evénements Matinées CDS Inscription de vos données échanger sur l’avenir des données dans la recherche au sein de votre domaine. Journée initiation aux Wikis Comprendre et apprendre à collaborer à travers Wikipedia Décrire des données dans WikiData Faire une requête sur les données 08/10/2014 Karima Rafes - 32 6 janvier 2015
33
Projets de recherche Proposition WikiData for the research (H2020) 08/10/2014 Karima Rafes - 33 6 janvier 2015
34
Projets de recherche : La recherche en 2020 ? 28 novembre 2014 Karima Rafes – LOD & DaaS IO-CDS- 34
35
Projets de recherche : La recherche en 2020 ? 28 novembre 2014 Karima Rafes – LOD & DaaS IO-CDS- 35
36
Projets de recherche : La recherche en 2020 ? 08/10/2014 Karima Rafes - 36 6 janvier 2015
37
Merci Des questions ? EQUIPE PROJET TAO Paris-Saclay
Présentations similaires
© 2024 SlidePlayer.fr Inc.
All rights reserved.