La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

EQUIPE PROJET TAO Paris-Saclay 28 novembre 2014 Plateforme I/O CDS de Paris-Saclay https://io.datascience-paris-saclay.fr https://io.datascience-paris-saclay.fr.

Présentations similaires


Présentation au sujet: "EQUIPE PROJET TAO Paris-Saclay 28 novembre 2014 Plateforme I/O CDS de Paris-Saclay https://io.datascience-paris-saclay.fr https://io.datascience-paris-saclay.fr."— Transcription de la présentation:

1 EQUIPE PROJET TAO Paris-Saclay 28 novembre 2014 Plateforme I/O CDS de Paris-Saclay https://io.datascience-paris-saclay.fr https://io.datascience-paris-saclay.fr GT Informatique Scientifique 7 janvier Karima Rafes, 6 janvier 2014

2 Center for Data Science de Paris Saclay LIDEX de Paris Saclay, crée en Mars 2014 35 laboratoires, ~250 chercheurs Objectif : créer une communauté de recherche en sciences des données Volet opérationnel/infrastructures : action Data http://www.datascience-paris-saclay.fr 08/10/2014 Karima Rafes - 2 6 janvier 2015

3 SOMMAIRE Objectifs de l'action Data de CDS Phase 1 : Référencer les données Phase 2 : Mettre à disposition Phase 3 : Contribuer à la réflexion 1.Les mots clés de l’Open Data 2.Le Web, cette base de données 3.Plateforme CDS de Paris-Saclay 4.Les autres approches 08/10/2014 Karima Rafes - 3 6 janvier 2015

4 Objectifs de l'action Data de CDS 28 novembre 2014 Karima Rafes – LOD & DaaS IO-CDS- 4

5 Objectifs de l'action Data de CDS Phase 1 : Référencer les données sur le plateau de Paris-Saclay : Données ouvertes ou privées Données partagées entre chercheurs du plateau Phase 2 : Mettre à disposition des laboratoires sur le plateau les moyens de déployer eux-mêmes des données. Dans leur infrastructure Ou dans une infrastructure mutualisée Cloud pour les expérimentations (de technologies, d'interdisciplinarité...) Phase 3 : Contribuer à la réflexion et l'expérimentation de mise à dispositions des technologies du Web afin d’accélérer la recherche. - 5 08/10/2014 Karima Rafes - 5 6 janvier 2015

6 Objectifs en 1 image : mieux partager neuroscience Raw DataLinked Data neuroscience Linked Personal Data 08/10/2014 Karima Rafes - 6 6 janvier 2015

7 Objectifs en 1 image : mieux diffuser Publish neuroscience 08/10/2014 Karima Rafes - 7 6 janvier 2015

8 Une approche réaliste L’Université Paris Saclay est un échantillon représentatif de l’ensemble de l’activité scientifique dans son ensemble Très grande hétérogénéité : de la plate-forme de production de données locale aux grosses collaborations mondiales Multi-institutionnel Le positionnement institutionnel de CDS est transversal par nature et en devenir StandardAction Data CDS CentralisatriceCollaborative IntrusiveRespectueuse Automatisée (crawling) Volontaire Tout gratuit/payantNiveaux d’accès 08/10/2014 Karima Rafes - 8 6 janvier 2015

9 Référencer les données 1

10 Phase 1 : Référencer les données https://io.datascience-paris-saclay.fr Inscription Regroupement Données 08/10/2014 Karima Rafes - 10 6 janvier 2015

11 28 novembre 2014 Karima Rafes – LOD & DaaS IO-CDS - 11 Details of datasets with tags With WikiData, we can link the datasets with Wikipedia With WikiData4Research, we can develop Wikipedia’s Gadget for the scientists and facilitate the exchange of data between scientists Map with the laboratories’ datasets of the Université Paris Saclay https://io.datascience-paris-saclay.fr Platform I / O Data Center for Science of Paris-Saclay

12 Phase 1 : Commencer à les déclarer avec un niveau d’accès restreint 08/10/2014 Karima Rafes - 12 6 janvier 2015

13 Phase 1 : Comment les déclarer 08/10/2014 Karima Rafes - 13 6 janvier 2015

14 Pourquoi utiliser les URI de WikiData ? Démonstration avec les données de la chimie IDs des BDD de la chimie qui n’a rien à faire dans une encyclopédie Texte réutilisé par Google A terme les ID seront déplacés dans WikiData 08/10/2014 Karima Rafes - 14 6 janvier 2015

15 Pourquoi utiliser les URI de WikiData ? Démonstration avec les données de la chimie Chaque donnée possède une référence de son origine permettant d’arbitrer en cas de conflits 08/10/2014 Karima Rafes - 15 6 janvier 2015

16 Pourquoi utiliser les URI de WikiData ? Les données de WikiData deviennent : Génériques Disponibles Gratuites Dans le futur, elles seront : Fiables Disponible en temps réel Interopérable Modifiable à travers les outils des chercheurs Le pivot des ID dans les sciences Il faut commencer à relier les données des disciplines entre elles à travers cette futur base de connaissance global et ainsi mettre à profit dans nos futurs outils la convergence des bases de données. 6 janvier 2015 Karima Rafes - 16

17 Phase 1 : Déclarer les fichiers et les API Ajouter les fichiers/API 08/10/2014 Karima Rafes - 17 6 janvier 2015

18 Phase 1 : Déclarer un fichier 08/10/2014 Karima Rafes - 18 6 janvier 2015

19 2014, 570 Endpoints SPARQL dans le LOD http://lod-cloud.net/versions/2014-08-30/lod-cloud_colored.png, 08/10/2014 Karima Rafes - 19 6 janvier 2015

20 Phase 1 : Rendre accessible les fichiers/API par les machines https://io.datascience-paris-saclay.fr/sparql Exemple : 08/10/2014 Karima Rafes - 20 6 janvier 2015

21 Description de vos données : L’URL du service qui les héberge et le graphe 6 janvier 2015 Karima Rafes - 21

22 Phase 1 : Déclarer une API 08/10/2014 Karima Rafes - 22 6 janvier 2015

23 Phase 1 : Accès direct aux fichiers/API, au site web et à une adresse email Type et lien vers le fichier Version à terme avec vérification : d’accès aux fichiers/API et à l’intéropérabilité des données. 2015/16 08/10/2014 Karima Rafes - 23 6 janvier 2015

24 Mettre à disposition 2

25 Phase 2: déployer vos données Choisir vos logiciels 08/10/2014 Karima Rafes - 25 DATABASE SYSTEM Interoperability SecurityPerformanceManagement TFT ? ? ? http://SPARQLSCORE.com Contrôle qualité des logiciels de stockage RDF 1 Each day, we test the last build of Fuseki, Marmotta, Virtuoso, 4store… 6 janvier 2015

26 Phase 2: déployer vos données Automatiser le déploiement de vos données RDF data Sélection de la BDD RDF en fonction de vos critères 2 Sélection des données qui ont vocation à être partagées via le Web 08/10/2014 Karima Rafes - 26 6 janvier 2015

27 Phase 2: déployer vos données Automatiser la migration des données RDF RDF data 3 Migration automatique des données RDF 08/10/2014 Karima Rafes - 27 6 janvier 2015

28 Phase 2: déployer vos données Automatiser le déploiement des données RDF 4 Déploiement des données dans le Linked Data Science Simplification de travailler avec les données d’autres laboratoires 5 08/10/2014 Karima Rafes - 28 6 janvier 2015

29 Phase 2: déployer vos données Enregistrer les données WoT RDF Sciences City Open Data Web Agent data Permettre l’enregistrement de données en temps réel. 6 08/10/2014 Karima Rafes - 29 6 janvier 2015

30 Phase 3: déployer vos données dans le Cloud Réutiliser les outils du Web WoT RDF Sciences City Open Data Web Agent data Faciliter l’intégration de Web Agent pour aider les chercheurs 7 08/10/2014 Karima Rafes - 30 6 janvier 2015

31 Contribuer à la réflexion 3

32 Evénements Matinées CDS Inscription de vos données échanger sur l’avenir des données dans la recherche au sein de votre domaine. Journée initiation aux Wikis Comprendre et apprendre à collaborer à travers Wikipedia Décrire des données dans WikiData Faire une requête sur les données 08/10/2014 Karima Rafes - 32 6 janvier 2015

33 Projets de recherche Proposition WikiData for the research (H2020) 08/10/2014 Karima Rafes - 33 6 janvier 2015

34 Projets de recherche : La recherche en 2020 ? 28 novembre 2014 Karima Rafes – LOD & DaaS IO-CDS- 34

35 Projets de recherche : La recherche en 2020 ? 28 novembre 2014 Karima Rafes – LOD & DaaS IO-CDS- 35

36 Projets de recherche : La recherche en 2020 ? 08/10/2014 Karima Rafes - 36 6 janvier 2015

37 Merci Des questions ? EQUIPE PROJET TAO Paris-Saclay


Télécharger ppt "EQUIPE PROJET TAO Paris-Saclay 28 novembre 2014 Plateforme I/O CDS de Paris-Saclay https://io.datascience-paris-saclay.fr https://io.datascience-paris-saclay.fr."

Présentations similaires


Annonces Google