Nouvelles possibilités de R&D induites par la publication de collections de données publiques massives Ismail KASSOU Directeur du CEDOC ST2I Open Gov & open Data, Mardi 6 mai 2014
Colloque national Open Gov & Open Data 05/06/2014 Colloque national Open Gov & Open Data Présentation Recherche & Développement Open Data
de Recherche et d’Innovation-SNRI 05/06/2014 Colloque national Open Gov & Open Data Système National de Recherche et d’Innovation-SNRI
Système national de la recherche 05/06/2014 Colloque national Open Gov & Open Data Système national de la recherche Potentiel de recherche universitaire: 6 Instituts de recherche, 982 structures de recherche accréditées, Plus de 50 Centres d’Etudes Doctorales (CEDOC). Potentiel de recherche ne relevant pas des universités: 17 établissements de formation de cadres (Ingénieurs et Master), 12 Instituts et Centres spécialisés de recherche. Recherche scientifique (centres spécialisés + structures dans entreprises ) Ressources humaines : Personnel de la recherche : 30.000. Moyens financiers : +150 millions de dhs annuels. Production scientifique universitaire : + 2600 publications indexées. Thèses doctorales soutenues : + 900.
CEDOC Sciences et Technologies de l’Information et de l’Ingénieur 05/06/2014 Colloque national Open Gov & Open Data CEDOC Sciences et Technologies de l’Information et de l’Ingénieur Centre de l’Université Mohammed V Souissi créé en 2008. 2 filières accréditées : Génie Informatique, Génie Sciences de l’Ingénieur (Electrique, Mécanique, Environnement, …). 2 établissements : ENSIAS et ENSET. 20 partenaires nationaux et internationaux. 27 structures de recherche. +80 encadrants. 361 doctorants. +200 publications annuelles dont 120 indexées. 20 soutenances de thèse en 2014 (30 prévues en 2015).
Colloque national Open Gov & Open Data 05/06/2014 Colloque national Open Gov & Open Data Cadre de la recherche Autonomie scientifique des organismes, Liberté de pensée des chercheurs, Ethique de la recherche, Financement de la recherche, Démonstration des résultats, Evaluation : Review, H-index, Facteur d’impact, Altmetrics.
Les produits de la recherche 05/06/2014 Colloque national Open Gov & Open Data Les produits de la recherche La recherche vise à produire des connaissances scientifiques. Ces connaissances peuvent prendre des formes diverses : publications, rapports, brevets, communications orales, etc... Ces connaissances peuvent être incorporées dans de nouvelles machines, de nouveaux instruments ou dispositifs. Tous ces produits sont diffusé au sein de la communauté scientifiques et permettent au chercheur d'être reconnu par ses pairs.
Colloque national Open Gov & Open Data 05/06/2014 Colloque national Open Gov & Open Data Biais de la recherche Erreur La recherche scientifique peut se nourrir des erreurs et des errements des chercheurs, Les grandes découvertes apparaissent souvent de manière inattendue, Cette particularité de la recherche scientifique porte un nom : c'est la sérendipité. Fraude scientifique Invention pure et simple de résultats scientifiques, avec parfois fabrication de faux matériels, Rectification ou sélection de résultats expérimentaux, afin de faire paraître meilleure la force de prédiction d’une théorie, Plagiat d’autres scientifiques.
Données utilisées dans la recherche 05/06/2014 Colloque national Open Gov & Open Data Données utilisées dans la recherche Données scientifiques : Données d’observation, Données expérimentales, Données de simulation. Données publiques. Articles scientifiques. Thèses. Etc.
Cycle de vie des données de recherche 05/06/2014 Colloque national Open Gov & Open Data Cycle de vie des données de recherche Création donnée Réutilisation donnée Traitement donnée Accès à la donnée Analyse donnée Stokage donnée Source : http://data-archive.ac.uk/create-manage/life-cycle
Bases de données scientifiques 05/06/2014 Colloque national Open Gov & Open Data Bases de données scientifiques Trois modèles présents actuellement sur le web : Accès payant pour les usagers, Accès gratuit pour les usagers mais payant au moment du dépôt de la publication, Accès gratuit pour les usagers et dépôt gratuit.
IMIST : Institut Marocain de l’Information Scientifique et Technique 05/06/2014 Colloque national Open Gov & Open Data IMIST : Institut Marocain de l’Information Scientifique et Technique Missions : Diffusion de l’information scientifique et technique, Veille technologique. Réseau Marwan. Bibliothèque. Bases de données scientifique : Aluka, Jstor, Science direct, Scopus, MVSL, Web of knowledge, Cairn, Springer.
Base de données TOUBKAL 05/06/2014 Colloque national Open Gov & Open Data Base de données TOUBKAL Bases de données des thèses marocaines. Diffusion du contenu scientifique produit par les laboratoires marocains. Vérification des sujets de thèse par les directeurs de thèse et les doctorants. Mise à disposition des thèses dans le domaine. 8225 documents disponibles en ligne (source http://www.imist.ma).
Bases de données scientifiques en libre accés 05/06/2014 Colloque national Open Gov & Open Data Bases de données scientifiques en libre accés DOAJ : http://doaj.org Base de données de publication en libre accès, 9 707 journaux recensés de 133 pays, 1 614 911 documents. Citeseer http://citeseerx.ist.psu.edu/: Base de données de documents scientifiques, 750 000 Documents, 1,5 Millions de requêtes journalières. HAL http://hal.archives-ouvertes.fr Archive ouverte pluridisciplinaire HAL, destinée au dépôt et à d'articles scientifiques de niveau recherche, 281 557 documents.
Colloque national Open Gov & Open Data 05/06/2014 Colloque national Open Gov & Open Data SCOPUS Base de données de 53 millions d’enregistrement issus de près de 21 915 journaux. 33 887 publications marocaines. 3593 publications marocaines en 2013 : médecine 1134, informatique 523, ingénierie 508, mathématiques 508, physique et astronomie 486, sciences des matériaux 425, chimie 371, agriculture et biologie 273, biochimie et génétique et biologie moléculaire 252, sciences de l’environnement 214, … Source : http://www.scopus.com
Articles scientifiques open data sur le web 05/06/2014 Colloque national Open Gov & Open Data Articles scientifiques open data sur le web Google scholar 115 100 Citeseer 3 455 SCOPUS 1 571 dont 1 043 en informatique DBLP 1 107 Web of knowledge 317 DOAJ 96 Science direct 58 Source : sites web des bases de données
Publications sur la thématique « open data » sur SCOPUS 05/06/2014 Colloque national Open Gov & Open Data Publications sur la thématique « open data » sur SCOPUS Source : http://www.scopus.com
Exemples de publications en 2014 05/06/2014 Colloque national Open Gov & Open Data Exemples de publications en 2014 Benchmarking open government: An open data perspective EXOD: A tool for building and exploring a large graph of open datasets Learning tool for medicine students based on biomedical named entity recognition and linked open data Seasonal comparisons of meteorological and agricultural drought indices in Morocco using open short time-series data Alignment and dataset identification of linked data in Semantic Web Open data and open code for big science of science studies On the design of a self-medication web application built on linked open data Closing the data gap: Creating an open data environment In store augmented reality: Retailing strategies for smart communities
Thématiques de recherche à fort potentiel économique 05/06/2014 Colloque national Open Gov & Open Data Thématiques de recherche à fort potentiel économique Internet mobile Gestion des connaissances Internet des objets Technologie cloud Robotique avancée Véhicule autonome et semi autonome Recherche sur les génomes Stockage de l’énergie Impression 3D Matériaux avancés Exploration et exploitation de pétrole et de gaz Energie renouvelable Source : 2013 Mc Kinsey Global Institute Analysis
Exemples d’usage de données ouvertes 05/06/2014 Colloque national Open Gov & Open Data Exemples d’usage de données ouvertes OPEN STREET MAP : Cartographie libre du monde entier WIKIPEDIA : Encyclopédie construite de manière collaborative GitHub : Hébergement de code source logiciel ScraperWiki : Plateforme contributive autour de la problématique de l'extraction et du traitement de données. CKAN : Logiciel libre qui organise le stockage et le catalogage de données Source : De l’OpenData aux citoyens : potentiel et limites des plateformes collaboratives (Velt, Gigand 2012)
Colloque national Open Gov & Open Data 05/06/2014 Colloque national Open Gov & Open Data Open Data vs Big Data L’open data consiste en l’ouverture des données La « big data » désigne le débordement des données et la volumétrie des données ainsi que leur exploitation. Cette distinction de définition compte, évidemment, mais pose surtout des problèmes similaires au niveau des perspectives et de l’éthique.
Google : Big data et Open Data 05/06/2014 Colloque national Open Gov & Open Data Google : Big data et Open Data Géant sur Internet Données très importantes sur les usagers Moteur de recherche Gmail You Tube Agenda Contacts Etc..
Exemple de données collectées 05/06/2014 Colloque national Open Gov & Open Data Exemple de données collectées <Placemark> <name>Latitude User</name> <description>Location history for Latitude User from 04/13/2014 to 04/27/2014</description> <styleUrl>#multiTrack</styleUrl> <gx:Track> <altitudeMode>clampToGround</altitudeMode> <when>2014-04-12T17:00:27.459-07:00</when> <gx:coord>-6.8368479 34.0148655 0</gx:coord> <when>2014-04-12T17:01:27.370-07:00</when> <gx:coord>-6.8368441 34.0148424 0</gx:coord> <when>2014-04-12T17:02:27.394-07:00</when> <when>2014-04-12T17:02:50.284-07:00</when> <gx:coord>-6.8834112 33.9549033 0</gx:coord> <when>2014-04-12T17:03:27.422-07:00</when> <gx:coord>-6.8368555 34.0149119 0</gx:coord> <when>2014-04-12T17:04:27.445-07:00</when> <gx:coord>-6.8371743 34.0140319 0</gx:coord> <when>2014-04-12T17:05:27.558-07:00</when> <gx:coord>-6.8379364 34.0162099 0</gx:coord> <when>2014-04-12T17:06:28.215-07:00</when> <gx:coord>-6.8372806 34.0137386 0</gx:coord> <when>2014-04-12T17:07:29.285-07:00</when> <gx:coord>-6.8373622 34.0131516 0</gx:coord> <when>2014-04-12T17:08:29.248-07:00</when> <gx:coord>-6.8374758 34.0165992 0</gx:coord> <when>2014-04-12T17:09:29.268-07:00</when> <gx:coord>-6.8359342 34.0156906 0</gx:coord> <when>2014-04-12T17:10:29.304-07:00</when> <when>2014-04-12T17:11:29.317-07:00</when> <when>2014-04-12T17:12:29.337-07:00</when> <gx:coord>-6.837106 34.0141801 0</gx:coord> <when>2014-04-12T17:13:29.370-07:00</when>
Visualisation de données 05/06/2014 Colloque national Open Gov & Open Data Visualisation de données
Visualisation de données 05/06/2014 Colloque national Open Gov & Open Data Visualisation de données
Visualisation de données 05/06/2014 Colloque national Open Gov & Open Data Visualisation de données
Colloque national Open Gov & Open Data 05/06/2014 Colloque national Open Gov & Open Data Exemple de données
Opportunités de recherche 05/06/2014 Colloque national Open Gov & Open Data Opportunités de recherche Cloud computing et Big data Systèmes mobiles Fouille de données : Datamining Textmining Webmining Web sémantique Représentation et modélisation des données Gestion des connaissances Interopérabilité des données ….
Exemple de projets à valoriser 05/06/2014 Colloque national Open Gov & Open Data Exemple de projets à valoriser Développer par ville des sites de données géographiques enrichies de données concernant la ville, les citoyens et les visiteurs. Développer des sites sur l’usage des deniers publics Mettre en place des sites sur les projets réalisés par l’administration publique Développer des sites pédagogiques reposant sur l’usage de données ouvertes. …
Colloque national Open Gov & Open Data 05/06/2014 Colloque national Open Gov & Open Data Recommandations Mettre en place des archives ouvertes nationales pour les publications marocaines Mettre en place des « incentives » pour promouvoir l’open data dans le domaine de la recherche : Obligation de mettre en ligne les résultats et les données issus des travaux de recherche financés par l’Etat Financement des projets de mise en place de plateforme de partage de données Priorité de financement pour les projets qui partagent leurs données Appuyer la création de revues indexées nationales Développer un outil national antiplagiat en conformité avec la réglementation et les instances de protection intellectuelle Promouvoir le développement de contenu pédagogiques Instaurer une instance nationale pour le pilotage du développement de l’open data. Proposer un standard national pour la diffusion des données publiques Coordiner les initiatives gouvernementales pour le développement de l’open data : Portail national opendata.gov.ma Initiative open gouvernement
Colloque national Open Gov & Open Data 05/06/2014 Colloque national Open Gov & Open Data