Creative Commons / Data –10 obstacles au partage (livre blanc J. Rees, 2010)J. Rees, 2010 The DataVerse Network (G. King, 2007)DataVerseG. King, 2007 –Archive, Estampille, Reconnaissance, Partage ou non. NSF : Data Management Plan Datacite : Liste des (647) repositories (juin 2013)Datacite PSLC DataShop : une initiative exemplaire 10">

La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Données issues des interactions en ligne en situation d'apprentissage : Quels sont les moyens du partage ? Christophe Reffay Chercheur de lIFÉ, STEF, ENS.

Présentations similaires


Présentation au sujet: "Données issues des interactions en ligne en situation d'apprentissage : Quels sont les moyens du partage ? Christophe Reffay Chercheur de lIFÉ, STEF, ENS."— Transcription de la présentation:

1 Données issues des interactions en ligne en situation d'apprentissage : Quels sont les moyens du partage ? Christophe Reffay Chercheur de lIFÉ, STEF, ENS Cachan Séminaire TIC, STEF, ENS-Cachan – 13 juin 2013

2 Séminaire TIC, ENS-Cachan, 13/06/ Publication = Part visible Analyse

3 Séminaire TIC, ENS-Cachan, 13/06/ Contexte international CODATA: Physique, Géosciences… (Paris,1966) –Revue "Data Science Journal" Processus de Berlin : Open Access Science Commons => Creative Commons / Data –10 obstacles au partage (livre blanc J. Rees, 2010)J. Rees, 2010 The DataVerse Network (G. King, 2007)DataVerseG. King, 2007 –Archive, Estampille, Reconnaissance, Partage ou non. NSF : Data Management Plan Datacite : Liste des (647) repositories (juin 2013)Datacite PSLC DataShop : une initiative exemplaire 10

4 Séminaire TIC, ENS-Cachan, 13/06/ Initiatives nationales ADONIS (TGE) + IR Corpus => TGIR pour les humanités numériques –Le CLEO (Hypothèses, Revues.org, Calenda) –beQuali ? –Datapublication (lien avec revues) ? Mulce (ANR Corpus) : mulce.org CALICO (données et outils) IPOL : Une initiative exemplaire

5 Mulce (ANR ) MUltimodal Learning Corpus Exchange Laboratoire dInformatique de lUFC Laseldi puis LRL (T. Chanier) Open University (CREEK) Projet Mulce soutenu par Informatique Ingénierie pédagogique Apprentissage des langues

6 Séminaire TIC, ENS-Cachan, 13/06/ Contexte : Analyse des interactions en ligne Scénario pédagogique Hypothèses Questions recherche Analyses Traces Prod. Descrip. Acteurs Hypothèses Questions recherche t0t0 t1t1 Instanciation Communauté de recherche Publi. Dispositif outil

7 Séminaire TIC, ENS-Cachan, 13/06/ Aujourdhui… Une autre vision du partage Questions Traces Résultat1 Dispositi f Traces Dispositi f Résultat2 =?= Partage Questions Analyses Partage Résultat3 Résultat4 Demain ?

8 Séminaire TIC, ENS-Cachan, 13/06/ Ce qui est problématique Pour interpréter les interactions situées : cadre pédagogique, temporel, acteurs, médium, … => Contexte –Scénario pédagogique –Protocole de recueil des données –Questions de recherche Pour automatiser certaines analyses => Format déchange / Structuration des données –Normes et standards Pour protéger les acteurs => Droit et éthique –Consentement éclairé et droits dauteurs, image –Données personnelles => anonymisation –Licences dutilisation des données

9 Séminaire TIC, ENS-Cachan, 13/06/ Questions - Objet - Problématique - Observables - Protocole de recueil des donnés Schéma simplifié des parties dun corpus de base Instanciation Scénario pédagogique Protocole de recherche Licence publique Licence privée Analyses ContexteContexte - Activités - Rôles - Environnements - Acteurs - Outils - Traces -Interactions -Logs -produits Observations du contexte - Termes cession des droits - Contrats dutilisation - Lien propriétaire - Transcriptions - Analyses

10 Séminaire TIC, ENS-Cachan, 13/06/ Scénario Pédagogique Protocole Recherche Instanciation Licence Index Données primaires Approche Pédagogique _______ Activités Rôles Environnements Questions Méthodologie, recueil _______ Activités, rôles & Environnements (recherche) Observations Agenda _______ Acteurs / groupes (codes acteurs) Outils Interactions structurées Licences -Utilisation -Dépôt _______ Editeurs Droits accès Contrat cession acteurs Anonymisation Consignes Aides Ressources Questions Grilles dentretien Recherche : questionnaires réflexifs, entretiens Pédagogique : Produits, traces Fichier suivi Procédure danonymisation Contrat de Cession des droits Licence Privée Contrats Cession Codes, Noms acteurs Package (IMS-CP) pour Mulce Identification des ressources Tableau anonymisation Contrat de cession des droits Description Méta données Méta données générales sur le corpus Méta données

11 Séminaire TIC, ENS-Cachan, 13/06/ Plateforme Mulce Chercheur authentifié Client Outils daide à la lanalyse Serveur Internaute ComparerAnalyser Consulter / Télécharger Transcrire Outils daide à la transcription Corpus Scénario pédagogique Protocole de Recherche LicenceInstanciation -Description -Index Ressources -Description -Index -Description -Index -Description -Index Serveur OLAC** Serveur OAI* Metadata * Open Archive Initiative ** Open Language Archive Community ?

12 Séminaire TIC, ENS-Cachan, 13/06/ La plateforme Mulce actuelle…

13 Séminaire TIC, ENS-Cachan, 13/06/ Mulce… 3 ans après 45 corpus déposés (dont 4 globaux) Quelques réutilisations de corpus Toujours pas de dépôt « externe » malgré plusieurs intentions exprimées Quelques leçons : –Format sophistiqué => coût dentrée –Métadonnées bien documentées => visibilité –Nécessité doutiller : exploration et analyse

14 Séminaire TIC, ENS-Cachan, 13/06/ Difficultés surmontées pour la réutilisation : Bilan du projet Mulce 1.The author must be professionally motivated to publish the data 2.The effort and economic burden of publication must be acceptable 3.The data must become accessible to potential users 4.The data must remain accessible over time 5.The data must be discoverable by potential users 6.The users use of the data must be permitted 7.The user must be able to understand what was measured and how (materials and methods) 8.The user must be able to understand all computations that were applied and their inputs 9.The user must be able to apply standard tools to all file formats 10.The user must be able to understand the data in detail (units, symbols) Surmontée Pas observé Non surmontée

15 CALICO (ERTÉ ) Communautés d'apprentissage en ligne, instrumentation, collaboration STEF, CREAD : Sciences de lÉducation LIUM, LIFC - GREYC: Informatique - Linguistique CURAPP: Administration et Politique CEDITEC: Communication ERTÉ CALICO soutenue par

16 Séminaire TIC, ENS-Cachan, 13/06/ Plateforme CALICO : Principes Plateforme avec interface multilingue Dépôt & partage de données dinteractions en ligne (Forums, Blogs, mailing lists, etc.) Outils dexploration et danalyse –Indépendants de la langue –Visualisations variées (volumes, périodes…) –Extraction du lexique, marquage, repérage

17 Séminaire TIC, ENS-Cachan, 13/06/ CALICO : Les documents

18 Séminaire TIC, ENS-Cachan, 13/06/ CALICO : Les outils

19 Séminaire TIC, ENS-Cachan, 13/06/ CALICO : Les outils

20 Séminaire TIC, ENS-Cachan, 13/06/ CALICO : Les outils

21 Séminaire TIC, ENS-Cachan, 13/06/ CALICO : Les outils

22 Séminaire TIC, ENS-Cachan, 13/06/ CALICO : Bilan des usages Beaucoup dintérêt Des essais assez nombreux Des dépôts « externes » Assez peu de partage de données Plutôt une réutilisation des outils

23 Séminaire TIC, ENS-Cachan, 13/06/ Difficultés surmontées pour la réutilisation : Bilan pour CALICO 1.The author must be professionally motivated to publish the data 2.The effort and economic burden of publication must be acceptable 3.The data must become accessible to potential users 4.The data must remain accessible over time 5.The data must be discoverable by potential users 6.The users use of the data must be permitted 7.The user must be able to understand what was measured and how (materials and methods) 8.The user must be able to understand all computations that were applied and their inputs 9.The user must be able to apply standard tools to all file formats 10.The user must be able to understand the data in detail (units, symbols) Surmontée Pas observé Non surmontée

24 Data Publication Direction du projet Thierry ChanierThierry Chanier, Professor, Director of LRLLRL Eric BruillardEric Bruillard, Professor, Director of STEFSTEF Christophe ReffayChristophe Reffay, Ass. Professor, UMR STEFSTEF Directeur de publication Jean-Luc Pinol, Professor, TGE-AdonisTGE-Adonis Plateforme : conception et developpement Gérald FoliotGérald Foliot: IR CNRS, IT Manager of TGE-AdonisTGE-Adonis /

25 Séminaire TIC, ENS-Cachan, 13/06/ Data publication : objectifs Pour les revues et conférences: –Relecture AVEC accès aux données Pour les lecteurs –Accès à la réplication des analyses Pour lauteur : un double référencement –Article –Ensemble de données (permalien)

26 Séminaire TIC, ENS-Cachan, 13/06/ Data Publication… Plusieurs essais –Co-publication des données après article –Un essai « complet » : lors de la soumission Plateforme : prototype quasi opérationnel –Processus un peu rigide pour linstant –Nécessite dêtre documenté Affaire à suivre A voir selon TGIR Humanités numérique

27 Séminaire TIC, ENS-Cachan, 13/06/ Difficultés surmontées pour la réutilisation : Attendu pour Data Publication 1.The author must be professionally motivated to publish the data 2.The effort and economic burden of publication must be acceptable 3.The data must become accessible to potential users 4.The data must remain accessible over time 5.The data must be discoverable by potential users 6.The users use of the data must be permitted 7.The user must be able to understand what was measured and how (materials and methods) 8.The user must be able to understand all computations that were applied and their inputs 9.The user must be able to apply standard tools to all file formats 10.The user must be able to understand the data in detail (units, symbols) Améliore Pas concerné Accentue le problème

28 Séminaire TIC, ENS-Cachan, 13/06/ initiatives exemplaires PSLC Datashop : Pittsburgh Science of Learning CenterPSLC Datashop –Un Modèle pour les ITS –Une plateforme de dépôt des traces –Un outil de représentation/évaluation IPOL : Image Processing On LineIPOL –Article + Code source + Demo en ligne –Article et code source sont évalués Open Science and Reproducible Research

29 Séminaire TIC, ENS-Cachan, 13/06/ Quelques points clés retenus Dépôt/Publication = Antériorité Contribution : réputation, citation Valoriser le dépôt : –Définition du contexte –Organisation/Structuration des données Visibles (Repository, Metadata, OAI) Réutilisables : Accessibles, Inter opérables Réplicables : Outillées, documentées

30 Séminaire TIC, ENS-Cachan, 13/06/ Perspectives Le partage de données devient réalité Pour certaines communautés permet : –Maturation/Convergence/Comparaison des méthodes –Réplication des analyses ou ré-analyse –Meilleure évaluation de la recherche Toute donnée nest cependant pas partageable

31 Séminaire TIC, ENS-Cachan, 13/06/ Questions éthiques Protection des participants en SHS (ex: situations dapprentissage, entretiens): Droits à limage Droits dauteur Protection des données personnelles Protection des données sensibles

32 Séminaire TIC, ENS-Cachan, 13/06/ Anonymisation (données textuelles) Débat: –Données non anonymes => non partageables –Anonymisation trop coûteuse –Anonymisation automatisable ? –Limiter laccès ? Propositions –Outiller le processus danonymisation ? –Maîtriser la diffusion ?

33 Séminaire TIC, ENS-Cachan, 13/06/ MERCI ! Questions ? Réactions ? Témoignages ?

34 Séminaire TIC, ENS-Cachan, 13/06/ Déclaration Berlin (Open Access) 5° conférence (Padoue, 2007) Workshop on policies and practices of research organisations on open access to research data. Objectifs : 1.to get research organizations in Europe acquainted with on-going and planned initiatives for open access to research data 2.to present and discuss policies and practices on open access to research data of organisations and 3.to identify areas in which research organisations could collaborate on this issue. Les 19 premiers cosignataires du 22/10/2003 Berlin Process Signataires récents

35 Séminaire TIC, ENS-Cachan, 13/06/ National Science Fondation (depuis janvier 2013) Data Management PlanData Management Plan : Pour une bourse de la NFS, un document supplémentaire de 2 pages intitulé « plan de gestion des données » doit indiquer : Le type de données (extraits, collections, logiciels, contenus, ou produits du projet) Les standards utilisés pour les données et les métadonnées; Politique daccès et de partage incluant les précautions pour le respect de la vie privée, de la confidentialité, de la sécurité et des propriétés intellectuelles; Politique de réutilisation, redistribution, et produits dérivés Plans pour larchivage des données, extraits, et autre produits de la recherche, et pour la préservation de leur accès.

36 Séminaire TIC, ENS-Cachan, 13/06/ CODATA : Créée à Paris en 1966 ! Constantes physiques 23 Conf. 30 Nations 20 Sociétés scientifiques 57 Task Groups years (Lide & Wood, 2010) (Lide & Wood, 2010)

37 Séminaire TIC, ENS-Cachan, 13/06/ Difficultées à surmonter pour la réutilisation (Jonathan Rees, Science Commons, white paper Creative Commons, March 2010 ) 1.The author must be professionally motivated to publish the data 2.The effort and economic burden of publication must be acceptable 3.The data must become accessible to potential users 4.The data must remain accessible over time 5.The data must be discoverable by potential users 6.The users use of the data must be permitted 7.The user must be able to understand what was measured and how (materials and methods) 8.The user must be able to understand all computations that were applied and their inputs 9.The user must be able to apply standard tools to all file formats 10.The user must be able to understand the data in detail (units, symbols) => Data paper genre

38 Séminaire TIC, ENS-Cachan, 13/06/ Autres Initiatives/Relais Open Notebook Science (J.-C Bradley)Open Notebook Science (J.-C Bradley) –Transparence complète (Drexel University)


Télécharger ppt "Données issues des interactions en ligne en situation d'apprentissage : Quels sont les moyens du partage ? Christophe Reffay Chercheur de lIFÉ, STEF, ENS."

Présentations similaires


Annonces Google