DataShop & Tatiana: expériences communes de deux outils de partage de données et danalyses Gregory Dyke, John Stamper, Carolyn Rosé Carnegie Mellon University / PSLC
Plan 1.PSLC DataShop 2.Tatiana 3.Quelles similarités? Quelles leçons en tirer?
PSLC DataShop
DomainFilesPapersDatasets Student Actions Students Student Hours Language ,099,1494,7684,788 Math ,994,75519,097109,513 Science ,274,8978,03622,699 Other ,840,7438,08718,053 Total ,209,54439,988155,054 Utilisation
Concepts Problem –Composé de Step Step –Partie différentiable et évaluable dun problème Transaction –1 étudiant + 1 step –Indice / autre KC (knowledge component) –Compétence ou connaisance Knowledge Model –Mapping entre step et KC
Outils Manipulation de corpus –Import/Export –Selection de sous-corpus Analyses –Courbes dapprentissage –Rapport derreurs –Profil de performances
Courbe dapprentissage
Rapport derreurs
Profil de performance
Actualité / avenir Services web Autres types de données Intégration dinformations supplémentaires Compétitions (e.g. SIGKDD)
Tatiana
Concepts Environnement de manipulation de rejouables –séquence dévènements (« lignes ») –chaque événement a des facettes (« colonnes ») –Date, UID Operations (= points dextension/API) –Visualisation (application dune feuille de style) –Transformation (créer nouveaux rejouables) –Synchronisation (coordination de visualisations) –Enrichissement (ajout de colonnes ou de relations sur rejouables existants)
Utilisation Lyon, Paris, Denmark, Netherlands, England, Hong- Kong, USA, Corée Médiatisé par ordinateur, face à face, les deux Blogs, forums, chat, text editing, graphs, video, etc. Co-conception, argumentation, prise de notes, FLE, biologie, chimie, rédaction Workshops CSCL/Alpine RDV/ICLS Extensible et disponible: –
Conclusions communes?
Pourquoi partager? Répondre à nos propres besoins danalyse –Partage entre chercheurs –Analyse collaborative Mise à disposition de données existantes –Quantité et puissance statistique –Coût de collecte –Educational data mining –Analyses à la croisée dépistémologies
Que partager ? Données qui rentrent dans un certain moule: DataShop –ITS = juste/faux, annoté KC (facultatif) –Petit grain, longue durée –Analyses « typiques » de ces données Tatiana –Processus interactifs (particulièrement CSCL) –Coordination de représentations et dannotations –Données peu structurées faisant sens pour le chercheur –Analyse manuelle/assistée
Comment partager ? Données + contexte pour réutilisation DataShop –Depôt de données –Application web Tatiana –Logiciel standalone (import+export corpus) Accepter des pré-réquis de base –Transactions, steps, KC, etc. –Rejouables, tranformations, visualisations, etc. Proposition doutils exploitant ces préréquis
Facteurs de réussite ? Facilité dimport/export –Avec minima pré-réquis –En gardant données supplémentaires Être lutilisateur primaire Fournir les fonctionnalités équivalentes aux outils ad- hoc existants Fournir des fonctionnalités supplémentaires « gratuites » Donner le moyen dexploiter ce qui va « au-delà » du minima Plateforme avec données mises à disposition Evènements et workshops Financements adéquats (et pérennes)