La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Folksonomies scientifiques : une étude exploratoire comparative Dominique Besagni, Cecilia Fabry, Claire François, Clotilde Roussel INIST / CNRS Evelyne.

Présentations similaires


Présentation au sujet: "Folksonomies scientifiques : une étude exploratoire comparative Dominique Besagni, Cecilia Fabry, Claire François, Clotilde Roussel INIST / CNRS Evelyne."— Transcription de la présentation:

1 Folksonomies scientifiques : une étude exploratoire comparative Dominique Besagni, Cecilia Fabry, Claire François, Clotilde Roussel INIST / CNRS Evelyne Broudoux UVSQ, DICEN

2 22 Objectifs généraux de létude De quoi se composent les folksonomies scientifiques ? Une question : que révèlent les usages ? –Activité réelle des usagers dans et hors les groupes ? –Représentativité des domaines scientifiques ? Méthodologie –Une entrée par les groupes –Une entrée par les tags

3 33 Objectifs spécifiques de létude Quels groupes utilisent quels tags pour quels articles ? Informations sur les groupes Membres Tags utilisés Articles et/ou références répertoriés dans les bibliothèques des groupes Dates (utilisateur et/ou article) Analyses Dynamique des groupes –Taille, âge des groupes, dernière arrivée dun membre Activité des groupes –Taille des bibliothèques, dernier article ajouté, –Tags associés aux articles Analyse de contenu –Réseau de partage des tags par les groupes

4 44 Protocole opératoire Récupération des données à partir de pages HTML : –Scripts Perl –Module WWW::Mechanize qui peut : décharger les pages HTML, suivre les liens, remplir les formulaires, cliquer sur les boutons, gérer les cookies, mais ne peut pas interpréter JavaScript (exemple 2Collab) ! (existe pour la plupart des langages : java, python, ruby, php...) –Module WWW::RobotRules : respect des consignes du serveur

5 55 Protocole opératoire Récupération des données à partir dune API : –Sur certains sites comme Bibsonomy –Scripts Perl –Module WWW requête simple, syntaxe dépendante du site, résultat sous forme de fichiers XML, –Module XML::TokeParser

6 66 CiteULike

7 77 Recherche des groupes URL :

8 88 Recherche sur un groupe (1) URL :

9 99 Recherche sur un groupe (2) URL :

10 10 Recherche sur un groupe (3) URL :

11 11 Recherche sur un groupe (4) URL :

12 12 Résultats Effectifs et dynamique des groupes Activité des groupes Tags utilisés par lensemble des groupes Réseau dun sous-ensemble : –17 groupes partageant le tag « deforestation »

13 13 CiteUlike : Effectifs des 2871 groupes 1434 groupes dun seul membre Max 99 membres

14 14 Dynamique des groupes dernier membre ajouté Année de création % 9% 15% 17% 37% 6% 11% 14% 31% 38%

15 15 Le groupe contenant le + dinscrits Bioinformatics Groupe libre 99 membres Crée le 10/10/2007 Dernier membre ajouté le 06/08/ articles Dernier article ajouté le 18/09/2009 Description : Analysis and modelling of molecular biology data

16 16 Activité des groupes 236 groupes avec un seul article 524 groupes sans articles Max articles

17 17 Activité des groupes dernier article ajouté 33% 18% 3% 7% 15% 23% dernier membre ajouté % 11% 14% 31% 38%

18 18 Le groupe contenant le + darticles C. elegans /WormBase Groupe libre 2 membres Crée le 02/08/2008 Dernier membre ajouté le 17/09/ articles Dernier article ajouté le 14/09/2009 Description : Articles of note for the nematode research community in general and the C. elegans community in particular. Le plus gros groupe nest géré que par 2 utilisateurs. Il est actif depuis plus dun an et est mis à jour très régulièrement

19 19 Les groupes de 1 membre Plus de 350 groupes dun seul membre ne contenant pas darticle TESTS ???? Nb articles Nb groupes

20 20 Les groupes sans article Un groupe de 14 membres sans articles Nb membres Nb groupes

21 21 Les groupes avec 1 seul article 150 groupes constitués dun seul membre ont un seul article TESTS ???? Nb membres Nb groupes

22 22 Tags de lensemble des groupes tags tags de fréquence tags dans un seul groupe Nb. tagsNb. occurrences ……

23 23 Les tags les plus fréquents TAG FREQUENCE NB GROUPE bibtex-import c_elegans nematode elegans c-elegans caenorhabditis_elegans wormbase meeting_abstract article mdb review ewd-bib model learning Le vocabulaire du plus gros groupe en terme darticle (27741) se retrouve dans ce classement (C. elegans /WormBase )

24 24 Répartition des tags par groupe Nb. tagsNb. groupes ……

25 25 Les tags partagés par les groupes TAG FREQUENCENB GROUPE review network model learning design theory social system information bibtex-import analysis web software

26 26 Le réseau « deforestation »

27 27 Le réseau « deforestation »

28 28 Tags : 1860 bibtex-import 90 Species 68 Habitat 65 Spatial 64 Control 62 Management 58 Biodiversity 56 Conservation 55 Population 52 Diversity 51 Biological 49 Litchi 48 Mode 46 Plant 45 landscape Entomology taxonomy, ecology, conservation, evolution, physiology, genetics 10 utilisateurs, 1862 articles, Créé en 2007, dernier utilisateur en 09/2009 dernier article en 06/ tags Botany taxonomy, evolution, physiology, ecology, genetics 11 utilisateurs, 1862 articles, Créé en 2007, dernier utilisateur en 08/2009 dernier article en 06/ tags EarthEnvironmentalSciences Major researches on various environmental, ecological, socio-economic, geographical, biodiversity issues. From earth climate change to minute soil pores studies. From microbiotic crusts to Amazon forest study. From polar ice caps to Sahara desert. 12 utilisateurs, 1862 articles, Créé en 2008, dernier utilisateur en 08/2009 dernier article en 06/ tags Une bibliothèque pour 3 groupes

29 29 Bibsonomy 29

30 30 Recherche des groupes

31 31 Recherche sur un groupe (1) BIBLIOTHEK 2.0 Séparation url (bookmarks) et publications (notices)

32 32 Effectifs des 169 groupes 85 groupes de zéro membre ???????? Max 47 membres pour le plus grand groupe Particularités de ce logiciel le 1 er membre donne son nom au groupe et nest pas compté

33 33 Dynamique des groupes dernier article ajouté Année de création 50% des groupes sont mis à jour depuis janvier 2010

34 34 Les tags les plus fréquents # Intitulé Nb. d'occurrences imported18207 web6578 learning6369 tool6091 folksonomy5307 semantic4526 social4500 web software4011 tagging3823 design3806 ontology3771 analysis3604 my-own3264 network3103 search3018 blog2910 education2868 clustering2607 conference2602 to-read2572 fca2519 TAG automatique

35 35 Connotea

36 36 Connotea

37 37 Groupes

38 38 2collab 38

39 39 2collab 39

40 40 Conclusion - Perspectives Premières analyses exploratoires –Analyse guidée par les groupes et les tags –Réseaux de groupe par tags partagés Profils des groupes –Une activité différenciée dans les groupes Des testeurs en nombre (groupes de 1 personne) Des petits groupes très actifs (2 personnes) Des groupes qui continuent de croître sans activité de tagging –Des longues traines de tags

41 41 Conclusion - Perspectives Les domaines représentés –Les groupes représentant les domaines Reste à évaluer –Le poids de lactivité des individus hors groupes –Le poids des références importées des autres serveurs (recoupements)


Télécharger ppt "Folksonomies scientifiques : une étude exploratoire comparative Dominique Besagni, Cecilia Fabry, Claire François, Clotilde Roussel INIST / CNRS Evelyne."

Présentations similaires


Annonces Google