La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Folksonomies scientifiques : une étude exploratoire comparative Dominique Besagni, Cecilia Fabry, Claire François, Clotilde Roussel INIST / CNRS Evelyne.

Présentations similaires


Présentation au sujet: "Folksonomies scientifiques : une étude exploratoire comparative Dominique Besagni, Cecilia Fabry, Claire François, Clotilde Roussel INIST / CNRS Evelyne."— Transcription de la présentation:

1 Folksonomies scientifiques : une étude exploratoire comparative Dominique Besagni, Cecilia Fabry, Claire François, Clotilde Roussel INIST / CNRS Evelyne Broudoux UVSQ, DICEN

2 22 Objectifs généraux de létude De quoi se composent les folksonomies scientifiques ? Une question : que révèlent les usages ? –Activité réelle des usagers dans et hors les groupes ? –Représentativité des domaines scientifiques ? Méthodologie –Une entrée par les groupes –Une entrée par les tags

3 33 Objectifs spécifiques de létude Quels groupes utilisent quels tags pour quels articles ? Informations sur les groupes Membres Tags utilisés Articles et/ou références répertoriés dans les bibliothèques des groupes Dates (utilisateur et/ou article) Analyses Dynamique des groupes –Taille, âge des groupes, dernière arrivée dun membre Activité des groupes –Taille des bibliothèques, dernier article ajouté, –Tags associés aux articles Analyse de contenu –Réseau de partage des tags par les groupes

4 44 Protocole opératoire Récupération des données à partir de pages HTML : –Scripts Perl –Module WWW::Mechanize qui peut : décharger les pages HTML, suivre les liens, remplir les formulaires, cliquer sur les boutons, gérer les cookies, mais ne peut pas interpréter JavaScript (exemple 2Collab) ! (existe pour la plupart des langages : java, python, ruby, php...) –Module WWW::RobotRules : respect des consignes du serveur

5 55 Protocole opératoire Récupération des données à partir dune API : –Sur certains sites comme Bibsonomy –Scripts Perl –Module WWW requête simple, syntaxe dépendante du site, résultat sous forme de fichiers XML, –Module XML::TokeParser

6 66 CiteULike

7 77 Recherche des groupes URL : http://www.citeulike.org/groups/browse

8 88 Recherche sur un groupe (1) URL : http://www.citeulike.org/group/22

9 99 Recherche sur un groupe (2) URL : http://www.citeulike.org/group/22

10 10 Recherche sur un groupe (3) URL : http://www.citeulike.org/groupfunc/22/members

11 11 Recherche sur un groupe (4) URL : http://www.citeulike.org/group/22/article/1073937

12 12 Résultats Effectifs et dynamique des groupes Activité des groupes Tags utilisés par lensemble des groupes Réseau dun sous-ensemble : –17 groupes partageant le tag « deforestation »

13 13 CiteUlike : Effectifs des 2871 groupes 1434 groupes dun seul membre Max 99 membres

14 14 Dynamique des groupes 2009 2008 2007 2006 2005 dernier membre ajouté Année de création 2009 2004 2005 2006 2007 2008 21% 9% 15% 17% 37% 6% 11% 14% 31% 38%

15 15 Le groupe contenant le + dinscrits Bioinformatics Groupe libre 99 membres Crée le 10/10/2007 Dernier membre ajouté le 06/08/2009 3 769 articles Dernier article ajouté le 18/09/2009 Description : Analysis and modelling of molecular biology data

16 16 Activité des groupes 236 groupes avec un seul article 524 groupes sans articles Max 27 741 articles

17 17 Activité des groupes 2009 2008 2007 2006 2005 dernier article ajouté 33% 18% 3% 7% 15% 23% dernier membre ajouté 2009 2008 2007 2006 2005 6% 11% 14% 31% 38%

18 18 Le groupe contenant le + darticles C. elegans /WormBase Groupe libre 2 membres Crée le 02/08/2008 Dernier membre ajouté le 17/09/2008 27 741 articles Dernier article ajouté le 14/09/2009 Description : Articles of note for the nematode research community in general and the C. elegans community in particular. Le plus gros groupe nest géré que par 2 utilisateurs. Il est actif depuis plus dun an et est mis à jour très régulièrement

19 19 Les groupes de 1 membre Plus de 350 groupes dun seul membre ne contenant pas darticle TESTS ???? Nb articles Nb groupes

20 20 Les groupes sans article Un groupe de 14 membres sans articles Nb membres Nb groupes

21 21 Les groupes avec 1 seul article 150 groupes constitués dun seul membre ont un seul article TESTS ???? Nb membres Nb groupes

22 22 Tags de lensemble des groupes 68 522 tags 26 668 tags de fréquence 1 43 820 tags dans un seul groupe Nb. tagsNb. occurrences 26 6681 10 6542 5 1493 4 0024 2 2955 2 0226 1 2817 2 1868 9419 92910 …… 127 743 127 756 127 759 127 803 147 178

23 23 Les tags les plus fréquents TAG FREQUENCE NB GROUPE bibtex-import 47178240 c_elegans 2780316 nematode 2775917 elegans 2775611 c-elegans 277437 caenorhabditis_elegans 277351 wormbase 277351 meeting_abstract 136941 article 790928 mdb 67172 review 5514363 ewd-bib 50484 model 3952316 learning 3562292 Le vocabulaire du plus gros groupe en terme darticle (27741) se retrouve dans ce classement (C. elegans /WormBase )

24 24 Répartition des tags par groupe Nb. tagsNb. groupes 438201 97802 35623 23304 14595 9436 6127 16618 5919 46610 …… 1289 1292 1316 1346 1363

25 25 Les tags partagés par les groupes TAG FREQUENCENB GROUPE review5514363 network3236346 model3952316 learning3562292 design2617289 theory2295278 social2009275 system1552261 information1241242 bibtex-import47178240 analysis1473231 web1057221 software1733220

26 26 Le réseau « deforestation »

27 27 Le réseau « deforestation »

28 28 Tags : 1860 bibtex-import 90 Species 68 Habitat 65 Spatial 64 Control 62 Management 58 Biodiversity 56 Conservation 55 Population 52 Diversity 51 Biological 49 Litchi 48 Mode 46 Plant 45 landscape Entomology taxonomy, ecology, conservation, evolution, physiology, genetics 10 utilisateurs, 1862 articles, Créé en 2007, dernier utilisateur en 09/2009 dernier article en 06/2007 2938 tags Botany taxonomy, evolution, physiology, ecology, genetics 11 utilisateurs, 1862 articles, Créé en 2007, dernier utilisateur en 08/2009 dernier article en 06/2007 2938 tags EarthEnvironmentalSciences Major researches on various environmental, ecological, socio-economic, geographical, biodiversity issues. From earth climate change to minute soil pores studies. From microbiotic crusts to Amazon forest study. From polar ice caps to Sahara desert. 12 utilisateurs, 1862 articles, Créé en 2008, dernier utilisateur en 08/2009 dernier article en 06/2007 2938 tags Une bibliothèque pour 3 groupes

29 29 Bibsonomy 29

30 30 Recherche des groupes

31 31 Recherche sur un groupe (1) BIBLIOTHEK 2.0 Séparation url (bookmarks) et publications (notices)

32 32 Effectifs des 169 groupes 85 groupes de zéro membre ???????? Max 47 membres pour le plus grand groupe Particularités de ce logiciel le 1 er membre donne son nom au groupe et nest pas compté

33 33 Dynamique des groupes dernier article ajouté Année de création 50% des groupes sont mis à jour depuis janvier 2010

34 34 Les tags les plus fréquents # Intitulé Nb. d'occurrences imported18207 web6578 learning6369 tool6091 folksonomy5307 semantic4526 social4500 web-2.04368 software4011 tagging3823 design3806 ontology3771 analysis3604 my-own3264 network3103 search3018 blog2910 education2868 clustering2607 conference2602 to-read2572 fca2519 TAG automatique

35 35 Connotea

36 36 Connotea

37 37 Groupes

38 38 2collab 38

39 39 2collab 39

40 40 Conclusion - Perspectives Premières analyses exploratoires –Analyse guidée par les groupes et les tags –Réseaux de groupe par tags partagés Profils des groupes –Une activité différenciée dans les groupes Des testeurs en nombre (groupes de 1 personne) Des petits groupes très actifs (2 personnes) Des groupes qui continuent de croître sans activité de tagging –Des longues traines de tags

41 41 Conclusion - Perspectives Les domaines représentés –Les groupes représentant les domaines Reste à évaluer –Le poids de lactivité des individus hors groupes –Le poids des références importées des autres serveurs (recoupements)


Télécharger ppt "Folksonomies scientifiques : une étude exploratoire comparative Dominique Besagni, Cecilia Fabry, Claire François, Clotilde Roussel INIST / CNRS Evelyne."

Présentations similaires


Annonces Google