Folksonomies scientifiques : une étude exploratoire comparative

Slides:



Advertisements
Présentations similaires
Mais vous comprenez qu’il s’agit d’une « tromperie ».
Advertisements

Le Nom L’adjectif Le verbe Objectif: Orthogram
ORTHOGRAM PM 3 ou 4 Ecrire: « a » ou « à » Référentiel page 6
LES NOMBRES PREMIERS ET COMPOSÉS
[number 1-100].
1. Résumé 2 Présentation du créateur 3 Présentation du projet 4.
Licence pro MPCQ : Cours
Distance inter-locuteur
1 Plus loin dans lutilisation de Windows Vista ©Yves Roger Cornil - 2 août
11 Bienvenue Entrez le nom du groupe ou projet ici mardi, 17 novembre 2009.
Réseau ATB du CClin Paris-Nord – résultats 2011 LL, 22/11/ Réseau antibiotiques du CClin Paris-Nord : Résultats 2011 Coordination: Dr François LHÉRITEAU.
Les numéros 70 –
Les numéros
Sud Ouest Est Nord Individuel 36 joueurs
Les identités remarquables
Le, la, les words Possessive Adjectives MINE!!. 2 My in french is mon, ma,mes... Le word/ begins with a vowel: Mon La word: Ma Les word: Mes.
Cours MIAGE « Architectures Orientées Services » Henry Boccon-Gibod 1 Architectures Orientées Services Composants de Service Exemple pratique de développement.
Sirop de Liège « industriel »
LES TRIANGLES 1. Définitions 2. Constructions 3. Propriétés.
Données statistiques sur le droit doption au 31/01 8 février 2012.
2 1. Vos droits en tant quusagers 3 1. Vos droits en tant quusagers (suite) 4.
1 7 Langues niveaux débutant à avancé. 2 Allemand.
Mr: Lamloum Med LES NOMBRES PREMIERS ET COMPOSÉS Mr: Lamloum Med.
SERABEC Simulation sauvetage aérien avec un Hercule C130. Départ de St-Honoré le 4 octobre Durée de vol 3 heures. Premier vol en Hercule pour les.
1 5 octobre 2011 / paw Présentation du 7 octobre 2011.
La méthodologie………………………………………………………….. p3 Les résultats
Jack Jedwab Association détudes canadiennes Le 27 septembre 2008 Sondage post-Olympique.
Le soccer & les turbans Sondage mené par lAssociation détudes canadiennes 14 juin 2013.
Présentation générale
1 Guide de lenseignant-concepteur Vincent Riff 27 mai 2003.
GRAM 1 CE2 Je sais transformer une phrase affirmative en phrase négative.
Le drapeau canadien comme symbole de fierté nationale : une question de valeurs partagées Jack Jedwab Association détudes canadiennes 28 novembre 2012.
PM18 MONTAGE DU BLINDAGE AUTOUR DE LA QRL F. DELSAUX - 25 JAN 2005
Session 7 1 IST/VIH/SIDA.
Le Concours de Conaissance Francais I novembre 2012.
Si le Diaporama ne s'ouvre pas en plein écran Faites F5 sur votre clavier.
Titre : Implémentation des éléments finis sous Matlab
Conseil Administration AFRAC – 2 décembre Toulouse 1 Fermes de références Palmipèdes à foie gras Synthèse régionale – Midi Pyrénées Exercice
Projet poker 1/56. Introduction Présentation de léquipe Cadre du projet Enjeux Choix du sujet 2.
LES NOMBRES PREMIERS ET COMPOSÉS
CLL11 : chlorambucil (CLB) versus CLB + rituximab (R)
S ervice A cadémique de l I nspection de l A pprentissage dOrléans-Tours Nombre de CFA par académie 1 CFA académique avec 25 UFA 1 CFA académique avec.
Logiciel gratuit à télécharger à cette adresse :
Les chiffres & les nombres
LES REPERES SPATIAUX Cliquez sur le globe pour lancer le test
RACINES CARREES Définition Développer avec la distributivité Produit 1
DUMP GAUCHE INTERFERENCES AVEC BOITIERS IFS D.G. – Le – 1/56.
Tournoi de Flyball Bouin-Plumoison 2008 Tournoi de Flyball
Année universitaire Réalisé par: Dr. Aymen Ayari Cours Réseaux étendus LATRI 3 1.
Titre : Implémentation des éléments finis en Matlab
MAGIE Réalisé par Mons. RITTER J-P Le 24 octobre 2004.
1 INETOP
Influenza: le modèle épidémiologique belge 29 Mai 2009
Les Nombres 0 – 100 en français.
Aire d’une figure par encadrement
Copyright 2011 – Les Chiffres Copyright 2011 –
P.A. MARQUES S.A.S Z.I. de la Moussière F DROUE Tél.: + 33 (0) Fax + 33 (0)
LA GESTION COLLABORATIVE DE PROJETS Grâce aux outils du Web /03/2011 Académie de Créteil - Nadine DUDRAGNE 1.
Les fondements constitutionnels
MAGIE Réalisé par Mons. RITTER J-P Le 24 octobre 2004.
Traitement de différentes préoccupations Le 28 octobre et 4 novembre 2010.
1/65 微距摄影 美丽的微距摄影 Encore une belle leçon de Macrophotographies venant du Soleil Levant Louis.
Nom:____________ Prénom: ___________
Exercice de vérification 1 p
Commission paritaire de suivi des opérations de reclassement repositionnement dans le cadre du droit d’option Statistiques novembre 2010.
Les Chiffres Prêts?
La formation des maîtres et la manifestation de la compétence professionnelle à intégrer les technologies de l'information et des communications (TIC)
3. La structure du marché par couleur
Transcription de la présentation:

Folksonomies scientifiques : une étude exploratoire comparative Dominique Besagni, Cecilia Fabry, Claire François, Clotilde Roussel INIST / CNRS Evelyne Broudoux UVSQ, DICEN

Objectifs généraux de l’étude De quoi se composent les folksonomies scientifiques ? Une question : que révèlent les usages ? Activité réelle des usagers dans et hors les groupes ? Représentativité des domaines scientifiques ? Méthodologie Une entrée par les groupes Une entrée par les tags 2

Objectifs spécifiques de l’étude Quels groupes utilisent quels tags pour quels articles ? Informations sur les groupes Membres Tags utilisés Articles et/ou références répertoriés dans les bibliothèques des groupes Dates (utilisateur et/ou article) Analyses Dynamique des groupes Taille, âge des groupes, dernière arrivée d’un membre Activité des groupes Taille des bibliothèques, dernier article ajouté, Tags associés aux articles Analyse de contenu Réseau de partage des tags par les groupes 3

Protocole opératoire Récupération des données à partir de pages HTML : Scripts Perl Module WWW::Mechanize qui peut : décharger les pages HTML, suivre les liens, remplir les formulaires, cliquer sur les boutons, gérer les cookies, mais ne peut pas interpréter JavaScript (exemple 2Collab) ! (existe pour la plupart des langages : java, python, ruby, php ...) Module WWW::RobotRules : respect des consignes du serveur 4

Protocole opératoire Récupération des données à partir d’une API : Sur certains sites comme Bibsonomy Scripts Perl Module WWW requête simple, syntaxe dépendante du site, résultat sous forme de fichiers XML, Module XML::TokeParser 5

CiteULike Expliquer que les chiffres ne sont pas à jour… H2PTM 6

Recherche des groupes URL : http://www.citeulike.org/groups/browse 7

Recherche sur un groupe (1) URL : http://www.citeulike.org/group/22 8

Recherche sur un groupe (2) URL : http://www.citeulike.org/group/22 9

Recherche sur un groupe (3) URL : http://www.citeulike.org/groupfunc/22/members 10

Recherche sur un groupe (4) URL : http://www.citeulike.org/group/22/article/1073937 11

Résultats Effectifs et dynamique des groupes Activité des groupes Tags utilisés par l’ensemble des groupes Réseau d’un sous-ensemble : 17 groupes partageant le tag « deforestation » 12

CiteUlike : Effectifs des 2871 groupes Max 99 membres 1434 groupes d’un seul membre 13

Dynamique des groupes Année de création dernier membre ajouté 2009 2004 2005 2006 2007 2008 21% 9% 15% 17% 37% 2009 2008 2007 2006 2005 6% 38% 11% 14% 31% dernier membre ajouté 14

Le groupe contenant le + d’inscrits Bioinformatics Groupe libre 99 membres Crée le 10/10/2007 Dernier membre ajouté le 06/08/2009 3 769 articles Dernier article ajouté le 18/09/2009 Description : Analysis and modelling of molecular biology data 15

236 groupes avec un seul article Activité des groupes Max 27 741 articles 236 groupes avec un seul article 524 groupes sans articles 16

Activité des groupes dernier membre ajouté dernier article ajouté 2005 2009 2008 2007 2006 2005 6% 11% 14% 31% 38% 2009 2008 2007 2006 2005 33% 18% 3% 7% 15% 23% dernier article ajouté 17

Le groupe contenant le + d’articles Le plus gros groupe n’est géré que par 2 utilisateurs. Il est actif depuis plus d’un an et est mis à jour très régulièrement C. elegans /WormBase Groupe libre 2 membres Crée le 02/08/2008 Dernier membre ajouté le 17/09/2008 27 741 articles Dernier article ajouté le 14/09/2009 Description : Articles of note for the nematode research community in general and the C. elegans community in particular. 18

Plus de 350 groupes d’un seul membre ne contenant pas d’article Les groupes de 1 membre Plus de 350 groupes d’un seul membre ne contenant pas d’article TESTS ???? Nb groupes Nb articles 19

Les groupes sans article Un groupe de 14 membres sans articles Nb groupes Nb membres 20

Les groupes avec 1 seul article 150 groupes constitués d’un seul membre ont un seul article TESTS ???? Nb groupes Nb membres 21

Tags de l’ensemble des groupes 26 668 tags de fréquence 1 43 820 tags dans un seul groupe Nb. tags Nb. occurrences 26 668 1 10 654 2 5 149 3 4 002 4 2 295 5 2 022 6 1 281 7 2 186 8 941 9 929 10 … 27 743 27 756 27 759 27 803 47 178 22

Les tags les plus fréquents FREQUENCE NB GROUPE bibtex-import 47178 240 c_elegans 27803 16 nematode 27759 17 elegans 27756 11 c-elegans 27743 7 caenorhabditis_elegans 27735 1 wormbase meeting_abstract 13694 article 7909 28 mdb 6717 2 review 5514 363 ewd-bib 5048 4 model 3952 316 learning 3562 292 Le vocabulaire du plus gros groupe en terme d’article (27741) se retrouve dans ce classement (C. elegans /WormBase ) 23

Répartition des tags par groupe Nb. tags Nb. groupes 43820 1 9780 2 3562 3 2330 4 1459 5 943 6 612 7 1661 8 591 9 466 10 … 289 292 316 346 363 24

Les tags partagés par les groupes FREQUENCE NB GROUPE review 5514 363 network 3236 346 model 3952 316 learning 3562 292 design 2617 289 theory 2295 278 social 2009 275 system 1552 261 information 1241 242 bibtex-import 47178 240 analysis 1473 231 web 1057 221 software 1733 220 25

Le réseau « deforestation » 26

Le réseau « deforestation » 27

Une bibliothèque pour 3 groupes Tags : bibtex-import Species Habitat Spatial Control Management Biodiversity Conservation Population Diversity Biological Litchi Mode Plant 45 landscape Botany taxonomy, evolution, physiology, ecology, genetics 11 utilisateurs, 1862 articles, Créé en 2007, dernier utilisateur en 08/2009 dernier article en 06/2007 2938 tags EarthEnvironmentalSciences Major researches on various environmental, ecological, socio-economic, geographical, biodiversity issues. From earth climate change to minute soil pores studies. From microbiotic crusts to Amazon forest study. From polar ice caps to Sahara desert. 12 utilisateurs, 1862 articles, Créé en 2008, dernier utilisateur en 08/2009 dernier article en 06/2007 2938 tags Entomology taxonomy, ecology, conservation, evolution, physiology, genetics 10 utilisateurs, 1862 articles, Créé en 2007, dernier utilisateur en 09/2009 dernier article en 06/2007 2938 tags 28

Bibsonomy 29

Recherche des groupes Nombre de groupes ? 30

Recherche sur un groupe (1) BIBLIOTHEK 2.0 Séparation url (bookmarks) et publications (notices)

Max 47 membres pour le plus grand groupe Effectifs des 169 groupes 85 groupes de zéro membre ???????? Particularités de ce logiciel le 1er membre donne son nom au groupe et n’est pas compté Max 47 membres pour le plus grand groupe

Dynamique des groupes Année de création dernier article ajouté 50% des groupes sont mis à jour depuis janvier 2010

Les tags les plus fréquents # Intitulé Nb. d'occurrences imported 18207 web 6578 learning 6369 tool 6091 folksonomy 5307 semantic 4526 social 4500 web-2.0 4368 software 4011 tagging 3823 design 3806 ontology 3771 analysis 3604 my-own 3264 network 3103 search 3018 blog 2910 education 2868 clustering 2607 conference 2602 to-read 2572 fca 2519 TAG automatique Les tags les plus fréquents

Connotea

Connotea 36

Groupes 37

2collab 38

2collab 39 39

Conclusion - Perspectives Premières analyses exploratoires Analyse guidée par les groupes et les tags Réseaux de groupe par tags partagés Profils des groupes Une activité différenciée dans les groupes Des testeurs en nombre (groupes de 1 personne) Des petits groupes très actifs (2 personnes) Des groupes qui continuent de croître sans activité de tagging Des longues traines de tags 40

Conclusion - Perspectives Les domaines représentés Les groupes représentant les domaines Reste à évaluer Le poids de l’activité des individus hors groupes Le poids des références importées des autres serveurs (recoupements) 41