La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Fédération et amélioration des activités documentaires par la pratique dannotation collective Guillaume Cabanac Équipe IRIT/SIG – Systèmes dInformations.

Présentations similaires


Présentation au sujet: "Fédération et amélioration des activités documentaires par la pratique dannotation collective Guillaume Cabanac Équipe IRIT/SIG – Systèmes dInformations."— Transcription de la présentation:

1 Fédération et amélioration des activités documentaires par la pratique dannotation collective Guillaume Cabanac Équipe IRIT/SIG – Systèmes dInformations Généralisés Composante DDSS – Documents et Données Semi-Structurées et usages Thèse de doctorat 5 décembre 2008 DirectionPr Claude Chrisment EncadrementDr Max Chevalier et Dr Christine Julien

2 2 Plan 1.Contexte et problématiques des activités documentaires (AD) 2.Lannotation collective pour fédérer et améliorer les AD Niveau microscopique Niveau macroscopique 3.Expérimentations Mesure de similarité sur lusage des documents Validation sociale des annotations 4.Mise en œuvre de lapproche proposée Prototype « preuve de concept » TafAnnote 5.Conclusion et Perspectives Fédération et amélioration des activités documentaires G. Cabanac

3 3 Plan 1.Contexte et problématiques des activités documentaires (AD) 2.Lannotation collective pour fédérer et améliorer les AD Niveau microscopique Niveau macroscopique 3.Expérimentations Mesure de similarité sur lusage des documents Validation sociale des annotations 4.Mise en œuvre de lapproche proposée Prototype « preuve de concept » TafAnnote 5.Conclusion et Perspectives Fédération et amélioration des activités documentaires G. Cabanac

4 4 Fédération et amélioration des activités documentaires par la pratique dannotation collective Gestion Documentaire (Document Management System) Gestion Documentaire (Document Management System) Gestion Personnelle dInformations (Personal Information Management – PIM) Gestion Personnelle dInformations (Personal Information Management – PIM) Logiciels collectifs (Social Software) Logiciels collectifs (Social Software) 1. Contexte et problématiques des activités documentaires G. Cabanac lorganisation

5 5 Les organisations modernes Entreprises, laboratoires de R&D, communautés… Les travailleurs du savoir knowledge workers 31 % des employés aux USA en 1995 XXI e siècle : croissance soutenue « Nous sommes tous des travailleurs du savoir » [Ballay, 2002] Transposition Papier électronique Relations individus – documents dans lorganisation [Harper & Sellen, 2004] 1. Contexte et problématiques des activités documentaires G. Cabanac

6 6 Le cycle de vie du document [Sellen & Harper, 2003] 6 activités documentaires Satisfaction dun besoin en information en utilisant les sources adéquates Informations trouvées un document Relecture, corrections, mise en page finale et validations Envoi du document finalisé Lecture, compréhension et réflexion Stockage organisé dans un espace documentaire éventuellement partagé 1. Contexte et problématiques des activités documentaires G. Cabanac

7 7 Limites du cycle de vie du document potentiel collectif Faible exploitation du potentiel collectif de lorganisation Documents inaccessibles pour le groupe recherches redondantes Requêtes sur le Web : 50 % déchec [Feldman, 2004] Limites de 1 nouveau rapport = 90% de recréation dinformation [Feldman, 2004] Partage (ex : dossier réseau, intranet) Diffusion manuelle Diffusion automatique Limites motivationnelles Surcharge cognitive Lecture active : annotation requise Interprétation et débats collectifs « Maintenance » difficile Efforts de classement inexploités 1. Contexte et problématiques des activités documentaires G. Cabanac

8 8 Mise en œuvre sur support électronique 1. Contexte et problématiques des activités documentaires G. Cabanac

9 9 Limites du cycle de vie du document Multiplication des systèmes Surcharge cognitive des usagers Cloisonnement des activités Vision parcellaire des usagers Échange limité entre applications Pertinence de laide apportée ? Approche « individualiste » Zéro rentabilisation des activités des autres membres organisationnels 1. Contexte et problématiques des activités documentaires G. Cabanac

10 10 Plan 1.Contexte et problématiques des activités documentaires (AD) 2.Lannotation collective pour fédérer et améliorer les AD Niveau microscopique Niveau macroscopique 3.Expérimentations Mesure de similarité sur lusage des documents Validation sociale des annotations 4.Mise en œuvre de lapproche proposée Prototype « preuve de concept » TafAnnote 5.Conclusion et Perspectives Fédération et amélioration des activités documentaires G. Cabanac

11 11 Fédération autour dun seul système : motivations Rappel des 5 problématiques P1fragmentation des données P2surcharge cognitive (utilisation) P3représentation partielle des utilisateurs P4activités linéaires et cloisonnées P5aide sous-optimale Identification des liens de causalité P4 P1 P3 P5 P4 P2 Problématique principale : P4 fédérer les activités dans 1 seul système 2. Lannotation pour fédérer et améliorer les activités documentaires G. Cabanac trop de systèmes systèmes cloisonnés

12 12 Fédérer les activités documentaires Un système fédérateur pour Plusieurs usagers communauté Réaliser les 6 activités documentaires sans cloisonnement Intégrer des processus « sociaux » À bénéfice réciproqueprincipe du donnant-donnant entre les usagers Inter-activitésune activité améliore les autres Exemples Documents classés recommandés à lusager pendant sa navigation Information introduite par un individu distribuée aux autres membres Concept fédérateur la pratique dannotation de document électronique Légende : rôle initial de lannotation 2. Lannotation pour fédérer et améliorer les activités documentaires G. Cabanac

13 13 Fédérer les activités documentaires : lannotation De lannotation papier… Activité usuelle séculaire et interdisciplinaire Polymorphe : commentaire, marques… Usages diversifiés personnel : lecture active, appropriation collectif : travail collaboratif, partage … À lannotation électronique Commentaires « en contexte » Contenu multimédia riche Diffusable sur le réseau Suscite des fils de discussion = débats en contexte 2. Lannotation pour fédérer et améliorer les activités documentaires G. Cabanac

14 14 Concept dannotation collective Étude de 64 systèmes sur la période 1989 – 2008 Annotation collective Données objectives Créateur, date de création Point dancrage dans le document, granularité variable : intégralité, mots… Informations subjectives Commentaire, marques diverses : astérisques, soulignements… Type dannotation : confirmation/réfutation, question… Visibilité : publique, privée, groupes… Catégories « orientées objectif » Annotation remarque Annotation stockage Annotation argumentative 2. Lannotation pour fédérer et améliorer les activités documentaires G. Cabanac EPA : Espace Personnel dAnnotations

15 15 Plan 1.Contexte et problématiques des activités documentaires (AD) 2.Lannotation collective pour fédérer et améliorer les AD Niveau microscopique Niveau macroscopique 3.Expérimentations Mesure de similarité sur lusage des documents Validation sociale des annotations 4.Mise en œuvre de lapproche proposée Prototype « preuve de concept » TafAnnote 5.Conclusion et Perspectives Fédération et amélioration des activités documentaires G. Cabanac

16 16 Améliorer les activités documentaires Exploiter les compétences du groupe (donnant-donnant) Des processus intégrés couvrant les activités documentaires 2. Lannotation pour fédérer et améliorer les activités documentaires G. Cabanac

17 17 Améliorer les activités documentaires 2. Lannotation pour fédérer et améliorer les activités documentaires G. Cabanac

18 18 P 1 – Exploiter les compétences de recherche R ECO : recommandation asynchrone principeinsertion les répertoires les plus spécifiques des EPA R ECO v1v1 v2v2 v3v3 v4v4 lorganisation 2. Lannotation pour fédérer et améliorer les activités documentaires G. Cabanac

19 19 Améliorer les activités documentaires 2. Lannotation pour fédérer et améliorer les activités documentaires G. Cabanac

20 20 P 2 – Exploiter les compétences de classement (1/2) N AVI : recommandation pendant la navigation regroupementeffort cognitif de classement principe regroupement dans les EPA effort cognitif de classement similarité dusage consulte N AVI D 2. Lannotation pour fédérer et améliorer les activités documentaires G. Cabanac

21 21 Similarité dusage inter-répertoires inter-documents inter-usagers P 2 – Exploiter les compétences de classement (2/2) 2. Lannotation pour fédérer et améliorer les activités documentaires G. Cabanac

22 22 Améliorer les activités documentaires 2. Lannotation pour fédérer et améliorer les activités documentaires G. Cabanac

23 23 Passage à léchelle : massivement annoté Problème : quelles annotations consulter ? Validité sociale = degré de consensus du groupe Validation Sociale P 3 – Validation sociale des débats argumentatifs (1/3) 2. Lannotation pour fédérer et améliorer les activités documentaires G. Cabanac

24 24 Principe général Algorithmes proposés et évalués Agrégation récursive de score [Cabanac et al., 2005] Système dargumentation bipolaire (travaux IA) [Cayrol & Lagasquie-Schiex, 2005] Système dargumentation bipolaire étendu [Cabanac et al., 2006] Validité sociale 0 socialement neutre – 1 socialement réfuté 1 socialement confirmé cas 1cas 2cas 3cas 4 A B A B P 3 – Validation sociale des débats argumentatifs (2/3) 2. Lannotation pour fédérer et améliorer les activités documentaires G. Cabanac

25 25 P 3 – Validation sociale des débats argumentatifs (3/3) 2. Lannotation pour fédérer et améliorer les activités documentaires G. Cabanac Avant Toutes dans le même panier Après Filtrage possible Processus A DAPT A FFICHAGE

26 26 Plan 1.Contexte et problématiques des activités documentaires (AD) 2.Lannotation collective pour fédérer et améliorer les AD Niveau microscopique Niveau macroscopique 3.Expérimentations Mesure de similarité sur lusage des documents Validation sociale des annotations 4.Mise en œuvre de lapproche proposée Prototype « preuve de concept » TafAnnote 5.Conclusion et Perspectives Fédération et amélioration des activités documentaires G. Cabanac

27 27 Espaces Personnels dAnnotations (EPA) Informations filtrées, validées et structurées… … pertinentes pour les activités dans lorganisation Paradoxe : capital riche, mais sous-exploité Cause 1 – caractère personnel des espaces doc. Cause 2 – partage manuel Cause 3 – partage automatique Conséquences Faute de mieux, utilisation de sources externes Retour sur investissement faible pourquoi aller chercher ailleurs… Capital documentaire organisationnel en sommeil 2. Lannotation pour fédérer et améliorer les activités documentaires G. Cabanac

28 28 Cartographie de lorganisation basée sur les documents SOM [Kohonen, 2001] Umap [Triviumsoft] TreeMap [Fekete & Plaisant, 2001] … Intégration de 2 niveaux : macro- et microscopique [Boyer et al., 2007] Limites des approches existantes contenu Documents ayant le même contenu que D utilisent Documents que les collègues utilisent avec D regrouper des documentsassociations didées notion dusage : regrouper des documents associations didées Valoriser des documents : travaux connexes 2. Lannotation pour fédérer et améliorer les activités documentaires G. Cabanac

29 29 Objectif : explorer une vue globale … des personnes et de leurs documents thématique et usages Contrainte : non-intrusivité et confidentialité opérationnels Besoins opérationnels Trouver des documents Connexes Complémentaires Trouver des personnes trouver des documents stratégiques Besoins stratégiques (pilotage + RH) Visualiser lactivité globale et individuelle Poste de travail documents utilisés Interface daccès au capital documentaire lorganisation 2. Lannotation pour fédérer et améliorer les activités documentaires G. Cabanac

30 30 4 vues = {documents, personnes} {groupe, unité} 1.Groupe de documents Thèmes principaux Groupes dusage 2.Un seul document Qui contacter ? Quoi lire ? 3.Groupe de personnes Communautés dintérêt Communautés dusage 4.Une seule personne Centres dintérêts Interlocuteurs privilégiés statique Interface proposée : aspect statique 2. Lannotation pour fédérer et améliorer les activités documentaires G. Cabanac

31 31 2 types de sélection Unique / Multiple intra-vue Interaction intra-vue inter-vues Interaction inter-vues dynamique Interface proposée : aspect dynamique 2. Lannotation pour fédérer et améliorer les activités documentaires G. Cabanac

32 32 Plan 1.Contexte et problématiques des activités documentaires (AD) 2.Lannotation collective pour fédérer et améliorer les AD Niveau microscopique Niveau macroscopique 3.Expérimentations Mesure de similarité sur lusage des documents Validation sociale des annotations 4.Mise en œuvre de lapproche proposée Prototype « preuve de concept » TafAnnote 5.Conclusion et Perspectives Fédération et amélioration des activités documentaires G. Cabanac

33 33 Sim. Thématique vs Sim. Usage Similarité de thématique Similarité dusage Ces deux similarités semblent être différentes (complémentarité ?) 3. Expérimentations – Mesure de similarité dusage G. Cabanac

34 34 Corpus dexpérimentation Protocole expérimental Calcul des valeurs : sim(d i, d j>i ) simContenu Indexation simUsage Multiarbres Comparaisons Différencetests de significativité (t-test de Student, Wilcoxon…) Ressemblancecoefficient de corrélation (r) Mesures de similarité : contenu versus usage (1/2) 3. Expérimentations – Mesure de similarité dusage G. Cabanac Sous-hiérarchie de MeSH maladies cardiovasculaires 146 répertoires documents issus de TREC/OHSUMED

35 35 SimContenu SimUsage SimContenu versus SimUsage Significativité (Wilcoxon) p= 0,000 Corrélation (Pearson) r= 0,154 Mesures de similarité : contenu versus usage (2/2) 3. Expérimentations – Mesure de similarité dusage G. Cabanac SimContenu SimUsage SimContenu SimUsage

36 36 Plan 1.Contexte et problématiques des activités documentaires (AD) 2.Lannotation collective pour fédérer et améliorer les AD Niveau microscopique Niveau macroscopique 3.Expérimentations Mesure de similarité sur lusage des documents Validation sociale des annotations 4.Mise en œuvre de lapproche proposée Prototype « preuve de concept » TafAnnote 5.Conclusion et Perspectives Fédération et amélioration des activités documentaires G. Cabanac

37 37 Principe général Consensus |Validation sociale| 1 Expérimentation de la validation sociale (1/5) Cest clair que la mort de la mère de Baudelaire… Je ne pense pas : dans son poème « Une martyre »… poésie Dans sa correspondance avec Jeanne Duval, il… Ce poème a été écrit 5 ans avant que sa mère ne… Validation sociale Algorithme de validation sociale 0 pas de consensus sur le passage annoté – 1 passage annoté réfuté 1 passage annoté confirmé 3. Expérimentations – Validation sociale G. Cabanac

38 38 3 algorithmes à comparer VS 1 Agrégation récursive de score [Cabanac et al., 2005] VS 2 Système dargumentation bipolaire (SABP) [Cayrol & Lagasquie-Schiex, 2005] VS 3 Extension du SABP [Cabanac et al., 2006] Protocole expérimental ButAlgos validation sociale Perception humaine du consensus Pb 1 Manque de collections annotées [Agosti & Ferro, 2005; Frommholz & Fuhr, 2006] Sol 1 Web 13 fils de discussion = 222 annotations + réponses Pb 2 Besoin de « cobayes » aux profils variés nos étudiants Sol 2 Expérimentation « écologique » sur le Web « Appel à bonnes volontés » via listes de diffusion Expérimentation de la validation sociale (2/5) ? 3. Expérimentations – Validation sociale G. Cabanac

39 39 Nombre de participants Durée moy. = 1h Tx dabandon = 56 % Tâches dun participant Identifier les opinions Synthétiser les opinions Expérimentation de la validation sociale (3/5) Expérimentations – Validation sociale G. Cabanac

40 40 Vérification de la cohérence des 121 participations 4 règles 7 participations irrationnelles (incohérences > 20 %) VS versus PH Indicateurs statistiques Différence significative (Wilcoxon signed-rank test : p(vs i – ph) < = 0.05) Corrélation moyenne (coefficient Pearson r 0,5) Expérimentation de la validation sociale (4/5) 3. Expérimentations – Validation sociale G. Cabanac idéal : aucune différence

41 41 VS versus PH Indicateurs centrés-individus Expérimentation de la validation sociale (5/5) 3. Expérimentations – Validation sociale G. Cabanacstricttolérant Distance 1 graduation 2 graduations Polarité même signemême signe ou 0 Force frontière à perception humaine validation sociale 3 indicateurs 47 %77 % 65 %84 % 55 %73 %

42 42 Plan 1.Contexte et problématiques des activités documentaires (AD) 2.Lannotation collective pour fédérer et améliorer les AD Niveau microscopique Niveau macroscopique 3.Expérimentations Mesure de similarité sur lusage des documents Validation sociale des annotations 4.Mise en œuvre de lapproche proposée Prototype « preuve de concept » TafAnnote 5.Conclusion et Perspectives Fédération et amélioration des activités documentaires G. Cabanac

43 43 Faisabilité de nos propositions Intégration dans le navigateur Mozilla Firefox 4. Développement : le prototype TafAnnote G. Cabanac clientserveur

44 44 TafAnnote en quelques captures décran 4. Développement : le prototype TafAnnote G. Cabanac

45 45 Exploration du capital documentaire organisationnel 4. Développement : le prototype TafAnnote G. Cabanac

46 46 Plan 1.Contexte et problématiques des activités documentaires (AD) 2.Lannotation collective pour fédérer et améliorer les AD Niveau microscopique Niveau macroscopique 3.Expérimentations Mesure de similarité sur lusage des documents Validation sociale des annotations 4.Mise en œuvre de lapproche proposée Prototype « preuve de concept » TafAnnote 5.Conclusion et Perspectives Fédération et amélioration des activités documentaires G. Cabanac

47 47 Activités du cycle de vie du document multiplicité des systèmes + cloisonnement Fédération autour de lannotation collective pour améliorer les AD Objectif Objectif améliorer la relation Modélisation Modélisation multiutilisateurs, EPA, processus Enrichissement mutuel Donnant-donnant Limites de la fédération des AD Équilibre entre gains en productivité et contraintes ? Conclusion (1/2) Fédération et amélioration des activités documentaires G. Cabanac

48 48 Similarité dusage Valorise la structuration des documents Contenu Usage Validation sociale dannotation collective 121 participants 80 % de concordance (ph, vs) Exploration du capital organisationnel Vue globale des documents et personnes Conclusion (2/2) Fédération et amélioration des activités documentaires G. Cabanac

49 49 Champs dapplication Documents patrimoniaux, médicaux, techniques… À court et moyen termes Évaluation globale Techniques dancrage (BDM) RI, fouille dopinions (Web 2.0) Rédaction collective À plus long terme Relations individus – documents dans lorganisation Interopérabilité des profils Relâcher lhypothèse sur la préexistence de groupes Perspectives de recherche lorganisation Fédération et amélioration des activités documentaires G. Cabanac

50 Merci


Télécharger ppt "Fédération et amélioration des activités documentaires par la pratique dannotation collective Guillaume Cabanac Équipe IRIT/SIG – Systèmes dInformations."

Présentations similaires


Annonces Google