Improving Wikipedia’s Accuracy: Is Edit Age a Solution? Brendan Luyt, Tay Chee Hsien Aaron, Lim Hai Thian and Cheng Kian Hong Wee Kim Wee School of Communication.

Slides:



Advertisements
Présentations similaires
E-learning Evolutif Albarelli Corinne Behem Patrice Guillot Jérôme
Advertisements

Proposition d’une méthodologie pour le traitement d’un exposé
Terminologie, propositions, repères Séminaire CPU / DES / ADBU Couperin Universités et communication scientifique : la problématique des Archives Ouvertes.
L’intégration des apprentissages en sciences de la nature
AJOL (African Journals Online). Editeur : Divers Nom du service : AJOL (African Journals Online) Sommaires et résumés à la disposition de tout utilisateur.
Atelier dAide aux Auteurs à Rédiger un Travail de Recherche Butare, Rwanda Février 2009.
A NETWORK-AWARE DISTRIBUTED STORAGE CACHE FOR DATA INTENSIVE ENVIRONMENTS Brian L. TIERNEY, Jason LEE, Brian CROWLEY, Mason HOLDING Computing Sciences.
Amélioration des Processus Observation de la Terre, Navigation et Science Stage de fin détudes Management de la Qualité et de la Performance Rose MORET.
Algorithmique.
Dalila CHIADMIIFISI TIC et le développement de la recherche scientifique Revue scientifique : le modèle du libre accès Dalila Chiadmi.
Understanding, building and using ontologies. Understanding Ontologie : la définition des concepts utilisés dans un langage donné Première approche (Gruber)
Navigation Interactive dans les documents Brigitte Grau et Jean-Paul Sansonnet J.P. Fournier, N. Hernandez, M. Hurault-Plantet, J-C. Martin, G. Pitel,
Les démarches de développement
Présentation du journal Scolaweb et de l’administration du site.
Le portail des sports des associations de la ville de Nice
ECRIRE pour apprendre à LIRE
Atelier Wikipédia Septembre Quest ce que Wikipédia ? Wikipédia est créé aux Etats-Unis en 2001 par Jimmy Wales. Le but de Wikipédia est de développer.
d’un article scientifique
Lecture critique MA.
Precision Analyse of Industrial Codes PAIC MCIP-C.
UE : 3.4. S4 Initiation à la démarche de recherche
SQP Suivi Qualité Process Déclaration de Production
Projet associatif Présentation dans les écoles. Qui sommes-nous ? Quels sont les objectifs de cette présentation ? Quelle est lutilité de notre site Internet.
A quoi lévaluation diagnostique (CE2 - 6 e ) peut-elle bien servir dans la formation des maîtres ?
2nd Pro Maintenance des Véhicules Automobiles
Test et débogage Tests unitaires. Gestion d’erreurs. Notion d’état, de pré-condition et de post-condition. Assertion. Traces de programme. Débogueur et.
Héritabilité et paramètres génétiques et phénotypiques du type de fibres, taille des capillaires du muscle fessier moyen chez les chevaux de race espagnol.
Chapitre XI Gestion des erreurs et exceptions. 2 La gestion des erreurs et exceptions De nombreux problèmes peuvent survenir pendant lexécution dun programme:
BIO1530 Lab2 Littérature scientifique. Objectifs de lexercice Après avoir complété cet exercice, vous devriez être en mesure de: Déterminer si une publication.
ENCYCLOPEDIES : Les nouvelles formes de transmission du savoir.
Introduction à la littérature scientifique
Alexandra Bujold Marie-Pier Moreau Alix Pampalon
CALCUL MENTAL Mélange de fractions Entraînement Collège F Mauriac.
Menu  CV CV  Analyse des publications Analyse des publications  Introduction Introduction  Revues Revues  Communications dans des conférences nationales.
Kampala, Uganda, June 2014 Documents d’Edition et de Révision Hiroshi Ota and Vijay Mauree ITU/TSB Forum de normalisation pour l'Afrique (Kampala,
Littérature scientifique
Analyses coût efficacité du dépistage des cancers
CoRRecT : Démarche coopérative pour l’évaluation de systèmes de reconnaissance de termes Chantal Enguehard IRIN – Université de Nantes 2 rue de la Houssinière.
Interface Homme-machine (interaction humain-machine)
( Série 1Série 2 Série 1 - Cliquer sur les figures du cadre en haut pour les sélectionner Cliquer sur les figures du cadre en haut pour les sélectionner.
CSI 4506: Introduction à l’Intelligence Artificielle
Le Calcul en Collège « Les étudiants d’aujourd’hui ne savent plus calculer » Jean Dieudonné, calcul infinitésimal, 1968.
CSI 4506: Introduction à l’Intelligence Artificielle
Modélisation N-morphes en classification des textes de Wikipedia
TIPE Les dames chinoises
13/04/2017 École de bibliothéconomie et des sciences de l'information
LE CDCF Ce document charnière entre l’analyse du besoin et la conception du produit va permettre de faire émerger les éléments fonctionnels nécessaires.
G ROUPE IRIUM ™ N°1 européen des PGI pour Distributeurs, Loueurs & Importateurs de Machines Les Bases de Connaissances Knowledge Base Maxime HILAIRE 07/05/2008.
Combating Web Spam with TrustRank. OSINI Aurélien.
( ) Collège de Maisonneuve
Resource-Limited Genetic Programming : Replacing Tree Depth Limit.
Les incertitudes de mesure dans les TPs de physique Une étude de cas
Le Traitement Automatique des Langues (TAL)
L'évaluation bibliométrique des départements des universités du G13
La soustraction des entiers relatifs
SKY.
Études de Marché Dess communication de masse
Cette animation présente la méthode à utiliser en SVT
Multiplier par 9 ou 11 Mathématiques – Calcul mental  Entraînement n° 3.
Centre d’échange d’informations sur la Convention sur la Diversité Biologique Bienvenue dans le cours sur l’ajout d’une Actualité sur un site web développé.
Mathieu Martin Thomas Rovayaz Natacha Laborde Nathanaël Couret
TP Météo Dans les TP suivants, les solutions sont données en fin d’exercice. Pascal Landure.
E ncyclopédies en ligne Schneider Camille – Leang Vathana.
Du Cahier des Charges à la Spécification Formelle ?
L3 Instrumentation Pétrolière S6
Multiplier ou diviser un entier par 10, 100, Mathématiques – Calcul mental  Entraînement n° 1.
RÉFÉRENCES SCIENTIFIQUES
Ondes mécaniques d-Mesure de la période, longueur d'onde et calcul de la vitesse du son dans l'air.
Thématiques calculs Etude du comportement thermomécanique de structures mixtes acier-béton A. Sauvageon, R. Bennacer, C. De-Sa Collaboration EDF SEPTEN,
Communiquer des idées Article Fiche 3e Préparer votre article Conseils
Transcription de la présentation:

Improving Wikipedia’s Accuracy: Is Edit Age a Solution? Brendan Luyt, Tay Chee Hsien Aaron, Lim Hai Thian and Cheng Kian Hong Wee Kim Wee School of Communication & Information, Nanyang Technological University, Singapore

Wikipedia: Succès ou Échec?  Encyclopédie “online”  Nupedia  Wikipedia  Taille de Wikipedia 2,644,525 articles en anglais 733,955 articles en français  Différences Tout le monde peut éditer/rédiger un article  Problèmes Vandalisme Publicité Attaque personnelle

L’exactitude de Wikipedia  Etude par la revue ’Nature’ 42 articles de Wikipedia et Britannica dans le domaine science et math Résultat  Erreurs ou omissions (162/123)  Majeur ou important (4/4)  Etude publié dans une magazine informatique allemande 66 articles de Wikipedia version allemande, Encarta de Microsoft et Brockhaus (une encyclopédie allemande) Résultat  Excellent ou 5 points(24/17/12)

Comment mesurer l’exactitude?  2 approches Basé sur la validation de l’article par les ‘utilisateurs de confiances’(l’article est évalué par les experts). Evaluer automatiquement la qualité de l’article en calculant les métriques basé sur les métadonnées

Evaluation automatique  Plusieurs méthodes Lih propose de calculer les métriques suivantes  “Rigor” (le nombre total de modification pour un article jusqu’à présent)  “Diversity” (le nombre total d’éditeur pour un article ) McGuinness utilise le ratio de liens  Le nombre de lien entrant pour chaque article comme l’algorithme ‘Pagerank’ Anthony, Smith, et Williamson utilise une stratégie contraire de McGuinness  Évaluer un éditeur, ensuite ses articles.

Approche de Cross Codage de couleur pour les fragments de phrase  Dans un article il y a des paragraphes ou segments qui sont plus confident que les autres  Cross propose de les coder avec différentes couleurs selon combien de temps ils sont survécues dans le sens le nombre d’édition (modification) sans être effacé.  Hypothèse de Cross L’exactitude d’un paragraphe est liée à son âge de survie. Correct?

Modifications entraînant les erreurs  Le temps de survie en termes de nombre de édition/modification (nombre de modifications qu'ils ont survécu sans être enlevé)  Le temps de survie en termes de temps (nombre de jour qu'ils ont survécu sans être enlevé)

Méthode  Déterminer la version  Rechercher dans les versions passée de l'article pour la première fois cette erreur apparaît

Interface de wikiblame

Versions précédentes de l’article

Résultat  Analyse de l’erreur en position ordinale  Analyse de l’erreur en longueur de temps

Analyse de l’erreur en position ordinale

Analyse de l’erreur en longueur de temps

Conclusion  Le mécanisme pour classifier les paragraphes selon l'âge n’est pas capable d’évaluer le Wikipedia  Pas de rapport entre l’exactitude et l’âge d’édition