L’Ontologie Est Surfaite Une analyse de l’article écrit par Clay Shirkey (titre original: “Ontology is Overrated”,2005)
Plan Introduction Définitions Classification, Ontologie Folksonomie, taxonomie populaire Conclusion Bibliographie Questions
Introduction Basé sur deux conférences: “Ontology is Overrated” “Folksonomies &Tags: The rise of user-developed classification” Catégorisation/classification: rupture entre le monde réel et le virtuel.
Définition: Ontologie Etude de l’être en tant qu’être, de l’être en soi. (Larousse 2000) Philosophie: existence et relations entre les choses qui existent. Gestion d’information: spécification explicite.
Définition: Catégorisation & Classification Organisation d’entités dans des groupes. Nuances, mais globalement synonymes. “Classification ontologique” = prévoir l’emplacement de n’importe quelle nouvelle entrée
Définition: Taxinomie Alternative: Taxonomie. Science des lois de la classification.
Classification Classification parfaite? Impossible! Idéal ontologique (perfection théorique comme point de comparaison) = erreur. Erreurs de contexte: tableau périodique.
Classification: catalogues Dewey Decimal System: 200: Religion 210: Natural theology 220: Bible 230: Christian theology 240: Christian moral & devotional theology 250: Christian orders & local church 260: Christian social theology 270: Christian church history 280: Christian sects & denominations 290: Other religions
Classification: catalogues Library of Congress, D:History(general) DA: Great Britain DB: Austria DC: France DD: Germany DE: Mediterranean DF: Greece DG: Italy DH: Low Countries DJ: Netherlands DK: Former Soviet Union DL: Scandinavia DP: Iberian Peninsula DQ: Switzerland DR: Balkan Peninsula DS: Asia DT: Africa DU: Oceania DX: Gypsies
Classification: optimisation? Etagères. Temps de recherche dans les rayons. Facilité d’accès. “Logique” de classement. Ex: par couleur: “Je cherche un livre sur java, il est vert…”
Classification Pas de contraintes physiques sur le web: la classification ontologique est inutile. Mauvais exemple: Yahoo
Classification “Books & literature“ sous “Arts/Humanities” “Booksellers” sous “Business/..” => Etagères virtuelles inutiles, lié au système de fichiers.
Classification: Evolution 1) Hiérarchie stricte 2) Ajout de liens secondaires 3) Ajout d’un gros tas de liens! ici, Yahoo c’est arrêté 4) Plus aucune hiérarchie, les liens suffisent.
Classification Hiérarchie stricte
Classification Hiérarchie avec bcp de liens:
Classification Que des liens:
Classification ontologique Ce n’est pas toujours une mauvaise idée! Domaine: petit, entités stables, bien définies, catégories formelles, bien départagées. Participants: Authorité(s), catalogueur pros, utilisateurs entraînés, voir pros. Exemple: Domaine médical
Classification ontologique A l’inverse: Domaine: grand, catégories floues, informelles, entités instables, mal définies. Participants: pas d’authorité(s), catalogueur amateurs, utilisateurs ”naïfs”. Exemple: le Web!
Télépathie et Voyance Termes ont plusieurs significations. Plusieurs termes ont la même sémantique. Example: “Apple”, “OS X”, “mac” -> même sémantique, mais apple a d’autres sens. Que cherche l’utilisateur qui tape “apple” ??
Télépathie et Voyance Prévisions du futur pour choisir correctement les catégories. -> On cherche les catégories les plus stables possible. Exemple: Library of Congress -> “Soviet Union” est devenu “Former Soviet Union” Attention: contraintes physiques!
Folksonomie “Each individual categorization scheme is worth less than a professional categorization scheme. But there are many, many more of them.” - Schachter Motivation individuelle, valeur de groupe Exemples: del.icio.us, flickr, et bien d’autres…
Folksonomie Pas d’homogénéisation. Les points de vue différents sont conservés. Recherche pas seulement de termes, mais en fonction de l’auteur des tags, de la date. Regroupement d’auteurs.
Folksonomie La “perte de signal” est normalement dûe à la compression en catégories. (ex: Yahoo, 14 catégories) Folksonomies: seulement si les avis sont divergents. Augmentation de la taille = réduction de la perte dans une folksonomie. Augmentation de la taille = augmentation de la perte dans un système ontologique.
Folksonomie: remarques Pas de pré-filtrage, contrairement au monde réel. Publication != qualité, mais la mauvaise qualité est “oubliée” avec le temps => post-filtrage. Pas de vérification de catégorisation. Les tags rares sont facilement ignorés, pas besoin de suppression. Superpositions partielles, pas binaires: “apple” et “OS X” sont partiellement identiques.
Conclusion Folksonomies € Web 2.0 L’ontologie est surfaite dans le domaine virtuel. Classification rigide est rattachée au contraintes physiques.
Bibliographie Ontology is Overrated, Clay Shirky, 2005 Yahoo.com, 2008 Online Computer Library Center, www.oclc.org, 2008 www.delicious.com,2008 www.flickr.com, 2008