Indexation : entre concept et percept, un problème d’interprétation Bruno Bachimont Institut National de l’Audiovisuel Université de Technologie de Compiègne
Argument L’indexation est une reformulation du contenu ; Deux approches : indexation documentaire et analyse du contenu ; Un pivot : le concept Le concept qui catégorise ce qui est extrait ; le concept qui distingue ce qui est indexé ; Problème : Comment concilier le niveau perceptif, niveau de l’analyse, et le niveau linguistique, niveau de l’indexation ? Propositions : Distinguer des niveaux d’analyse : phénoménologie de la perception ; Situer de manière critique les index : philologie de l’annotation ; Articuler les contenus entre eux : herméneutique documentaire Modéliser les index : sémantique de l’indexation. 2
Indexation : 2 points de vue Indexation documentaire : Reformulation en un format exploitable pour la tâche documentaire visée de la signifiance de la partie ou du tout d’un document. Recours aux ressources de la langue pour imposer un sens au document et expliciter cette signifiance. Analyse du contenu : Extraction en un format exploitable de descripteurs à partir du contenu physique du document. Recours aux propriétés physiques du monde représenté et de son encodage dans le document. 3
Problème L’indexation documentaire mobilise des index ; L’analyse des contenus mobilise des descripteurs ; Les index et descripteurs expriment un point de vue sur le contenu et correspondent à une conceptualisation du document : Entre concept perceptif à la base des descripteurs et concept distinctif à la base des index. 4
Concept distinctif Principe : Conséquence : Origine : le concept distinctif est une position dans le système de signification de la langue. Conséquence : Le concept distinctif a pour signification et contenu ce qui l’identifie et le distingue vis-à-vis des autres concepts. Origine : Linguistique saussurienne : signifier, c’est différer. 5
Le signe saussurien: définition « Le signe linguistique unit non une chose et un nom, mais un concept et une image acoustique. … Nous appelons signe la combinaison du concept et de l’image acoustique » (CLG) Concept = signifié ; Image acoustique = signifiant ; 6
Signe et réalité Langue & nomenclature Les signifiés et signifiants ne préexistent pas aux signes ; Le signe co-institue signifiant et signifié ; La langue n’articule pas les signes aux choses : Le rapport langue/réalité n’est pas du ressort de la linguistique. « Prise en elle-même, la pensée est comme une nébuleuse où rien n’est nécessairement délimité. Il n ’y a pas d ’idées préétablies, et rien n’est distinct avant l ’apparition de la langue. » (CLG, p. 155) 7
L’arbitraire du signe Distinguer : Arbitraire du nom par rapport à la chose désignée ; Problème philosophique du signe comme lien naturel ou conventionnel à la chose; Arbitraire du signifiant vis-à-vis du signifié : Arbitraire radical: « dix » et « neuf » ; Arbitraire relatif : « dix-neuf » vis-à-vis de « dix » et « neuf »; Les signes peuvent se motiver entre eux. 8
La linéarité du signifiant Caractéristique de la langue, qui la distingue des autres systèmes de signes ; Notion de « syntagmes »; Implique l’étude de la combinaison des unités linguistiques sur l’axe du signifiant: Syntaxe ; Syntagmatique. 9
Le système de signes Signification : Valeur : Le concept, face signifié du signe linguistique ; Valeur : La position qu’occupe ce signifié vis-à-vis des autres signifiés de la langue. La valeur se détermine en termes d’identités et différences aux autres signifiés La langue est un système de valeur 10
Cékékidit, Saussure « dans l’intérieur d ’une même langue, tous les mots qui expriment des idées voisines se limitent réciproquement : des synonymes comme redouter, craindre, avoir peur n ’ont de valeur propre que par leur opposition ; si redouter n’existait pas, tout son contenu irait à ses concurrents. » (CLG, p. 119). « Quand on dit qu’elles [les valeurs] correspondent à des concepts, on sous-entend que ceux-ci sont purement différentiels, définis non pas positivement par leur contenu, mais négativement par leurs rapports avec les autres termes du systèmes. Leur plus exacte caractéristique est d ’être ce que les autres ne sont pas. » 11
Linguistique et indexation Indexer, c’est choisir une valeur dans un système: Ce qui fait la valeur d’un index, c’est qu’il exclut les autres index ; Le sens d’un index consiste dans le fait qu’il nie les autres. 12
Le concept « perceptif » Principe : Le concept correspond à la catégorisation d’un donné perceptif. Conséquence : Le concept se détermine par rapport à un contenu extra-conceptuel. Origine : Abstraction aristotélicienne ; Schématisation kantienne. 13
Concept et perception Dans l’analyse, il ne s’agit pas seulement de contenu perceptif, au sens d’un pur divers phénoménal ; Le contenu est catégorisé en moments perceptifs : formes, contours, couleurs, etc. Le contenu n’est pas brut, mais correspond déjà à une interprétation. La question est de savoir si les catégories utilisées font système ou non, si elles constituent ou non des index. 14
Concept perceptif et distinctif ….. Conducteur Préposé Gendarme …. catégorisation Rôle sur la route Abstraction Distinction Opposition 15
Où en est-on ? Tout semble opposer les deux approches : Mais : L’indexation documentaire repose sur le code fonctionnel de la langue ; L’analyse repose sur la perception du monde. Mais : Le contenu analogique n’est pas le monde, mais une représentation ; L’interprétation du contenu n’est pas une perception du monde, mais une interprétation fondée sur une représentation analogique. 16
Signification et intuition L’objet réel est pris pour lui-même et en lui-même. Si l’objet réel peut s’interpréter, il s’agit de sa propre interprétation : on interprète quelque chose en disant « ceci est une pipe ». Le signe est un objet qui vaut pour ce qu’il n’est pas : aliquid stat pro aliquo. Le signe s’interprète vers autre chose, via un interprétant. On dira : « ceci n’est pas une pipe ». 17
Signification et intuition ? Perception Sensible du monde langage image Si l’image est une intuition de l’être, les modèles du monde sont légitimes pour l’interpréter : point de vue de l’analyse des contenus ; Si l’image est langage, le code fonctionnel de la langue peut servir à exprimer et expliciter celui de l’image: point de vue de l’indexation documentaire. 18
Perception, conceptualisation Distinguer par conséquent : « signe qui dit » : signe pour lequel la relation signifiant / signifié est arbitraire ; la structure du signifié renvoie à un système fonctionnel. « signe qui montre » : signe pour lequel il existe une analogie ou ressemblance entre le signifiant et le signifié. Le signifié ne vérifie pas de code fonctionnel. Tous deux sont des signes : renvoi intentionnel vers ce qu’ils ne sont pas. Si l’image est un signe (qui dit) : Ne pas appliquer « brutalement » les modèles du monde. Construire pas à pas les éléments de la perception permettant la catégorisation à partir de leur synthèse ou unification. 19
Conséquences Le problème n’est pas un problème de type cognitif : articuler la vision à la conception. Le problème est d’articuler différents niveaux d’interprétation et de constitution du sens. Attaquer ce problème à différents niveaux: Phénoménologie de la perception : Distinguer différents niveaux de construction. Philologie de l’annotation : Situer les index. Herméneutique de la documentation : Constituer la catégorie à partir des signes la manifestant ; Sémantique de l’indexation : 20
Phénoménologie de la perception Le perçu se construit à partir des apparitions et des constituants du signifiant : Dégager les différents niveaux phénoménologiques de la constitution du perçu: Formes; Contours; Couleurs; Etc. 21
Philologie de l’annotation L’indexation est interprétation: Elle propose un interprétant à partir duquel entamer l’interprétation du signifiant ; Consigner l’interprétant, c’est annoter le contenu en vu de sa ré-interprétation. Les annotations sont des sur-impositions sur le contenu qui doivent donner pour elles-mêmes leurs propres conditions d’interprétation: Situer les points de vue, les auteurs, les condition de production et de réception. 22
Herméneutique documentaire Les documents constituent des genres et des collections. Genres et collections partagent des conditions de production, réception, répondent à des questions partagées qui permettent de paramétrer (sur-déterminer) l’interprétation. 23
Sémantique de l’indexation Les index, pour constituer des concepts distinctifs parmi des paradigmes, doivent être modélisé à travers un code ou système fonctionnel. Les outils documentaires classiques doivent être revus à travers une sémantique linguistique différentielle: Systématicité ; Description de la variabilité. 24
Conclusion L’indexation des documents est d’emblée un problème d’interprétation à tous les niveaux : Analyse automatique des contenus ; Indexation interprétative des documentaires ; Plutôt que se fonder sur des modèles du monde, il faut articuler les différents niveaux d’interprétation: Le document comme signe ; Le percept comme signe ; L’index comme signe ; 25