Au sujet d’une définition de la « numérisation » Henri Habrias I.U.T. de Nantes Département informatique CNRIUT 2007, Thionville
Le cas En l’espèce, un étudiant avait reproduit sur ses pages personnelles hébergées sur un serveur fourni par une université française, Paris VIII, une œuvre de Raymond Queneau (Cent milliards de poèmes). L’étudiant avait fait un recueil interactif, sans l’autorisation des ayants droits de l’auteur. CNRIUT 2007, Thionville
La décision Le Tribunal de grande instance de Paris, dans sa décision du 5 mai 1997, pose une définition de la mise en ligne d'une œuvre protégée sur le réseau Internet : Musée d’Orsay « la numérisation d'une œuvre est une « technique consistant à traduire le signal analogique qu'elle constitue en un mode numérique ou binaire qui représente l'information dans un symbole à deux valeurs 0 et 1 dont l'unité est le Bit » CNRIUT 2007, Thionville
L’informatique n’a pas besoin de théorie ? L’informatique, une science ? Une technique ? Un outil ? Demandez à un informaticien : de citer un titulaire du Prix Turing - etc. La théorie, la science informatique seraient-elles inutiles ? Que faut-il enseigner ? CNRIUT 2007, Thionville
Définir La définition étudiée dans cette communication nous montre que l’on ne peut se passer de théorie. Si l’on veut éviter le discours creux et donc inutile. CNRIUT 2007, Thionville
La définition « la numérisation d'une œuvre est une « technique consistant à traduire le signal analogique qu'elle constitue en un mode numérique ou binaire qui représente l'information dans un symbole à deux valeurs 0 et 1 dont l'unité est le Bit » CNRIUT 2007, Thionville
Analyse de la définition du tribunal – la première partie « traduire le signal analogique qu'elle constitue en un mode numérique ou binaire » qui pose la question de savoir à quel type d'œuvre il est fait référence, i.e. s'agit-il d'images (les pages d'un livre peuvent être vues comme des images) ou d'écrits ? – la deuxième partie « mode numérique ou binaire qui représente l'information dans un symbole à deux valeurs 0 et 1 dont l'unité est le Bit » qui laisse perplexe l'informaticien ou le sémiologue. CNRIUT 2007, Thionville
Numérisation La numérisation d'un signal permet effectivement de coder l'information portée par un signal analogique sous forme numérique. Elle se base sur les travaux de Shannon relatifs à la théorie de l'information. CNRIUT 2007, Thionville
La numérisation d’un signal comporte normalement 3 phases : – échantillonnage du signal (à une fréquence > ou = au double de la fréquence maximale du signal analogique d'après Shannon[1]), i.e. projection de la composante continue temporelle sur un ensemble discret – quantification, i.e. projection de la composante continue en amplitude sur un ensemble discret (appelé échelle de quantification) – codage des points résultants des 2 premières étapes [1] Le théorème de Shannon stipule que pour pouvoir numériser correctement un signal, il faut échantilloner à une fréquence double (ou supérieure) à la fréquence du signal analogique que l'on échantillonne. CNRIUT 2007, Thionville
Un livre, signal analogique ? Le problème dans tout cela réside dans le procédé permettant de considérer un livre comme un signal analogique. Ou alors il s'agit de l'ensemble des images qui constituent le livre physique. Un livre peut être abstrait comme étant un écrit. Un écrit se définit par le fait que les graphèmes sont disposés l'un à la suite de l'autre. Ce qui différencie un écrit d'une image est le fait que, pour lire, il faille suivre une suite de graphèmes. CNRIUT 2007, Thionville
Ecrit vs Image Enfin, il faut noter que ce qui est un écrit pour une personne donnée peut n'être qu'image pour une autre et aussi qu'une même personne peut voir une chose, à la fois comme un écrit et comme une image. Les monuments musulmans avec leurs arabesques, sont l'occasion d'illustrer cela. CNRIUT 2007, Thionville
En supposant que l'on passe du livre à un signal analogique qui est ensuite « digitalisé », comment se fait le passage du livre au signal analogique ? Le lecteur habitué au MODEM sait que l'on transporte du digital sur un signal analogique (le son est une onde). La définition ne s’applique-t-elle qu’à de la musique ou des images (des ondes) fournies en entrée ? CNRIUT 2007, Thionville
Le passage à un alphabet à deux éléments On peut toujours disposer d'une table de correspondance entre les éléments de l'alphabet et des mots (suites de caractères) construits avec un alphabet n'ayant que deux éléments. Il faut noter qu'en général, on ne fournit pas directement une telle table de correspondance et que l'on passe par l'intermédiaire d'une correspondance entre les éléments de l'alphabet et des nombres écrits en numération décimale (i.e. sur l'alphabet : {0, 1, 2, 3, 4, 5, 6, 7, 8, 9}. Un exemple est celui des codes « ASCII ». CNRIUT 2007, Thionville
Numériser Comme l'on passe d'un niveau d'abstraction (les lettres de l'alphabet par exemple) à la réalisation d'un 0 ou d'un 1 sur un support matériel (curieusement on parle de « dématérialisation » ! En fait il s'agit de dématérialisation pour celui qui, alors qu'il pouvait lire sans artéfact (et encore, combien portent des lunettes !) telle déclaration de revenus, ne peut maintenant la lire que par l'intermédiaire d'un ordinateur), par l'intermédiaire de ce que les mathématiciens appellent les nombres entiers naturels. On dit que l'on « numérise ». CNRIUT 2007, Thionville
Discret synonyme de Numérique Comme, aussi bien un alphabet binaire (composé de deux éléments) qu'un alphabet non binaire (comme l'alphabet français) est un ensemble d'éléments (i.e. du point de vue de la construction des mots, des éléments indécomposables (élémentaires ! atomiques !) – bien sûr un concepteur de fontes, ne les verra pas comme élémentaires !), i.e. ce que les mathématiciens appellent un ensemble discret – on dit que l'on travaille dans le monde du « discret » comme celui des nombres naturels. Voila pourquoi « discret » et « numérique » sont souvent synonymes. CNRIUT 2007, Thionville
Unité ? Quand on évalue une quantité, on a besoin d'une « unité de mesure », c'est-à-dire d’une quantité prise comme référence pour évaluer toutes celles qui sont de même nature. « Par exemple, dire "5 douzaines d'œufs", "2 kilos de pommes", "3 semaines", c'est exprimer des quantités dont les unités sont respectivement la douzaine d'œufs – si l'on avait compté les œufs un par un, on aurait dit 60 œufs –, le kilo de pommes, la semaine – si on avait compté en jours, on aurait dû dire 21 jours. Ainsi, d'une manière courante, une unité est un choix de quantité, cette quantité étant considérée comme une. » (S. Baruk S. 1992, page 1263, ) CNRIUT 2007, Thionville
Il a une valeur et non 8 valeurs ! Si le symbole est mesuré[1] en bit, on peut dire « un symbole de 8 bits » par exemple. Peut-être l'auteur veut-il dire qu'un symbole est un mot construit avec les éléments de l'alphabet {0, 1}. 00010110 serait un symbole de mesure 8 bits. Mais l'auteur a écrit « représente l'information dans un symbole à deux valeurs 0 et 1 ». 00010110 dans l'interprétation ci-dessus est un symbole qui a comme valeur 00010110 ! Il a une valeur et non 8 valeurs ! CNRIUT 2007, Thionville
Si on est en numération binaire, on peut donner son équivalent en décimal. Et on aura toujours une seule valeur. Il faut remarquer que si on écrit « trois » en décimal, on écrit : 3, et si on écrit 3 en binaire, on écrit : 11, ce qui fait bien trois car on a écrit (merci aux Indous qui l'ont inventé et aux Arabes qui nous l'ont transmis) implicitement en numération par position : 1 fois 2 plus 1 fois 1 soit trois. On dit parfois qu'on a des « unités » un, deux, quatre, etc. (en décimal, on a des « unités », un, dix, cent, mille). Même dans ce sens, ce n'est pas le bit qui est l'unité. CNRIUT 2007, Thionville
Mesure ? Considérons un ensemble de prédicats empiriques (exemple d’un élément : x est beaucoup plus grand que y). On définit alors une fonction (F) totale de l’ensemble des entités à mesurer (on va choisir de mesurer leur attribut taille) vers un ensemble de nombres (par exemple, pour la taille, 72). On définit ensuite un ensemble prédicats formels (exemple d’un élément de cet ensemble : x > y +15) sur les nombres et une fonction totale de l’ensemble des relations empiriques vers l’ensemble des prédicats formels (exemple d’un élément de cette fonction : (x est plus grand que, x > y + 15). CNRIUT 2007, Thionville
Mesure (suite) Tous les prédicats du système empirique doivent être préservés dans le système numérique par la fonction F. Une telle correspondance est un homomorphisme. On dit aussi une « représentation ». Le fait que tous les prédicats empiriques soient préservés fait de cette correspondance une mesure de l’attribut taille. CNRIUT 2007, Thionville
Des ondes en entrée ? Ou alors le lecteur conclut que la définition ne s'applique qu'à de la musique (hors de la partition) ou à des images (on a des ondes en entrée) non encore digitalisées. Rappelons que Douglas Hoffstadter (Hoffstadter 1985) définit l'information comme tout ce que l'on peut transmettre sur une ligne téléphonique : le piano (en bois et en acier) n'est pas de l'information, la partition de musique est de l'information. CNRIUT 2007, Thionville
« un symbole à deux valeurs 0 et 1 dont l'unité est le Bit » ? « en un mode numérique ou binaire qui représente l'information dans un symbole à deux valeurs 0 et 1 dont l'unité est le Bit » Quel sens peut bien avoir l'expression « un symbole à deux valeurs 0 et 1 dont l'unité est le Bit » ? CNRIUT 2007, Thionville
Interprétation avec Saussure Considérons les premières pages du Cours de linguistique générale de F. de Saussure (Saussure 1972). Doté du vocabulaire et des concepts de Saussure, voici comme ce texte peut être interprété : – Qu'est ce qu'un symbole ? le signifiant – Qu'est-ce que la valeur d'un symbole ? le signifié CNRIUT 2007, Thionville
L’unité d’un symbole ? – Quelle est l'unité d'un symbole ? La science ne nous a pas encore donné de réponse. Le droit non plus ! CNRIUT 2007, Thionville
Le bit Considérons l'ensemble {0, 1}. Des suites de ces éléments s'appellent des mots. S’ils ne sont formés que de 0 et de 1, on les dit « mots binaires ». A chaque position dans le mot (dans la suite) on trouve soit un 1 soit un 0. On dit que c'est un bit, binary digit. Le mot « digit » signifie en anglais « chiffre ». Ici on écrit des mots avec seulement deux chiffres : le 0 et le 1. Il est assez mal venu de dire que le chiffre est binaire. La numération, elle, est binaire. CNRIUT 2007, Thionville
Echec Nous devons reconnaître que nous ne sommes pas arrivés à donner une interprétation à « symbole dont l'unité est le Bit » ! CNRIUT 2007, Thionville
Récriture « l'information est représentée par des mots écrits avec un alphabet à deux éléments, 0 et 1. » CNRIUT 2007, Thionville
Confusions Il semble que le rédacteur a confondu : - les nombres et les diverses numérations (binaires, décimales, etc. ) et aussi la représentation en machine. CNRIUT 2007, Thionville
Et si … Si mon ordinateur ne code plus l'information en bits {0, 1} mais en « cits » {a, b}, est-ce que je peux numériser car je ne tombe plus sous la définition qui est à l'appui de la décision de justice considérée ici ? CNRIUT 2007, Thionville
our task is to demonstrate that a first intuition is often wrong « I beleive it is fundamentally wrong to teach a science like programming by reinforcing the student’intuition when that intuition is inadequate and misguided. On the contrary, our task is to demonstrate that a first intuition is often wrong and to teach the principles, tools, and techniques that will help overcome and change that intuition! Reinforcing inadequate intuitions just compounds the problem. » (Gries David 1990 ) CNRIUT 2007, Thionville
Un autre définition CNRIUT 2007, Thionville
Faisons mentir Samuel « Définir, c’est entourer d’un mur de mots un terrain vague d’idées » Samuel Butler, Carnets, 1912 CNRIUT 2007, Thionville