La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

UE303.c : cours n°3 Conception de système dinformation multimédia Promo. Master IST-IE 05/06 Par : Sahbi SIDHOM MCF. Université Nancy 2 Equipe de recherche.

Présentations similaires


Présentation au sujet: "UE303.c : cours n°3 Conception de système dinformation multimédia Promo. Master IST-IE 05/06 Par : Sahbi SIDHOM MCF. Université Nancy 2 Equipe de recherche."— Transcription de la présentation:

1 UE303.c : cours n°3 Conception de système dinformation multimédia Promo. Master IST-IE 05/06 Par : Sahbi SIDHOM MCF. Université Nancy 2 Equipe de recherche SITE – LORIA Sensibilisation au catalogage : pratique & projet

2 2 I. Processus dabstraction

3 3 Systèmes décriture Motif significatifMotif non-significatif Indice « naturel » PicturalQuasi pictural Pictogramme et Dessins (isolés) Pictographie et bandes dessinées Écriture logosyllabique : Représentation linguistique systématique Écriture alphabétique/ syllabique (représentation phonémique systématique ) Indice arbitraire Variations dans la représentation graphique [Goody, 94]

4 4 Analyse de Corpus textuels Observations sur Corpus Système de règles Élaboration dhypothèses structurelles Analyse morphosyntaxique Parseur Corpus de Test Exécution Analyse des résultats Modification Corpus dÉvaluation Exécution Analyse et Critiques essais Evaluations essais Tests 1 confrontation confrontation vs. extension

5 5 Abstraction par l « Alphabet » Lalphabet représente aussi le point daboutissement dun processus délaboration logique. Selon J. Goody, on arrive au niveau dabstraction ([Goody, 94], p.75) à partir : 1. d e logogrammes (des signes pour des mots), 2.de syllabes (des signes pour reproduire des sons), 3.de linitiale, une lettre, ou une nouvelle lettre pour représenter lélément phonétique commun à un groupe de syllabes. Lalphabet ne peut émerger que lorsque toute la série des syllabes est mise dans une forme graphique. Qui dit alphabet, dit un niveau dabstraction très élevé

6 6 Canaux communicationnels comme sources de connaissances : 1.lécriture a ses racines dans les arts graphiques, 2.les arts graphiques donnent accès à la lecture et à lécriture ( cunéiforme de Mésopotamie, Les hiéroglyphes ou du chinois 3.lécriture graphique ou imagée est la source des écritures syllabiques ou alphabétiques, 4.le système graphique réussit à doubler et à amplifier le système linguistique, 5.les sources de connaissances visuelles ne sont pas indépendantes aux sources langagières ( la rhétorique ). Établissement dun lien commun entre ces différents canaux communicationnels : 1.Lanalyse du multimédia subordonnée à lanalyse de son contenu textuel constitue une nouvelle source de connaissance complémentaire à la nature du document source. 2.La description textuelle selon un processus adéquat de productions de contenu constitue une autre forme daccès à une source de connaissances qui nest pas forcément écrite.

7 7 Exemple 1: Exemple de texte en hiératique et sa correspondance en écriture hiéroglyphique : Remarque ?

8 8 Exemple 2 : Les 7 caractères démotiques ajoutés à l'écriture grecque : Remarque ?

9 9 Exemple 3 : Le signe devient alors «idéogramme» : Remarque ?

10 10 Exemple 4 : Remarque ?

11 11 Analyses sur Corpus non textuels 1 Observations sur Corpus Système de règles de réécriture Élaboration dhypothèses structurelles Implémentation dAnalyseur Méthodologie danalyse Corpus de Test Exécution Analyse des résultats Modification Corpus dÉvaluation Exécution Analyse et Critiques essais Evaluations essais Tests 1 confrontation confrontation vs. extension

12 12 II. Étude de cas

13 13 1. INA de France En 1970, lORTF (Office national de la Radio et Télévision Française) charge le cabinet dorganisation SEMA (Documentation et gestion) de mettre au point une méthode danalyse afin de gagner du temps sur la préparation de lindexation des films dactualités [LUSTIÈRE, 99]. Lanalyse plan par plan, appelée « analyse chronologique », se révèle indispensable pour situer le sujet dans son contexte et faciliter la réponse à la demande. La grille danalyse chronologique mise au point à cette époque est utilisée jusquà présent à lINA.

14 14 On peut y relever des informations élaborées (niveaux danalyse) avec le concours des cinémathécaires sur un document donné : -la position des plans et la description plan par plan, -les mouvements de caméra, - l es personnes identifiées et les lieux de laction, -la distinction entre image et son. Évolutions (notices)

15

16

17 17 Le thésaurus est composé de quatre langages documentaires : - les noms communs, - les noms propres géographiques, - les noms propres de personnes morales, - les noms propres de personnes physiques. Les données traitées donnent lieu à trois types dindex édités sur microfiches : - lindex analytique : descripteurs décrivant le contenu, - lindex des titres : titres des séries, des émissions et des sujets, - lindex générique : les noms des génériques des séries, des émissions et des sujets. Pour aider à lindexation et à la recherche, deux éditions du langage de description sont effectuées sous les noms : - liste alphabétique du thésaurus, et - liste méthodique du thésaurus.

18

19 19 Vers le numérique : 2000

20 20

21 21 Guide actuel de lindexation audiovisuelle à lI.N.A. La grille danalyse chronologique mise au point, à lépoque de lORTF et le cabinet SEMA en 1970 [DEGEZ, 70], est utilisée jusquà présent à lINA. Les informations quon peut relever dans cette grille (ou niveaux danalyse) sont : - la position des plans et la description plan par plan, - les mouvements de caméra, - les personnes identifiées et les lieux de laction, - la distinction entre image et son. On distingue plusieurs grilles danalyse selon la nature de production tout en préservant le même principe de lélaboration de la grille initiale, nous citons : - PRODUCTION PROPRE (CODE 01) - ACHATS DE DROITS (CODE 03) - MIXTE (production propre + EVN ou achat ou archives) (CODE 04) - EVN(CODE 05) - ARCHIVES (CODE 10), etc.

22 22 Construction de descripteurs

23 23 Etc.

24 24 Construction de résumés

25 25 Etc.

26 26 2. Autre méthode danalyse : par abstraction à lanalyse linguistique On peut bien sinspirer dun modèle danalyse linguistique : –Étape morphologique « objets » isolés, propriétés des objets –Étape lexicale termes « qui désignent » –Étape syntaxique relations(objet, terme) –Étape sémantique sens, interprétations –Étape pragmatique mises en contexte (ou valeurs ajoutées)

27 27 III. mini-projet

28 28 Application Retrouver un catalogue en ligne qui donne accès à des ressources hétérogènes (ou multimédia) Dresser la topologie/typologie des documents présents Construire un petit corpus de documents : saider par un logiciel documentaire ou un SGBDD Analyser selon une des méthodes : –méthode INA : grilles chronologiques (à adapter) –méthode linguistiques : 5 étapes danalyse Identifier les limites de la méthode choisie Comment y remédier : éléments de solution à proposer

29 29 Étapes avec SuperDoc: 1. Sur Internet : Choisir un catalogue en ligne sur des documents hétérogènes (texte, image F/A, audio, vidéo, …) 2. Avec le logiciel documentaire : Définir les champs pour une notice Insérer du contenu dans les notices, sans oublier : URL pour la source, résumé, descripteurs Équations de recherche simples Équations de recherche complexes (expertes) Exprimer un besoin informationnel

30 30 Quelques URLs de ressources


Télécharger ppt "UE303.c : cours n°3 Conception de système dinformation multimédia Promo. Master IST-IE 05/06 Par : Sahbi SIDHOM MCF. Université Nancy 2 Equipe de recherche."

Présentations similaires


Annonces Google