Bases de données multimédia I - Introduction
Quelques définitions Type média et Multimédia Les médias statiques (les données alphanumériques, les graphes et les images) Les médias dynamiques(les graphes et les images animés, le son et la vidéo) Un objet multimédia contient au moins un média non alphanumérique Information multimédia, Système multimédia, Communication multimédia, Application multimédia
Ordres de grandeur
Bases de données et SGBDs Une base de données est un ensemble structuré et organisé de données Le SGBD est le système qui gère la base de données((ajout, mise à jour, recherche de données).
Base de données multimédia Multimedia Database (MMDB) Initialement traitées comme des bases standards Objets multimédia traités comme un seul item (champs) au sein d’une base de données relationnelle (ex: Oracle, BLOB –Binary Large Object) Annotation ou métadonnées
Création d’une table étudiant avec photo CREATE TABLE Etudiant ( Num NUMBER NOT NULL PRIMARY KEY, Nom VARCHAR2(50), Adresse VARCHAR2(100) Picture : BLOB ); Nota : Le BLOB n’est qu’une suite de bits et le SGBDR n’en peut extraire ni la sémantique ni le contenu visuel. «Toutes les images “qui ressemblent” à une image requête » ne peut pas être formulée.
Contenu et méta-données Les données “brutes” (fichier image, fichier son) provenant d’objets multimédia contiennent des informations sémantiques. On en distingue La donnée brute (image, signal sonore) Les métadonnées décrivant le contenu DEFINITION: Le processus d’abstraction permet de décrire le contenu d’objets multimédia par des métadonnées, soit manuellement, soit par des procédés (semi)automatiques
Annotations Une annotation textuelle sera toujours trop restrictive Malgré cela, l’approche la plus utilisée reste l’annotation textuelle et manuelle Avantage : recherche indépendante du type de media Inconvénients : Le coût d’annotation manuel est très important Différentes personnes utilisent un vocabulaire différent pour signifier la même chose (ex: clair, lumineux). L’annotation est subjective. Le non-verbal ne peut être exprimé sans ambigüité.
ID3 Tags Conçu en 1996 et devenu de facto un standard 128 octets
Création d’une table Etudiant avec photo avec SGBDOR D’abord création de la classe d’objet IMAGE create type IMAGE ( private … public ... ); Ensuite la table CREATE TABLE Etudiant ( Num NUMBER NOT NULL PRIMARY KEY, Nom VARCHAR2(50), Adresse VARCHAR2(100) Picture : IMAGE );
Avec la classe IMAGE, il est possible de réaliser des opérations sur les photos, alors que l’on ne le pouvait pas avec le BLOB.
Système de recherche d’informations multimédia SRIM
Quelques systèmes commerciaux QBIC (Query By Image Content) : Sans être exactement le premier système de recherche/indexation d’images, QBIC marque en 1995 le début des systèmes commerciaux. Il est aujourd’hui l’un des systèmes les plus cités et décrits de la littérature.
VisualSEEK : C’est un système de recherche d’image développé par l’université de Columbia (New York). Son système de requête combine entre les relations spatiales et le bouclage de pertinence. Nota : La pertinence c’est l’adéquation entre le contenu effectif des documents et l’information recherchée par un utilisateur. Les images pertinentes sont obtenues via des mesures de similarité. Le jugement de pertinence de l’utilisateur n’est celui du système c’est pourquoi il y a bouclage.