La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

(Nom du fichier) - D1 - 26/07/2001 Le présent document contient des informations qui sont la propriété de France Télécom. L'acceptation de ce document.

Présentations similaires


Présentation au sujet: "(Nom du fichier) - D1 - 26/07/2001 Le présent document contient des informations qui sont la propriété de France Télécom. L'acceptation de ce document."— Transcription de la présentation:

1 (Nom du fichier) - D1 - 26/07/2001 Le présent document contient des informations qui sont la propriété de France Télécom. L'acceptation de ce document par son destinataire implique, de la part de ce dernier, la reconnaissance du caractère confidentiel de son contenu et l'engagement de n'en faire aucune reproduction, aucune transmission à des tiers, aucune divulgation et aucune utilisation commerciale sans l'accord préalable écrit de France Télécom R&D Comparaison des approches Wave Field Synthesis et (Higher Order) Ambisonics pour l'encodage et la restitution de scènes sonores Jérôme Daniel et Rozenn Nicol francetelecom _. __ com

2 France Télécom R&D Lillusion sonore… par quels moyens? q Lillusion sonore spatiale, cest : Q des images sonores localisées dans lespace Q direction+profondeur relief sonore (« stéréophonie ») Q se représenter la scène sonore Q de lenveloppement (sources et/ou réflexions latérales) Q se sentir immergé dans la scène sonore q Au moyen dune diffusion sur haut-parleurs Q Stéréophonie sur 2 haut-parleurs Q Rendu panoramique ou surround sur 5 HPs Q Dispositifs + complets: grand nombre de HPs, dispositifs 3D q Moyens de production sonore Q Prise de son [naturelle]: arsenal de microphones classiques Q Mixage, pan-pot : à partir de voies mono Q Nouveaux moyens: réseaux microphoniques et spatialisation q Des formats de représentation pour la transmission Q Stéréo 2 canaux, discrete surround (5.1, etc.): 1 voie pour 1 HP Q Surround matriçé vers stéréo: décodage (up-matrixing) avec perte Q Nouveaux formats sonores 3D + flexibles (cfg HP, canaux transmis) WFS et HOA (Ambisonics)

3 France Télécom R&D Lhéritage de la stéréo à 2 voies AB-ORTF XY Stereosonic MS Couples de micros coïncidents Couple non-coïncident Pan-pot damplitude (*) Pan-pot I + T Image sonore cohérente (*) (localisation prédictible) Scène confinée entre les HPs +de largeur apparente +denveloppement Encodage spatial Rendu spatial Format de transmission: 2 canaux gauche (L) et droit (R) Localisation fluctuante (selon la fréquence)

4 France Télécom R&D Stereo multicanal: le surround standard 30 ° 110 ° q Des besoins qui dépassent les capacités de la stéréo traditionnelle Q Besoin dune scène frontale plus stable (cinéma) Q Besoin denveloppement et dimmersion (composantes latérales) q Recommandations de lITU: Q 1 HP central en plus des 2 existants 3 HP frontaux Q + 2 HP latéraux/arrière ambiance, réflexions latérales, enveloppement q Finalement, une configuration relativement critique Q Les grands écarts entre HPs rendent délicate la création dimages latérales et arrière stables Q Cela restreint lécriture ou la composition de lespace sonore à une dichotomie « scène et dialogue frontaux » / « ambiance et effets latéraux » (convient notamment au cinéma)

5 France Télécom R&D Stereo multicanal: le surround standard Micros coïncidents Micros non-coïncidents Pan-pot damplitude Pan-pot I + T En pratique: faible directivité des cardios en BF, séparation latérale limitée effet denveloppement réduit Encodage spatial Format de transmission: 5 canaux L, C, R, S L, S R B-Format : 3 canaux W, X, Y Micro ambisonic (SoundField) Double MS (Schoeps) (+matriçage) 30 ° 11 0° Cardios coïncidents Déc. ambisonic (matriçage) Lécart entre deux micros dune paire (L et R, et SL et SR) rend leffet des réflexions latérales par déphasages et décorrélation meilleur enveloppement, en dépit des directivités limitées en BF

6 France Télécom R&D Bilan provisoire (approche traditionnelle de la production multicanal) q Contrainte de la configuration des HP (standard: 3 front + 2 rear) q Limitation de la directivité des microphones classiquement employés q Une approche empirique du design des sytèmes microphoniques (pour suppléer aux limitations des micros utilisés « tels quels ») : Q Il sagit de « bluffer » lauditeur (lart de lingénieur du son), même si ce nest pas acoustiquement réaliste Q En général (en tous cas pour la stratégie « micros non-coïncidents ») : 1 microphone pour 1 HP et (quasiment) pas de traitement (i.e. combinaison des signaux captés) Q il manque un décodage approprié à cet encodage spatial Q Deux visions distinctes (voire opposées, dans les esprits): coïncidence versus non-coïncidence des micros q Les approches holophoniques WFS et HOA … Q sattachent au respect dune réalité physique du champ sonore Q proposent des outils avancés de prise de son et dencodage spatial Q suggèrent de nouveaux formats de représentation 3D multicanal, plus flexibles

7 France Télécom R&D Systèmes holophoniques WFS et HOA… vus de loin q Stratégies visant la reconstruction physique du champ (holophonie) q Basées sur des descriptions différentes de la réalité du champ sonore Micros coïncidents: omni, bidirectifs, quadripôles, etc. (« harmoniques sphériques ») Micros non-coïncidents: réseau identique au réseau de HP Encodage spatial Format de transmission: N canaux (1 par mic et par HP)B-Format étendu: K canaux ambisonic (indép. HP) Rendu spatial Déc. ambisonic (matriçage) Le champ est reconstruit par « interpolation » à lintérieur Le champ est reconstruit par « extrapolation » autour du centre

8 France Télécom R&D Holophonie = équivalent acoustique de lholographie Cf. «Acoustique théorique, propagation et holophonie» M. Jessel consiste à reproduire un champ sonore à partir dun enregistrement sur une surface (surface fermée ou plane) qualitativement: Principe de Huygens quantitativement: Résolution dun problème aux limites

9 France Télécom R&D Holophonie: approche intuitive Principe de Huygens front donde = distribution de sources secondaires applications: reproduire / annuler un champ acoustique ondelettes

10 France Télécom R&D Holophonie : approche théorique Problème aux limites Champ créé par des sources dans 1 Champ capté sur la limite d Champ à reconstruire dans 2 microphone à gradient de pression microphone de pression monopôledipôle Solution: Intégrale de Kirchhoff-Helmholtz

11 France Télécom R&D Application de lholophonie: la WFS (Wave Field Synthesis) q En pratique (WFS), des approximations : Q Nombre fini de micros et HPs (discrétisation des réseaux) Q Restriction au plan horizontal (réseaux 2D) Q Un seul type de transducteur (typiquement : micros cardios et HP monopolaires) q Cas particulier illustré dans lexposé: réseau circulaire q Application à la reproduction 3D dun champ sonore

12 France Télécom R&D WFS: synthèse artificielle de front donde q Simuler la prise de son par le réseau Q source sonore virtuelle dite « source notionnelle » Q 1 retard et 1 atténuation par source et par HP Q correction de la phase stationnaire, car réseaux 2D et non 3D égalisation des haut-parleurs correction de la phase stationnaire source notionelle 1 son mono pour 1 source

13 France Télécom R&D Ambisonics « traditionnel » (ordre 1) : encodage et informations spatiales q Description de la propagation du son en un point de « vue » privilégié Q W: champ de pression Q X, Y, Z: gradient de pression vélocité acoustique Q Rapport (X, Y, Z) / W : vecteur décrivant la direction et vitesse apparente de propagation q Information directionnelle contenue dans le rapport damplitude entre les composantes q Description indépendante dun quelconque dispositif de restitution Q Flexibilité q Transformation du champ (rotation, focus) par matriçage des composantes

14 France Télécom R&D Ambisonics « traditionnel » (ordre 1) : décodage et restitution q Décodage ( matriçage) recomposer le champ acoustique q Recombinaison des harmoniques sphériques (omni+bidirectifs) prise de son équivalente avec des micros (infra-)cardioïdes q Zone de reconstruction assez large en TBF, réduite en HF q Décodages modifiés pour les HF ou pour positions découte excentrées Matrice de décodage D Signaux Ambisoniques B Signaux des haut-parleurs S = D.B Champ reconstruit par le réseau de haut-parleurs B ~ ordre 1 :

15 France Télécom R&D Ambisonics à résolution spatiale élevée (Higher Order Ambisonics : HOA) q En exploitant les directivités dordres supérieurs… q Le décodage associé à lencodage équivaut à une prise de son utilisant des micros très directifs q Meilleure utilisation des HPs = meilleure sélectivité angulaire (sils sont rapprochés les uns des autres) q Reconstruction quand lordre croît Q Sur une zone + large (pour une fréquence donnée) Q Jusquà une fréquence + élevée (pour une position ou une zone donnée) Onde plane monochromatique f=600Hz ordre 1 :ordre 2:ordre 5 :ordre 10 :

16 France Télécom R&D Higher Order Ambisonics : schéma dencodage spatial de sources virtuelles Distance Coding Directional Coding Input parameters Outputs (NFC HOA) Input Signal Positional Encoding Encodage directionnel : Contrôle de la distance (courbure du front donde) [Daniel, AES23, 2003]

17 France Télécom R&D WFS et HOA: comparaison (source virtuelle) q Onde plane (source lointaine, extérieure au réseau) Q WFS=HOA en BF Q WFS: aliasing spatial en HF (« nid dabeille ») Q HOA: la zone de reconstruction se rétrécit ( HF), mais linformation spatiale reste consistante q Source proche, « intérieure » Q Reconstruction complète impossible Q HOA: disque excluant la source Q WFS: retournement temporel q Des approches qui peuvent se compléter et bénéficier lune de lautre. q Cf [Daniel et al, AES114, 2003] HOA (ordre 15) WFS (32 HP) HOA (ordre 15) WFS (32 HP)

18 France Télécom R&D WFS et HOA: tests découte comparative q Evaluation subjective et comparaison de WFS et HOA Q Localisation de source sonore virtuelle Q Rendu de sources en mouvement Q Taille de la zone découte: multi-auditeurs et auditeur mobile Q Evaluation de limmersion q Démonstrateur pour tests Q Réseau circulaire de 48 HPs Q (Labo de France Telecom R&D) Elaboration des tests entamée dans le cadre du projet CARROUSO

19 France Télécom R&D Prise de son ambisonic dordre élevé q Ordre 1: (micro SoundField) Q recomposition d1 omni et 3 bidir. Q … à partir de 4 cardios q Ordres supérieurs Q + grand nombre de capsules (non-coïncidentes) Q réparties sur une sphère (3D) échantillonnage spatial des composantes harmoniques sphériques Q Matriçage (encodage directionnel) + égalisation (selon directivité et distance des capteurs Q Compromis: entre BF (élargir le réseau) et HF (diminuer lespace entre capteurs) q Cas particulier (2D) Q réseau circulaire: similaire au WFS Q microphones non-coïncidents ! W = LF + LB + RF + RB X = LF - LB + RF - RB Y = LF + LB - RF - RB Z = LF - LB - RF - RB Matrice N x K N signaux captés K signaux ambisoniques N signaux captés

20 France Télécom R&D WFS et HOA : comparaison en condition de prise de son réelle q WFS : viser une zone découte pas aussi large que le réseau de HP q HOA : aller cherche linformation du champ acoustique sur une zone + large q Chacun dispose de procédés dinterpolation ou dextrapolation du champ q On réalise un compromis avec des dimensions intermédiaires pour le réseau microphoniques q On montre que dans des conditions de prise de son identiques, les 2 stratégies sont soumises à des qualités et artefacts (aliasing spatial) de reconstruction semblables q Dautres variantes techniques des prise de son offrent des solutions satisfaisantes pour les deux approches Schéma original pour le WFS Schéma original pour le HOA Schéma intermédiaire Réduction de laliasing spatial + dinfo spatiale BF

21 France Télécom R&D Retour au multicanal (1/2) q Micros coïncidents versus non-coïncidents Q Un faux clivage !? (lien entre WFS et HOA) Q La prise de son directive nécessite une capture du champ en des points distincts, voire distants ! (doù: micros cardio omni en BF) q Lois de pan-pot et systèmes de prise de son pour le 5.1 Q On peut définir des lois de pan-pot optimales pour le 5.1, qui sexpriment en termes dharmoniques sphériques (Craven 2003) Q Des systèmes microphones inspirés du HOA ou du WFS peuvent être exploités pour une prise de son quasi- optimale Q Finesse de directivité (largeur de lobe) en fonction de lécart entre les haut-parleurs 30 ° 11 0° (From Craven, 2003)

22 France Télécom R&D Retour au multicanal (2/2) q Des nouveaux formats de représentation sonore 3D Q Flexibilité du format (High Order) Ambisonics: Décodage et reproduction sur une grande variété de dispositifs Possibilité de transformation du champ sonore (rotation, focus) Scalabilité spatiale: laisser tomber certains canaux (selon contraintes de transmission ou limitation de la restitution) Q Possibilité dassurer une compatibilité avec les formats « discrete multi-channel » (5.1) Pré-décodage (matriçage) pour 5.1 et possibilité de back-matrixing vers (WXY…) L C R SLSL SRSR Z U V 5 channels computed from W, X et Y ambisonic comp. Add. vertical amb. component V U Z Y X W sound field transformation Spatial decoding Binaural / Transaural Surround (5.1) 3D/2D HP Config. 8 conveyed channels 6 ambisonic components L C R SLSL SRSR Z U V 5 channels computed from W, X et Y ambisonic components Add. vertical amb. Component 8 conveyed channels Surround (5.1) Ignored By-passed (no spatialization added) (Optional) BackwardMatrix

23 France Télécom R&D Conclusion : outils récents et émergeants q Encodage spatial « haute résolution » (sources virtuelles) Q Pan-pot améliorés (en direction et en distance) Q... pour la spatialisation dans la composition de scènes 3D interactives (réalité virtuelle, jeux…) plugins (FTR&D) pour Virtools Q … pour la production musicale, artistique développement (en cours) de plugins VST (FT R&D, Univ. York) q Systèmes microphoniques à « haute-résolution spatiale » Q Microphones 2D en expérimentation (ex. Univ. Delft) Q Microphones 3D (ex. France Telecom R&D, Trinnov Audio, MH-Acoustics) Q Microphones dédiés au 5.1 (ex. Trinnov Audio): synthèse de directivités fines q De nouveaux formats + flexibles : High Order Ambisonic ou dérivés Q Format ambisonic avec matriçage partiel (optionnel) des composantes pour compatibilité avec multicanal standard (5.1 ou autre) Q Scalabilité spatiale Q Adaptabilité à une multitude de dispositifs de restitution Q Extension des formats de fichiers multicanal (investigations // WAVE_EX) Q En cours de discussion pour une future version du standard MPEG-4


Télécharger ppt "(Nom du fichier) - D1 - 26/07/2001 Le présent document contient des informations qui sont la propriété de France Télécom. L'acceptation de ce document."

Présentations similaires


Annonces Google