La Compression philippe.lantin@siemens.com
Sons, perception, sensation UCL 120 Intolérance Sensation auditive (Cortex) Oreille saine Sons externes 60 Sensation HTL
Linéarité, recrutement, expansion 120 Intolérance HTL UCL Cochlée qui recrute : Expansion de la sensation Linéarité Oreille atteinte Sensation auditive (Cortex) Sons externes 60 Sensation
Compression, recrutement, expansion 120 Intolérance la Compression ! HTL UCL Cochlée qui recrute : Expansion de la sensation Sensation auditive (Cortex) Sons externes 60 Sensation
Linéarité, recrutement, expansion Intolérance HTL UCL Cochlée qui recrute : Expansion de la sensation Oreille nue Sensation
Linéarité, recrutement, expansion Intolérance HTL UCL Cochlée qui recrute : Expansion de la sensation Appareil auditif Linéaire Sensation
Linéarité, recrutement, expansion Intolérance HTL UCL Cochlée qui recrute : Expansion de la sensation Appareil auditif Linéaire Sensation
Linéarité, recrutement, expansion Intolérance HTL UCL Cochlée qui recrute : Expansion de la sensation Appareil à compression de limitation CK = 70 dB Sensation
Compression, recrutement, expansion Intolérance HTL UCL Cochlée qui recrute : Expansion de la sensation Appareil à compression FDRC CK = 36 dB Sensation
Différences entre compression et écrêtage AGC-O : réduction progressive du gain PC : écrêtage instantané AGC : une boucle complète = temps d’attaque x y micro gain HP AGC-O : enclenchement de la boucle quand NS ≥ y (y : CK) AGC-I : enclenchement de la boucle quand NE ≥ x (x : CK)
Relation Gain / Intensité en fonction du type de compression Linéaire PC AGC-O AGC-I FDRC CK CK Intensité sonore dB SPL 30 60 90
Relation Sortie / Entrée en fonction du type de compression 120 100 80 60 40 20 CR = Δ Entrée Δ Sortie PC Gain = 50 dB CK = 120 dB CR = AGC-O Gain = 50 dB CK = 115 dB CR = 11 :1 AGC-I Gain = 30 dB CK = 70 dB CR = 2,5 :1 AGC-I FDRC Gain = 30 dB CK = 35 dB CR = 1,5 :1 Entrée
Relation Sensation / Intensité avec une amplification linéaire 60 Sensation ou Sonie MCL HTL UCL Intensité sonore 120 Amplification Linéaire sur amplification Gain fixe Peak Clipping sensation normale sensation du patient sous amplification
Relation Sensation / Intensité en fonction du type de compression Sensation ou Sonie UCL AGC-I AGC-O sur amplification MCL sous amplification HTL 60 120 Intensité sonore
Relation Sensation / Intensité en fonction du type de compression Sensation ou Sonie UCL FDRC AGC-I sur amplification Gain des sons forts MCL Gain de la voix moyenne Gain des sons faibles sous amplification sous amplification HTL 60 120 Intensité sonore
Relation Sensation / Intensité en fonction du type de compression Sensation ou Sonie UCL FDRC : CK 45dB FDRC & WDRC Compressions dynamiques : AGC-I & AGC-O Compressions de limitation : AGC-I de limitation : CK > 60dB WDRC : 45dB CK 60dB MCL HTL 30 40 50 60 70 90 120 Intensité sonore domaine de la voix
Que choisir : CK élevés ou bas ? Peu âgé Très actif CK bas < 50 dB Très âgé Peu actif CK élevés > 50 dB
Comment régler les CK du grave à l'aigu : tous égaux ou étagement ? Tous les éléments de la parole doivent entrer en mode comprimé simultanément * * NAL research Positionnement des différents phonèmes graves, médium et aigus de la parole (en anglais)
Comment régler les CK du grave à l'aigu : tous égaux ou étagement ? Tous les éléments de la parole doivent entrer en mode comprimé simultanément * * NAL research 100 1k 35 40 45 50 55 60 65 Fréquence (Hz) 8k Niveau en 1/3 d’octave (dB) 2k 4k 500 Spectre à long terme de la parole (LTASS) à 65 dB Cornelisse et al. 1991 18 dB 15 dB 12 dB Peu âgé / Très actif Très âgé / Peu actif Exemples :
Rapport de compression et intelligibilité Sonie UCL A T T A A T A T MCL HTL Intensité 60 120
Rapport de compression et intelligibilité Sonie I (dB) T A E (mv) + T (ms) E (mv) -
Rapport de compression et intelligibilité Sonie I (dB) T A E (mv) + T (ms) E (mv) -
Rapport de compression et intelligibilité Sonie I (dB) T A E (mv) + T (ms) E (mv) -
Réglage du CR : compensation du recrutement Une compression adaptée en CR doit parfaitement accorder les dynamiques CR = DN/DR 120 intolérance CR = 120/50 = 2.4 => TROP ! 100 inconfort UCL Audiogramme : - UCL = seuil d'inconfort - HTL = seuil de sensation 80 Normo entendant Malentendant 60 CR = 70/50 = 1.4 => BON ! 40 HTL Valeur pour une bonne base de départ CR = 70/DR (À ajuster ensuite selon les sensations du patient) 20 sensation dB 0 perception
À propos de compression et d'intelligibilité Considérations importantes sur les limites de la compression dans le bruit constant Dans un canal donné, la compression ne change pas le rapport Signal / Bruit (SNR) En effet, dans chaque canal le son le plus fort active l'AGC ; et à un instant t le gain dans ce canal sera le même pour le bruit fort et le signal plus faible Donc, la compression aura peu d'influence directe sur l'intelligibilité dans un environnement de bruit stable constant, sauf rares cas où parole et bruit sont dans des canaux différents (ex. vent) Spectre de bruit de vent Spectre de parole 80 75 70 65 60 Niveau en 1/3 d’octave (dB) 55 50 45 40 35 30 100 500 1k 2k 4k 8k Fréquence (Hz)
Emergences de l’enveloppe temporelle sur le bruit Enveloppe de la voix Action du compresseur AGC-I lent Enveloppe du bruit Action du débruiteur ERP Le débruiteur ERP agit comme un compresseur intelligent, inter syllabique
Axe temporel de la compression La compression a pour effet de réduire le gain quand le niveau d'entrée augmente, et d'augmenter le gain quand le niveau d'entrée diminue. niveau Signal en sortie Gain fort Gain faible Signal à l'entrée temps Ce phénomène s'applique aussi sur les variations de niveau de la voix dans le temps.
Les différentes modulations d'amplitude de la voix Modulations internes (enveloppe temporelle) : variations très rapides de niveau sonore avec l'alternance des phonèmes fortement ou faiblement énergétiques Ces changements de niveau sont beaucoup plus rapides et beaucoup plus brefs dans temps temps Modulations externes : niveau moyen de la voix quand l'interlocuteur se rapproche ou s'éloigne, quand il parle plus ou moins fort Ces changements de niveau se font relativement lentement et durent dans le temps
Composante temporelle de la compression et effet sur les modulations de la voix Traitement linéaire : pas d'amortissement des modulations vocales Compression lente (Duale): seules les modulations externes sont amorties, les modulations internes, trop brèves, sont traitées à gain fixe (CR effectif = 1) La structure temporelle interne de la voix (contraste temporel) est préservée Compression rapide (Syllabique) : les modulations internes sont aussi amorties La structure temporelle interne de la voix (l’enveloppe temporelle) est dégradée (CR effectif = CR)
Influence du choix Duale / Syllabique sur la parole et le bruit In Vivo, signal ISTS Paramètres TEST (CK = 42 dB & CR = 2.56) Duale Syllabique La dynamique vocale en Duale est d'environ 10 dB supérieure à celle de la Syllabique (@ CR 2.56)
Influence du choix Duale / Syllabique sur la parole et le bruit Bruit Blanc Paramètres TEST (CK = 42 dB & CR = 2.56) ISTS (parole) Même gain sur le bruit en Duale qu'en Syllabique Plus de gain sur la parole en Duale qu'en Syllabique ! Duale Syllabique
Influence du choix Duale / Syllabique sur la parole et le bruit Enveloppe de la voix Action de l’AGC-I en Duale Enveloppe du bruit Action de l’AGC-I en Syllabique La compression duale semble plus favorable à l’intelligibilité dans le bruit que la syllabique
Choix des composantes temporelles de la compression : Duale/Syllabique Le CR effectif sur les sons brefs augmente avec la rapidité des constantes de temps Signal vocal d'origine : Signal vocal amplifié compression Duale : intelligibilité dans le bruit : consonnes faibles moins perçues dans le calme si fort recrutement
Choix des composantes temporelles de la compression : Duale/Syllabique Le CR effectif sur les sons brefs augmente avec la rapidité des constantes de temps Signal vocal d'origine : Signal vocal amplifié compression Syllabique : audibilité des consonnes faibles : distorsion du signal (temporelle) : effet de pompage (possible dans les BF)
Choix des composantes temporelles de la compression : Duale/Syllabique La modulation moyenne de la voix est de 30dB Si la dynamique résiduelle du patient est 30 dB Choisir la Compression Syllabique Si la dynamique résiduelle du patient est ≥ 50 dB Choisir la Compression Duale Si la dynamique résiduelle du patient est comprise entre 30 & 50 dB, tester les deux ! En commençant par la syllabique dans les aigus pour les 1ers appareillages (+ de confort)
Influence du nombre de canaux indépendants de compression Compression multicanale : utilité et avantages par rapport à la monocanale 20 40 60 80 100 120 125 250 500 1k 2k 3k 4k 8k Perte auditive (dB HL) Fréquences (Hz) Utile sur les pertes avec des dynamiques différentes dans l’axe fréquentiel Améliore l'audibilité de tous les sons Améliore donc aussi la compréhension sur ces pertes Augmente le confort d'écoute Consonnes Voyelles
Influence du nombre de canaux indépendants de compression Niveau Niveau Sortie Entrée Fréq. Fréq. Un canal de compression = contraste fréquentiel intact. Deux canaux = contraste fréquentiel très légèrement diminué. Niveau Compression = modulation du gain selon le niveau pour les niveaux forts un gain faible pour les niveaux faibles un gain fort Plus il y a de canaux indépendants de compression, plus la sortie de l'appareil est lissée en fréquence Contraste fréquentiel & intelligibilité sont alors très diminués, dégradés Fréq. Huit canaux = contraste fréquentiel très gravement dégradé.
Influence du nombre de canaux indépendants de compression Compression multicanale : lissage fréquentiel du signal de sortie Pour l’intelligibilité du message vocal, les formants sont des indices acoustiques très utiles, ainsi que les vallées du spectre Donc la forme de l’enveloppe spectrale nous permet de reconnaitre un phonème, et de le différencier des autres (o ; i) La compression multicanale crée un lissage qui réduit les pics et remonte les vallées L’enveloppe fréquentielle du phonème est distordue, déformée Conséquence : l’intelligibilité est réduite Solution : couplage inter-canaux (1) : premier formant (2) : deuxième formant (1) /o/ (2) niveau (dB) (1) /i/ (2) 250 500 1000 2000 4000 Fréquences (Hz)
Compression multicanale avec couplage interactif Solution : compression multicanale avec couplage interactif Effet du Couplage InterActif Un élément émergent – comme un formant – doit rester émergent (préserve l'intelligibilité) Le canal du signal émergent et les 4 canaux adjacents sont couplés pour éviter le lissage fréquentiel À chaque instant " t " il y a 3 canaux indépendants de compression (série 700) pour conserver un bon contraste fréquentiel niveau d’entrée niveau de sortie Avec niveau de sortie Sans (1) : premier formant niveau (dB) /o/ (2) : deuxième formant 250 500 1000 2000 4000 16 canaux fréquentiels Fréquences (Hz)
Le réglage de la compression en résumé Premiers appareillages : CK : fonction du patient jeune ou très actif => seuils bas âgé ou très peu actif => seuils élevés seuils dégressifs du grave vers l’aigu CR : fonction de la Dynamique Résiduelle base de départ : 70 / DR Constantes de temps : fonction de la Dynamique Résiduelle DR ≥ 50 : Duale (lente) & DR ≤ 30 : Syllabique (rapide) 50 > DR > 30 : essai des deux, en commençant par Syllabique Renouvellements : Se caler sur les réglages de l’ancien appareillage le temps que le patient s’habitue à la transition
Un petit test pour terminer ? dB TA TRetour ? Compléter les courbes de gain et de sortie Sortie Gain Entrée T0 T1 Temps
Des questions ? La compression