Digitale headroom


Om goed te kunnen begrijpen waarom headroom zo belangrijk is, leggen we eerst nog eens op een eenvoudige manier uit hoe een analoog audiosignaal digitaal gemaakt wordt.

Hoe is audio opgebouwd?

Audio is opgebouwd uit de som van een groot aantal sinussen. Sinussen zijn de bouwstenen van alle audiosignalen. Audiosignalen zijn altijd samengesteld uit sinussen van een bepaalde frequentie (in Hz, kHz) en een bepaalde spanning

in Volt (V), milli Volt (mV) of micro Volt (µV).

De frequentie van de sinus bepaalt de toon en de amplitude van de sinus bepaalt het volume.

Dergelijk signaal is wat men een “analoog” (audio)signaal noemt. Met een oscilloscoop kan je zo’n (audio)signaal ook zien.

De “Stereo Tool” gebruikers onder jullie zullen weten dat er in “Stereo Tool” een oscilloscoop functie zit die IN- en OUTPUT grafisch kan laten zien:

Van analoog naar digitaal

Op de oscilloscoop worden alle sinussen (de optelling ervan) weergegeven die in de audio te vinden zijn. 

Om op een duidelijke manier te laten zien hoe de analoge audio digitaal gemaakt wordt, gaan we een sinus met een fictieve frequentie en een fictief audioniveau bekijken:

Deze sinus gaan we nu digitaliseren door toepassing van sampling.

Sampling

Omdat een digitaal signaal uit “nulletjes en ééntjes” bestaat, zullen er van de sinus “staaltjes” genomen worden. Men noemt dit ook “bemonsteren” of in het Engels “sampling”.

Hoe meer staaltjes (samples) men neemt van die sinus, hoe gedetailleerder de sinus “bekeken” wordt.

Het aantal genomen samples (sampling rate) wordt uitgedrukt in “aantal samples per seconde”. Als eenheid wordt kHz (periode per seconde) gebruikt. In het voorbeeld van onze sinus hierboven, worden er per periode 28 samples genomen.

Voorbeelden uit de praktijk:

  • Bij een CD wordt 44.1 kHz (44 100 samples per seconde) gebruikt
  • Bij DAB+ wordt vooral 48 kHz (48 000 samples per seconde), 32 kHz (32 000 samples per seconde), 24 kHz (24 000 samples per seconde) en 16 kHz (16 000 samples per seconde) gebruikt (veel radiostations werken met 48kHz als sampling frequentie)

Hoogste audiofrequentie versus sampling rate

De hoogste audiofrequentie die correct weergegeven kan worden door het digitale signaal, hangt af van de gebruikte sampling rate. In theorie is de hoogste audiofrequentie die correct gedigitaliseerd kan worden, de helft van de gebruikte sampling rate.

Helaas liggen deze theoretische audiofrequenties iets lager omdat er aan de ingang van de “analoog digitaal conversie” absoluut geen frequenties MOGEN OPTREDEN die hoger zijn dan de helft van de sampling frequentie. Dit is nodig om het effect “aliasing” te voorkomen.

Aliasing veroorzaakt ongewenste componenten (sinussen) in het audiosignaal (vervorming van het audiosignaal) die we niet wensen).

De praktische frequenties zullen als gevolg van het imperfecte ingangsfilter meestal een tweetal kHz lager liggen:

  • hoogste audiofrequentie bij 48 kHz sampling rate is 22 kHz
  • hoogste audiofrequentie bij 44.1 kHz sampling rate is 20,05 kHz
  • hoogste audiofrequentie bij 32 kHz sampling rate is 14 kHz
  • hoogste audiofrequentie bij 24 kHz sampling rate is 10 kHz
  • hoogste audiofrequentie bij 16 kHz sampling rate is 6 kHz

Bit diepte

Ook het geluidsniveau (amplitude) van de sinus moet een “digitale waarde” krijgen. De amplitude van onze sinus zal bepaald worden door de “bit diepte” (audio bit depth).

Bij CD wordt bijvoorbeeld “16 bit” gebruikt.

Bij DVD en Blu-Ray wordt “24 bit” gebruikt

Bij pro-audio gebruikt men zelfs “32 bit”.

“Bit diepte”, ook wel “resolutie” genoemd, definieert het aantal mogelijke waarden dat een staaltje (sample) van onze sinus kan hebben en wordt aangeduid in “bits”.
Als de resolutie 1 bit is, zijn er slechts twee waarden mogelijk: 0 en 1.

Voor elke toegevoegde resolutie bit wordt het aantal mogelijke waarden vermenigvuldigd met twee:

2 bits = 4 digitale waarden
3 bits = 8 digitale waarden
4 bits = 16 digitale waarden
5 bits = 32 digitale waarden
6 bits = 64 digitale waarden
7 bits = 128 digitale waarden
8 bits = 256 digitale waarden
9 bits = 512 digitale waarden
10 bits = 1 024 digitale waarden
11 bits = 2 048 digitale waarden
12 bits = 4 096 digitale waarden
13 bits = 8 192 digitale waarden
14 bits = 16 384 digitale waarden
15 bits = 32 768 digitale waarden
16 bits = 65 536 waarden
20 bits =  1 048 576 waarden
24 bits = 16 777 216 waarden
32 bits = 4 294 967 296 waarden

Hoe meer bits men neemt, hoe preciezer we de amplitude van het audiosignaal kunnen vastleggen. In de praktijk resulteert dit in een hogere dynamiek en betere signaal ruisverhouding. De 3 meest gebruikte bit dieptes voor audio broadcasting hebben we even in het vet gezet.

Bit diepte versus geluidsniveau

We willen niet te diep in deze materie gaan, dat zou ons immers veel te ver leiden. Onthoud vooral dat “voor elke 1 bit toegevoegde resolutie, het dynamische bereik waarover een signaal correct kan worden opgenomen met 6 dB toeneemt”. 6dB is namelijk het dubbele (een audiosignaal is spanning).

M.a.w.: we zien dat voor elke bit meer, het dynamisch bereik met 6dB toeneemt.

Op de audiometer van “Adobe Audition (CS6)” (met in dit voorbeeld 24dB range) kunnen die bits als volgt voorgesteld worden:

Waar kan het in de praktijk fout lopen?

Het allerbelangrijkste bij streamen is dat het volume van de audio correct ingesteld wordt. Het audiovolume kan namelijk niet hoger gaan dan het dynamisch bereik, nml. het aantal bits die beschikbaar zijn.

Bij een audiometer voor digitale audio stopt de schaal op 0dB. Daarom wordt dat ook “0dB full scale (fs)” benoemd.

Verder GAAT NIET!

Wanneer we de schaal van een audiometer voor digitale audio vergelijken met de schaal van een analoge audioniveau meter, dan is er toch wel een heel groot verschil! Bij een VU meter voor het opnemen van analoge audio (zoals die op cassettedecks, bandopnemers en mengtafels te vinden zijn) gaat de schaal immers hoger dan 0dB.

Laten we beide schalen even onder elkaar zetten.

We vergelijken de schaal van een dB(fs) meter (volgens IEC 60268-18) met een (Amerikaanse) VU meter (volgens IEC 60268-17):

De regel is: “nul dB(fs)” moet als een muur beschouwd worden.

Verder gaan dan die “nul dB(fs)” is in principe onmogelijk omdat er simpel gezegd “geen bitjes meer zijn”.

Wanneer daar toch tegen gezondigd wordt, zal dat meteen te horen zijn in de vorm van gekraak. Eerst in de pieken van de muziek en als men het volume nog hoger wil maken, zal er op den duur enkel nog gekraak (en zelfs stilte) te horen zijn.

Headroom

Het is dus heel belangrijk om een “veiligheidsmarge” toe te passen: “headroom”.

In de pro-audio wereld wordt over het algemeen “min 18 dB(fs)” als norm gebruikt voor de maximale uitsturing van de audiometer. Men spreekt ook van “18 dB headroom”. In dat geval zijn er “drie bits” als reserve die eventuele pieken in het geluidsniveau van de audio kunnen opvangen.

Belangrijk om te weten:

  • zelfs bij sterk gecompresseerde audio kunnen nog steeds pieken van 4dB optreden
  • de uitgang van de decoder kan tot 1,7dB HOGER zijn dan wat je in de encoder stuurt

Lees ook eens de aanbeveling van de “Internationale Telecommunicatie Unie” i.v.m televisie en radio ITU-R BS.2054 (“Audio-levels and loudness”):

Vrij vertaald zegt men hier dat een niveau van 0 VU zelfs op -20 dBfs ligt. Voor de pieken is er een ruimte van 11dB voorzien zodat een headroom van 9dB vrij blijft om clipping te vermijden.

Headroom bij DAB+?

We zien dat veel “slechte DAB+ klank” klachten bij lokale radio’s te maken hebben met het oversturen van de “studio Link (STL)” en daarna waarschijnlijk eveneens het oversturen van de “DAB+ encoder” (op de uitgang van de STL kan door het encoderen en decoderen 1,7dB bijkomen).

Tijdens onze luistersessies en metingen ontdekten we dat er op de DAB+ muxen in Wallonië zo goed als altijd een headroom van ongeveer “min 6 dB(fs)” gebruikt wordt. Ook omroepen op de DAB+ muxen uit Nederland gebruiken sinds een tijdje 6dB headroom.

Met behulp van de limiters en/of clippers in de soundprocessing kan er natuurlijk voor gezorgd worden dat die “nul dB(fs)” niet overschreden wordt. Maar zelfs dan is het mogelijk dat de sinus na de “digitaal naar analoog omzetter (DAC)” toch overstuurd is. De oorzaak daarvan is een verhaal op zich, maar weet dat het kan gebeuren.

Natuurlijk willen veel radio omroepen zo luid mogelijk klinken. Elke lokale radio moet daarom zelf bepalen hoever men wil gaan in deze “war of loudness”.

Misschien moeten de Vlaamse (lokale) radio-omroepen samen eens overleggen om net zoals in Wallonië en Nederland “min 6dB(fs)” (of zelfs een nog grotere headroom) als norm te gebruiken voor de maximale uitsturing? Zo kan iedereen toch een bepaalde luidheid instellen zonder de (digitale) audio te oversturen.

DAB+ voor Gevorderden