SACD’s omzetten naar PCM 24bit 176.4KHz. Zin of onzin?
Waarin verschillen PCM en DSD van elkaar?
PCM (Pulse Code Modulation) is een erg abstracte manier om een analoog signaal op een digitale wijze te beschrijven, maar het was in de tachtiger jaren, toen de CD werd ontwikkeld en geïntroduceerd, de best beschikbare manier. In PCM bestaat elk sample uit een combinatie van bits (afhankelijk van het medium tussen de 14 en 20 bits) die de amplitude van het signaal beschrijft. Het aantal bits bepaalt de resolutie en daarmee de mate van detaillering waarmee het signaal wordt beschreven, waar bij elk extra bit het aantal niveaus verdubbeld wat kan worden onderscheiden.
Conversie van een analoog geluid naar PCM en weer terug naar een analoog geluid, heeft een behoorlijk aantal processtappen nodig zoals kwantisatie (een methode om analoge signalen te digitaliseren) Elke stap in dat proces veroorzaakt meer vervorming (zoals kwantisatie noise, wat veroorzaakt wordt door afrondingsfouten in het digitaliseringsproces) wat er weer uitgefilterd moet worden en derhalve afbreuk doet aan de geluidskwaliteit.
In het onderstaande plaatje wordt weergegeven hoe afrondingsfouten ontstaan bij kwantisatie van een analoog signaal naar PCM.
Door middel van dit plaatje wordt ook direct duidelijk, dat naarmate de sampling frequentie toeneemt, de foutmarge steeds kleiner zal worden en het signaal accurater bij het samplen van een analoog audiosignaal naar een PCM formaat.
DSD op zijn beurt, is een extreem eenvoudige manier om analoog om te zetten naar digitaal en visa versa. Het gehele proces is zeer transparant. In feite is de DSD bitstroom zo nauw gerelateerd tot het analoge signaal, dat als je het naar een speaker zou sturen (als een serie van +1 en -1 waarden) je hoorbare muziek terug krijgt. Door het signaal simpelweg door een ‘waveform shaping’ en lowpass filter te sturen, is DSD in staat om het originele audio signaal waarheidsgetrouw te reproduceren.
Naar een conclusie
Technologie heeft zich sinds het uitkomen van de CD verder ontwikkeld en zo ook het inzicht in de menselijke perceptie van geluid. Een voorbeeld hiervan is dat het pas veel later duidelijk werd dat, ondanks het feit dat het menselijk gehoor niet op een directe wijze frequenties kan oppikken onder de 20Hz en boven de 20kHz, deze frequenties van belang zijn voor de wijze waarop we geluiden horen. SACD met DSD heeft een technische frequentie range tot 100kHz, maar wordt hard gefilterd op 50kHz.
Een belangrijk verschil tussen een CD met 44.1kHz 16bit PCM geluidskwaliteit en een SACD met 2822kHz 1bit DSD geluidskwaliteit, is de accuraatheid van het signaal in het tijddomein. Het is gebleken dat het menselijk oor extreem gevoelig is voor zeer kleine timingverschillen. Van al de verschillende hersenfuncties, is plaatsbepaling van geluidsbronnen een erg belangrijke functie. Hierbij wordt vastgesteld wat de verschillen (in de tijd gezien) zijn voor geluiden die ons linker oor bereiken versus die voor het rechter oor. Met een sample frequentie van 44.100 keer per seconde is het lastig om een goede ‘soundstage’ te reproduceren. Dit lukt wèl indien er goede opname technieken zijn gebruikt, maar lang niet alle CD’s zijn in staat om een soundstage neer te zetten zoals een SACD dat doet. Op het gebied van plaatsing en soundstage blinkt DSD uit. Daar komt nog bij dat de ‘Dynamic Range’ van een SACD met 120dB een stuk beter uit de verf komt dan die van een CD (96dB)
De conclusie op basis van technologie
De hoge signaal accuratesse van DSD door zijn 64-voudige sample rate, aangevuld met een groter dynamisch bereik tot 120dB en een frequentiebereik van 50kHz, maken het zeer zinvol om de SACD ISO’s om te zetten naar 24bit 176.4kHz PCM. Het is overigens minder wenselijk om deze conversie uit te voeren naar 192kHz PCM vanwege de afrondingsfouten die ontstaan bij het resamplen van DSD en de vervorming die dit tot gevolg heeft.
Dat er afrondingsverschillen ontstaan, wordt duidelijk in het volgende tabelletje waar we een binaire deling loslaten op de DSD sample rate van 2822,4kHz en de uitkomsten afzetten tegen een 192kHz sample rate.
Zoals eerder in dit artikel beschreven, heeft DSD 44,1kHz als basis met een 1bit datastream en een oversampling rate van 64x. Het converteren van DSD naar 192kHz leidt dus tot een restwaarde van een groot aantal samples, wat ergens tijdens de conversie gecompenseerd moet worden.
De reproductie van PCM naar een audiosignaal, is op het niveau van 24bit 176.4kHz gelijkwaardig te noemen aan DSD. ‘Dubbelblinde’ luistertesten (case study Audio Engineering Society 2004) hebben tevens uitgewezen dat er geen hoorbare verschillen waarneembaar zijn op dat niveau.
De conclusie op basis van eigen ervaringen
Ik moet bekennen dat ik met veel plezier luister naar hoge-resolutie albums en dat er bij een groot aantal albums een verschil is te beluisteren in de ruimtewerking oftewel de soundstage. De plaatsing van 176,4 en 192kHz albums is wat beter dan bij 88 en 96kHz albums. Anderzijds zijn er ook hoge-resolutie albums, waarvan ik mij echt zit af te vragen of de weergave nu wel zoveel beter is als hetzelfde album in een lagere resolutie. Er zijn zelfs albums bij (uit de oude doos) waar je gratis Hi-Res ruis bij krijgt. Het is natuurlijk in alle gevallen zo, dat het eindresultaat nooit beter kan zijn dan het bronmateriaal. Met andere woorden: garbage in, garbage out. Maar gelukkig zijn er zat juweeltjes te vinden in het Hi-Res aanbod en luister ik er, zoals eerder gezegd, met veel plezier naar en soms ook met verwondering over de schoonheid van de muziek.
Bronnen:
- Sony: Super Audio CD DSD Decoder (Pdf)
- Technoworld: Key Chip for Next Generation of Audio (1999)
- Georgia State University: Hyperphysics
- PS3SACD.com
- Wikipedia
Beste Peter
Naar aanleiding van jouw melding dat CD slechts 96 dB dynamiek haalt is niet juist. Door het LSB (least significant bit ) te moduleren kan een verticale resolutie van ongeveer 110 tot 120 dB worden gehaald afhankelijk van de toegepaste techniek. Er bestaan een paar typen algoritmen die dat kunnen verwezelijken maar is het toevoegen van een 1/3 LSB ruis een gebruikte methode en staat bekend als dither. Deze dither wordt aan de opnamezijde toegevoegd. Het resultaat is dat een signaal wat op de grens ligt waarbij het onderste bit moet omklappen, door de ruis geholpen wordt. Eén en ander gaat te ver om dit hier goed uit te leggen overigens. Het resultaat is een pulsbreedte gemoduleerd signaal wat na het analoge filter zich gedraagt als een analoog signaal.
Slimmere Algoritmes zetten bijvoorbeeld bij 24 bits opnamen die geconverteerd moeten worden naar CD, de onderste 8 bits om naar een signaal wat het LSB van het 16 bits signaal wederom laat moduleren. Een oudere ontwikkeling was het z.g. Super Bit Mapping van Sony en waarbij een vergelijkbaar resultaat werd geboekt en claimde men hiermee een dynamiek van 120dB. Omgerekend is dat een resolutie van 20 bits. Het is onder andere hierdoor dat een gewone CD subliem kan klinken even aangenomen dat de opnametechnicus zijn uiterste best heeft gedaan het éé en ander goed te registreren.
Met vriendelijke groet,
Cees Ruijtenberg
Metrum Acoustics / All Engineering
Beste Cees,
Bedankt voor je reactie en uitgebreide uitleg. Je zult ongetwijfeld gelijk hebben, maar ik heb mijn verhaal gebaseerd op zaken waar ik kennis van het en die verifieerbaar zijn op basis van niet discutabel bronmateriaal. Mijn melding waar je over schrijft is een tabelletje uit een .pdf die je terug kunt vinden op de site van Sony. Als je met Google zoekt op:
“Sony: Super Audio CD DSD Decoder Pdf” dan vind je daar het betwiste tabelletje terug op de eerste pagina.
Met vriendelijke groet,
Peter Gelder