Audio PC Upsampling

Oft wird behauptet, dass der Klang im DAC (Digital-to-Analog Converter) gemacht wird. Natürlich ist das so, aber nicht nur. Der DAC profitiert oft sehr von einer optimalen Aufbereitung der Musikfiles. Hintergrund dieser Überlegung ist, dass DACs ebenfalls eine digitale Signalverarbeitung durchführen, z. B. Oversampling, Sampling Rate Conversion, Noise Shaping und Dithering. Das DAC-interne Design kann von einer Zuspielung mit höheren Samplingraten zu besseren Ergebnissen kommen. Es kann natürlich auch anders herum funktionieren, also besseres Ergebnis bei Zuspielung mit niedrigerer Rate. Zusätzlich kann eine Begrenzung auf eine niedrigere Bitrate, z. B. auf 20 Bit statt 24 Bit, ebenfalls zu einer optimaleren Signalverarbeitung im DAC führen. Letztendlich soll die Auslagerung bestimmter Teile der Signalverarbeitung auf einen Audio PC den DAC in seinem Sweet Spot arbeiten lassen.

Das Upsampling beim T+A SD(V) 3100 HV

Folgend zitieren wir aus einem Text (übersetzt), welcher vom ehemaligen Leiter F&E (T+A 1989-2021) anlässlich der Vorstellung des T+A SD(V) 3100 HV DACs geschrieben wurde:

Die Umwandlung in Ultra-High-Rate-DSD kann auf viele Arten erfolgen, aber nur die allerbesten Algorithmen bringen eine optimale Leistung. Die für solche Algorithmen benötigte Rechenleistung ist extrem und kann am besten mit sehr leistungsstarken PCs (und GPU-Co-Processing) erreicht werden. Daher überlassen wir die Aufgabe der Konvertierung/Upsampling spezialisierten Programmen wie HQPlayer und konzentrieren uns darauf, eine bestmögliche D/A-Wandlung mit den ultrahochratigen DSD-Signalen durchzuführen, die vom Audio-PC geliefert werden. Außerdem ist es nur mit einem PC-basierten Upsampling möglich, die große Anzahl von Algorithmen zu unterstützen, wie es beispielsweise der HQPlayer tut. Dieser Ansatz ist auch sehr zukunftssicher, da sowohl die Upsampling-Software als auch die PC-Hardware einfach aufgerüstet werden können, wenn neue Algorithmen verfügbar werden und leistungsstärkere Prozessoren auf den Markt kommen. Ein solch einfaches Upgrade ist fast unmöglich, wenn die Konvertierung ein integraler Bestandteil des DAC ist. Beim PCM-Upsampling sieht es etwas anders aus. Hier wird weniger Rechenleistung benötigt und das Upsampling kann gut integriert werden – wie es bei den T+A DACs der Fall ist. Aber auch mit PCM ist es möglich, das Upsampling extern durchzuführen und PCM 768 direkt an den DAC zu senden, wobei die interne Verarbeitung vollständig umgangen wird.

Quelle: Audiophilestyle.com

Rendern

Musikdateien liegen in Codecs vor, zum Beispiel FLAC (Free Lossless Audio Codec). Bevor die Musik dem DAC zugeführt werden kann, muss die Datei ausgepackt und in ein abspielbares Format PCM (Puls-Code-Modulation) oder DSD (Direct Stream Digital) decodiert werden. Dies findet in unserem Fall im Audio PC statt.

Abtastrate (Abtastfrequenz, Samplingrate)

Die Abtastrate bestimmt den Frequenzbereich, also das hörbare Spektrum. Die analoge Amplitude muss über die digitale „0“ oder „1“ nachgebildet werden. Für PCM wird dabei die Amplitude zum Beispiel 44.100fach pro Sekunde (44.1 kHz) abgetastet. Die Bandbreite ist dabei auf die Hälfte, nämlich auf 22.05 kHz beschränkt. Grundlage ist das Nyquist-Shannon-Abtasttheorem. Dabei wird das Originalsignal mit einer Rate abgetastet, die mehr als doppelt so hoch wie die höchste im Signal vorkommende Frequenz ist. Wird das Abtasttheorem durch eine zu niedrige Abtastrate verletzt, so werden Frequenzanteile, die ursprünglich höher waren als die halbe Abtastrate (Nyquist-Frequenz), als niedrigere Frequenzen interpretiert, da für diese eine Unterabtastung stattfindet. Dieses unerwünschte Phänomen wird Alias-Effekt genannt.

Dafür gibt es Anti-Aliasing Filter (Tiefpassfilter), die bei einer 44.1 kHz Quelle sehr steil ausfallen müssen. Idealerweise außerhalb des Hörspektrums ab 20 kHz. Je nach Implementierung im DAC kann die Dämpfung leider schon ab 1kHz einsetzen, was sich auch auf den Frequenzgang (siehe grüne Linie im Bild unten) auswirkt.

Quelle: Audiopile Style HQPlayer

Bei einer höheren Abtastrate wird dagegen im Vergleich zu einer CD die reproduzierbare Frequenz erhöht. Der Anti-Aliasing Filter setzt erst weit im unhörbaren Frequenzspektrum ein und kann dadurch auch einfacher (flacher) ausfallen. Bei HighRes Audio ab 88.2 kHz ist das eine prima Sache. Anders sieht es bei einer Quellrate von 44.1 kHz aus. Wird diese auf zum Beispiel 705,6 kHz (geradzahlig das 16-fache) hochgerechnet, muss trotzdem ein steiler Filter genommen werden. Die tiefste Samplingfrequenz in der Verarbeitungskette dominiert die nötige Steilheit. Der Vorteil dies vom Audio PC durchführen zu lassen, besteht dann in den mutmaßlich besseren Algorithmen (je nach Software) und der höheren Rechenleistung. Der DAC wiederum sieht die niedrige Quellrate gar nicht mehr, sondern nur noch das Audiosignal mit 705,6 kHz.

Daraus folgt zugleich, dass eine höhere Abtastrate nicht etwa zu einer feinstufigeren Abtastung des Signals führt, wie oft behauptet wird, sondern immer nur die Bandbreite erhöht.

Bei DSD ist dagegen die Abtastrate deutlich höher. Sie liegt bei mindestens 2.8224 MHz. Das entspricht dem 64-fachen (DSD64) der Abtastrate einer CD von 44.1 kHz. Eingeführt wurde das DSD Verfahren als Super-Audio-CD (SACD). In modernen DACs können mittlerweile Daten bis zu DSD 1024 verarbeitet werden.

Gegenüberstellung der Bandbreite von PCM und DSD:

PCM Frequenzgänge
PCM 44.1: 2 Hz -20 kHz 
PCM 48 : 2 Hz -22 kHz
PCM 96 : 2 Hz -40 kHz

PCM 192 : 2 Hz -80 kHz
PCM 384 : 2 Hz -100 kHz
PCM 768 : 2 Hz -120 kHz
DSD Frequenzgänge


DSD  64: 2 Hz -44 kHz
DSD 128: 2 Hz -60 kHz
DSD 256: 2 Hz -80 kHz
DSD 512: 2 Hz -100 kHz
DSD 1024: 2 Hz -120 kHz
Quelle: T+A SD(V) 3100 HV

Bei einem Hörvergleich zwischen PCM und DSD soll die gleiche Bandbreite verglichen werden. Also zum Beispiel PCM 192 mit DSD 256.

Bittiefe (Auflösung, Wortlänge)

Die Wortlänge/Wortbreite in Bit (Bit Depth) codiert die Lautstärke des analogen Signals (Laut/Leise).  1 Bit entspricht 6 dB Pegeldifferenz. Die CD mit 16 Bit ermöglicht 65.536 (216) verschiedene Signalpegel zu erfassen. Eine CD mit 16 Bit x 6 dB erreicht 96 dB Dynamikumfang. HD (High Definition) mit 24 Bit x 6 dB erreicht theoretisch 144 dB Dynamikumfang. Der technische Stand begrenzt in der Regel die Auflösung auf bis zu 20 Bit = 120 dB.

Eine große Bedeutung der Bittiefe liegt zum Beispiel in der Verwendung der Convolution (Faltung für die digitale Raumkorrektur) und in der digitalen Lautstärkteregelung. Hier soll die Bittiefe bei mindestens 32 Bit, besser 64 Bit liegen, damit durch genügend Headroom keine Informationen verloren gehen. Eine Erhöhung der Bittiefe ist unproblematisch, da sie die Abtastrate und damit die Rekonstruktion der Amplitude nicht beeinflusst.

DSD funktioniert anders, da nur 1 Bit bestimmt, ob der aktuelle Abtastwert der analogen Wellenform höher oder niedriger als der vorherige ist. Deshalb lassen sich DSD Dateien mit 1 Bit im Tonstudio nicht nachbearbeiten. Dieser Mangel wird durch die deutlich höhere Abtastrate kompensiert, siehe oben. Das hochfrequente Rauschen wird durch Noise Shaping herausgefiltert und ermöglicht einen Dynamikumfang von 120 dB.

Dithering

Bei PCM entstehen Quantisierungsfehler. Das Dithering beschreibt eine Methode, die diese Fehler abmildern kann. Diese Fehler treten sowohl bei der Digitalisierung als auch bei digitalen Rechenoperationen mit Signalen auf. Statt störender Verzerrungen entsteht ein weniger störendes gleichmäßiges Rauschen, das dem eines analogen Verstärkers ähnelt.

Formatumwandlung

Eine weitere Besonderheit stellt die Formatumwandlung von PCM auf DSD (oder umgekehrt) dar. Dabei kommt es nicht auf das Quellformat an, sondern auf das Format, welches der DAC erhält. Es gibt sogar einige Hersteller, die das im DAC selbst machen. Zum Beispiel Ed Meitner DACs oder PS Audio DirectStream DACs rechnen eingehendes Material auf DSD um. T+A empfiehlt dagegen die Nutzung eines Audio PCs, weil die Rechenleistung viel besser ist als in einem DAC. DSD wird von vielen aufgrund seines analoghaften Klangs sehr geschätzt.

HQPlayer

Der HQPlayer ist ein hochwertiger Audio-Player für Windows, Linux und MacOS. HQPlayer bietet außerdem mehrere auswählbare hochqualitative Oversampling- und Downsampling-Algorithmen sowie auswählbare Dither-, Noise Shaping- und Modulator-Algorithmen. Die Auswirkungen von Filtern auf den Klang sind verblüffend. Siehe Audio PC HQPlayer Filtereigenschaften.

Alle modernen DACs verwenden Oversampling und Delta-Sigma-Modulation, jedoch sind die Hardware-Implementierungen mehr oder weniger ressourcenbeschränkt. Oversampling und Delta-Sigma-Modulation mit höherer Qualität können durchgeführt werden, indem die in modernen PCs verfügbare enorme Rechenleistung genutzt wird.

DSD Modulatoren

Mit der HQPlayer Version 4 wurde neue EC Modulatoren eingeführt. EC steht für „Extended Compensation“. Diese neuen Modulatoren bieten eine deutlich bessere Genauigkeit. Besonders gut in Kombination mit Filtern wie Poly-Sinc-Ext2 und Poly-Sinc-Xtr. Der Nachteil ist, dass die EC Modulatoren eine sehr hohe Rechenleistung benötigen. Entscheidend ist eine hohe Taktfrequenz der CPU Kerne.

SQ (Soundqualität)

Je feinauflösender ein System ist, desto hörbarer ist die Qualität der Algorithmen. Unten im Bild ist ein Beispiel, wie ein von Roon gestreamtes Hi-Res FLAC-File mit 96kHz/24bit nativ an den HQPlayer gesendet wird. Der HQPlayer verwendet den hochwertigen Filter sinc-M mit einer Million Tabs. Für die Formatumwandlung von PCM auf DSD 256 wird der hochpräzise Modulator ASDM7EC genutzt. Der Klang ist detailliert ohne Schärfen mit einer grandiosen Raumausleuchtung und sensationeller Instrumententrennung.