Veröffentlicht am

Eine Grafikkarte für Audio nutzen

Einleitung

Von einem Leser wurde ich gebeten einen Beitrag zur Nutzung einer Grafikkarte für Audio zu schreiben. Das hört sich erstmal eigenartig an, weil die Grafikkarte primär die Aufgabe hat, einen Bildschirm anzutreiben. Tatsächlich können moderne Grafikkarten zum Beispiel für das Schürfen von Bitcoin oder für die Nutzung künstlicher Intelligenz verwendet werden oden eben für das Upsampling von Audiodateien mit dem HQPlayer.

In den Grundlagen sehen wir uns die benötigte IT-Architektur und Beispiel-Grafikkarten an und im Praxisteil die mögliche Nutzung mit dem HQPlayer. Aber ich werde auch eine Alternative vorstellen.

Grundlagen

CUDA (Compute Unified Device Architecture)

CUDA ist eine parallele Rechenplattform und Programmierschnittstelle (API), die von NVIDIA entwickelt wurde, um die Rechenleistung von GPUs (Graphics Processing Unit) für allgemeine Berechnungen (nicht nur Grafikverarbeitung) zu nutzen. Die IT-Architektur ermöglicht eine massive Parallelverarbeitung. Denn die GPUs (Graphics Processing Units) bestehen aus einer großen Anzahl kleiner, effizienter Recheneinheiten, die viele Berechnungen gleichzeitig durchführen können.

CUDA nutzt diese Architektur, um Berechnungen parallel auszuführen, im Gegensatz zu CPUs (Central Processing Units), die auf weniger Kerne setzen. Typische Anwendungsbereiche sind:
• Wissenschaftliche Berechnungen
• Maschinelles Lernen und KI
• Bild- und Videobearbeitung
• Finanzmodelle
• Simulation und Rendering

Beispiel-Grafikkarten

Aufgrund der Systemarchitektur kommen meines Wissens nur Grafikkarten von NVIDEA in Frage. Grafikkarten benötigen sehr viel Strom, sind meist sehr groß und müssen in der Regel aktiv gekühlt werden. Die unten genannten Grafikkarten wurden von Jussi Lako erwähnt, dem Schöpfer des HQPlayers.

NVIDIA RTX 4500

Die NVIDIA RTX™ 4500 Ada Generation, basierend auf der NVIDIA Ada Lovelace Architektur, kombiniert 60 RT-Cores der dritten Generation, 240 Tensor-Cores der vierten Generation und 7.680 CUDA® Recheneinheiten. Der GPU-Speicher hat auskömmliche 24 GB GDDR6 mit Error Correction Code (ECC).

Es stehen vier DisplayPorts 1.4a zur Verfügung. Die max. Leistungsaufnahme beträgt 210W. Es wird ein Steckplatz 16x PCIe der 4. Generation als Dual Slot im Full Height Profil benötigt. Die Kühlung erfolgt aktiv.

Quelle: https://www.nvidia.com/de-de/design-visualization/rtx-4500/

NVIDIA L4 Tensor Core GPU

Eine interessante Alternative ist die industrielle NVIDIA L4 Tensor Core GPU, welche gleich ganz auf Bildschirmanschlüsse verzichtet und einen geringeren Platzbedarf hat.

Die PCIe-Karte mit Low Profil und halber Länge benötigt einen Steckplatz mit x16 PCIe Gen4-Konnektivität. Der Grafikspeicher liegt bei 24 GB GDDR6. Die maximale Leistungsaufnahme beträgt 72 W. Es handelt sich um eine passiv gekühlte Karte mit einem thermischen Design, die für den Betrieb allerdings einen Systemluftstrom (Gehäuselüfter) benötigt.

Quelle: https://www.nvidia.com/de-de/data-center/l4/

Ein Zitat von Jussi Lako:

Scheint in der Leistung irgendwo zwischen RTX 4000 und 4500 zu landen. Näher an RTX 4000 als 4500 und bietet 75 % der Leistung von 4500.

Quelle: https://audiophilestyle.com/forums/topic/26752-best-nvidia-cuda-card-for-hqplayer/page/14/#findComment-1298964

GeForce-RTX-50-Serie

Die nächste Generation steht schon in den Startlöchern. Am 6. Januar wird NVIDIA auf der CES eine Keynote halten, auf der die GeForce-RTX-50-Serie vorgestellt wird.

Filter im HQPlayer

Bei einer CD (44,1 kHz) darf der hörbare Bereich nur bis maximal 22,05 kHz gehen. Grundlage ist das Nyquist-Shannon-Abtasttheorem, welches nur die halbe Abtastrate (Nyquist-Frequenz) berücksichtigen soll. Wird das Abtasttheorem durch eine zu niedrige Abtastrate verletzt, so werden Frequenzanteile, die ursprünglich höher als die halbe Abtastrate waren, als niedrigere Frequenzen interpretiert, da für sie eine Unterabtastung stattfindet. Dieses unerwünschte Phänomen wird Alias-Effekt genannt. Diese sogenannten Spiegelfrequenzen sollen durch Filter ausgesperrt werden, weshalb dieses Filter oft auch Antialiasing-Filter genannt werden. Der HQPlayer bietet sehr hochwertige Filter an, die je nach Ausgestaltung sehr viel Rechenleistung und Arbeitsspeicher benötigen.

Filter werden aber auch bei der digitalen Raum- und Lautsprecherkorrektur verwendet. Hierbei handelt es sich um sogenannte Faltungsfilter (Convolution).

Ein weiterer Filter stellt die sogenannte DAC-Korrektur dar. Diese Korrekturen gibt es nur für DACs, die HQPlayer vorher gemessen hat. Die Liste erweitert sich beständig.

Die DAC-Korrektur wird wie ein Filter eingebunden und erhöht entsprechend die Anforderung an den Audio PC. Inklusive Convolution ergibt sich so eine doppelte Rechenlast. Womit ich gut zum eigentlichen Thema überleiten kann.

CUDA für die Auslagerung von Filtern verwenden

CUDA Offload kann eine nVidia GPU nutzen, um die Verarbeitung teilweise von CPU zu GPU zu entladen. CUDA Offload erfordert eine nVidia-GPU mit minimaler Rechenleistungsstufe 5.2, 2 GB Grafik-RAM und den neuesten offiziellen nVidia-Treibern. Wenn Offload aktiviert ist und eine geeignete GPU verfügbar ist, wird die Nachricht über das Ausladen kurz zu Beginn der Wiedergabe jeder Spur angezeigt. Wenn CUDA Offload aktiviert ist, sollte auch Multicore DSP aktiviert oder bei der automatischen Einstellung belassen werden, um die beste Leistung zu erzielen. Wenn die CUDA-Offload-Checkbox ausgegraut ist, werden nur Faltungsalgorithmen auf die GPU ausgelagert.

Neu ist, dass die Arbeitslast auf zwei separate GPUs aufgeteilt werden kann. Dieselbe oder eine andere GPU kann separat für die Durchführung von Filtern und anderen DSP-Aufgaben sowie für die Faltung und andere große Operationen ausgewählt werden.

Wichtig ist hierbei, dass die GPU schnell genug ist, um mit der CPU mithalten zu können. Sonst kommt es zu Aussetzern. Bei langen Filtern ist außerdem ein ausreichend großer Grafikspeicher erforderlich, der idealerweise bei mindestens 16GB liegt.

Die Modulatoren für die Umrechnung in DSD laufen immer über die CPU.

Die Alternative: E-Cores für die Auslagerung von Filtern verwenden

Dabei werden die P-Cores (Performance Cores) für die anspruchsvollen Aufgaben und die E-Cores (Efficient Cores) für leichtere Aufgaben verwendet. Der HQPlayer verwendet die P-Cores für die Modulatoren. Und zwar je einen pro Kanal. Für Stereo sind es also zwei P-Cores. Der HQPlayer ermöglicht seit kurzem, die E-Cores für die Filter zu verwenden.

Unten im Bild werden zwei P-Cores mit 4GHz Taktfrequenz für die Modulatoren und insgesamt 16 E-Cores mit 3GHz für die Filter verwendet. Der durchschnittliche Stromverbrauch liegt bei niedrigen 45A, welches mit einer GPU niemals zu realisieren wäre.

Zusammenfassung

Die Nutzung von CUDA für die digitale Signalverarbeitung ist eine feine Sache für denjenigen, der sowieso einen Gaming-Rechner mit einer leistungsfähigen Grafikkarte im Einsatz hat. Dieser Rechner soll in einem separaten Raum stehen, damit die Lüfter nicht stören. Mit HQPlayers NAA kann dann zum Beispiel auf einen rauscharmen Endpunkt gestreamt werden.

Für den fis Audio PC, der komplett lüfterlos ist, ist CUDA kein geeignetes Konzept. Allein der hohe Stromverbrauch macht die rauscharme Stromversorgung mit einem linearen Netzteil unmöglich.

Aufgrund der in allen fis Audio PCs genutzten Hochleistungs-CPUs ist CUDA allerdings auch nicht notwendig, da die E-Cores für die Auslagerung der Filter verwendet werden können.


Du hast Fragen oder möchtest etwas beitragen? Schreibe uns: Kontaktformular
Oder schreibe per E-Mail an: info@griggaudio.de


Disclaimer

Alle Informationen, die du unter Grigg Audio Solutions findest, wurden nach besten Wissen und Gewissen sorgfältig recherchiert und mit Quellenangaben belegt. Irrtümer sind jedoch nie auszuschließen. Wenn du die Informationen für eigene Nachbauten oder Softwareeinstellungen verwendest, machst du das immer auf eigene Gefahr.


Offenlegung finanzieller Interessen

Grigg Audio Solutions bietet Lösungen für die digitale Musikwiedergabe an. Aufgrund der Vielzahl von Lösungswegen und unterschiedlichen Zielbilder kann nur eine bestimmte Auswahl der Hardware und der Software vorgestellt und besprochen werden. Grigg Audio Solutions ist ein gewinnorientiertes Einzelunternehmen. Auch wenn Grigg Audio Solutions Wert auf eine faire ausgewogene Informationsweitergabe legt, soll jeder Leser aus Transparenzgründen wissen, wo die Berichte finanzielle Interessen berühren können.

Damit du die Berichte besser einschätzen kannst, machen wir dich auf die Marken aufmerksam, mit denen Grigg Audio Solutions in Geschäftsverbindung steht: