Veröffentlicht am

Die Umsetzung meines neuen Hörzimmers

Einleitung

Die Planung eines neuen Hörzimmers wurde in den letzten Monaten in die Praxis umgesetzt.

Bis auf wenige Kleinigkeiten wurde alles mit sehr gutem Ergebnis gemäß meiner Planung verwirklicht.

Grundlagen

Den richtigen Hörabstand finden

Es handelt sich um einen 3,7 m x 4,7 m kleinen Raum. Bei rund 17 m² ist klar, dass ein Fernfeldhören nicht möglich ist.

Sehen wir uns kurz die Unterschiede an:

Fernfeldhören

Das Fernfeldhören beschreibt das Hören in größerer Entfernung zur Schallquelle oder zum Lautsprecher. Hierbei ist der Zuhörer in der Regel mehrere Meter oder sogar viele Meter von der Schallquelle entfernt. Im Fernfeld sind die Reflexionen von Wänden, Decken und Böden sowie die Raumakustik stärker wahrnehmbar. Diese Reflexionen können den Klang beeinflussen und zu einer gewissen Klangverfärbung führen.

Für das Fernfeldhören eignen sich oft Hornsysteme, welche den Schall stärker auf den Zuhörer bündeln können.

Nahfeldhören

Das Nahfeldhören bezieht sich auf das Hören in unmittelbarer Nähe zum Schallquellenpunkt oder Lautsprecher. In diesem Fall befindet sich der Zuhörer relativ nahe am Lautsprecher, typischerweise in einem Abstand von weniger als einem Meter. Beim Nahfeldhören dominieren die direkten Schallwellen, die direkt von der Schallquelle zum Zuhörer gelangen, während die Reflexionen und Einflüsse der Raumakustik minimiert werden. Dadurch wird ein präziserer und detaillierterer Klang erzeugt.

Nahfeldmonitore werden oft in Tonstudios verwendet, da sie den Tontechnikern ermöglichen, feine Details in der Musikproduktion zu hören und Abmischungen zu präzisieren.

Der Kompromiss: Hören im Mittelfeld

Bei meinen Sonus Faber Amati Futura Lautsprecher handelt es sich um ein 3,5 Wegesystem. Der untere 22 cm Tieftöner blendet sich bei 80 Hz aus, der zweite Tieftöner geht bis 220 Hz, der Mitteltöner geht bis 3.300 Hz, ab da übernimmt der Hochtöner. Der Frequenzbereich liegt zwischen 20 Hz und 30 kHz (in Abhängigkeit der Aufstellung im Raum).

Bei Mehrwegesystem wie diesen geht kein Nahfeldhören, da man sonst die einzelnen Chassis heraushören würde. Das Hören im Fernfeld ist aufgrund des breit streuenden Lautsprechers nicht ratsam. Der Kompromiss liegt also im Hören im Mittelfeld zwischen 2 – 3 m.

Raummoden kalkulieren

Der Schall unterliegt Gesetzmäßigkeiten, die berechnet werden können. Raummoden entstehen durch Reflexionen von Schallwellen an den Wänden, Decken und Böden eines Raums. Diese Reflexionen führen dazu, dass sich Wellen in bestimmten Bereichen des Raums verstärken und in anderen Bereichen abschwächen. Bei einer halben Wellenlänge (hin und zurück) zwischen zwei parallelen Wänden tritt eine Erhöhung der Lautstärke (Peak) auf. Bei einer viertel Wellenlänge wird dagegen der Bass ausgelöscht (Dip).

Schröderfrequenz

Die Schröderfrequenz bezieht sich auf eine wichtige Kennzahl in der Raumakustik, benannt nach dem bekannten deutschen Physiker Manfred R. Schröder. Sie ist definiert als die Frequenz, unterhalb derer sich Schallwellen im Raum hauptsächlich als Strahlung ausbreiten und oberhalb derer sich Schallwellen hauptsächlich als Wellenverhalten manifestieren.

In einem typischen Raum werden Schallwellen durch Reflexionen an den Wänden, Decken und Böden reflektiert. Bei niedrigen Frequenzen ist die Wellenlänge des Schalls im Vergleich zur Raumgröße groß genug, dass der Schall hauptsächlich als geradlinige Strahlung betrachtet werden kann. Bei höheren Frequenzen wird die Wellenlänge kleiner und die Reflexionen werden dominanter, was zu einem komplexeren Wellenverhalten führt.

Die Schröderfrequenz wirkt sich im Bass sehr störend aus. Das liegt vor allem an den großen Wellenlängen, die sich nach einer einfachen Formel berechnen lassen: Schallgeschwindigkeit 343m/sec geteilt durch Frequenz gleich Wellenlänge

  • 343m/sec : 100Hz = 3,43m Wellenlänge
  • 1/2 = 1,72 Wellenlänge = Erhöhung
  • 1/4 = 0,86 Wellenlänge = Auslöschung

Die Schröderfrequenz ist für jeden Raum unterschiedlich und hängt auch von der Nachhallzeit ab. Bei einer typischen Nachhallzeit von 0,6 Sek. geht der kritische Bereich in meinem Raum bis 230 Hz. Bei meiner derzeitigen Nachhallzeit von 0,3 Sek. reduziert sich der kritische Bereich auf 163 Hz.

Kalkulatoren gibt es im Internet: Akustikrechner: Raummoden (acoustic.ua) oder Raummoden Rechner – Trikustik.

Simulation der Raummoden

Glücklicherweise gibt es für die Kalkulation den hunecke.de | Lautsprecher-Rechner. Als erstes werden die Bauweise und Maße des Raums erfasst. Als zweites habe ich die Lautsprecher konfiguriert. In meinem Fall als klassisches Stereo Setup. Es können sogar Absorberelemente für den Nachhall konfiguriert werden – das war wahrscheinlich der ursprüngliche Zweck dieser Seite. Das Schöne ist, dass die Positionen der Lautsprecher, als auch der Sweet Spot beliebig mit der Maus verschoben werden können. Mit dem Verschieben ändert sich der angezeigte Frequenzbereich im Bass. Außerdem werden mit roten und grünen Quadern die besten Hörpunkte angezeigt.

Das Ziel liegt in einer möglichst gleichmäßigen Basswiedergabe. Bei kleinen Räumen eine Unmöglichkeit. Irgendwas ist immer. Deshalb kann man nur versuchen, die Peaks und Dips gering zu halten.

Nach einigem Ausprobieren könnte der Hörabstand bei ca. 2,2 m und die Basisbreite der Lautsprecher bei ca. 2,3 m liegen. Ein gleichseitiges Stereodreieck muss nicht immer sein, aber es muss mindestens gleichschenklig sein. Damit habe ich in anderen Räumen sehr gute Erfahrungen gemacht.

Unten im Bild ist eine Erhöhung um 20 dB des Basses bei 40 Hz zu sehen. Leider auch zwei Auslöschungen um 10 dB bei 60 Hz und 70 Hz. Zum Glück alles sehr schmalbandig. Hier ist für mich klar, dass in jedem Fall eine digitale Raumkorrektur erfolgen muss. Diese Hörsituation mit Raummoden wird bei den meisten so sein.

Strikte Symmetrie

Wenn ich eins bei der Aufstellung der Lautsprecher gelernt habe, dann ist es die zentimetergenaue Beachtung der Symmetrie. Ich verwende dafür einen Laser Entfernungsmesser. Denn der Schall soll beim linken Ohr genauso zeitrichtig ankommen wie beim rechten Ohr. Das gelingt nur, wenn idealerweise die Rückenwand-/ und Seitenwandabstände und möglichst auch die Beschaffenheit exakt identisch sind. Hier kann man oder muss man sogar mit Absorbern und Diffusoren nachhelfen. Siehe auch mein Newsletter: Wie du deine HiFi-Anlage besser nicht aufstellst – ein Erfahrungsbericht.

Absorber

Akustische Absorber dienen dazu, Schallenergie zu absorbieren und zu reduzieren. Sie absorbieren Schallwellen, indem sie sie in mechanische Energie (meistens in Form von Wärme) umwandeln. Absorber werden verwendet, um Nachhall und störende Schallreflexionen in einem Raum zu reduzieren. Dadurch wird die Klangqualität verbessert, da unerwünschte Schallwellen, die an Wänden, Decken und Böden reflektiert werden, minimiert werden.

Akustische Absorber bestehen häufig aus porösen Materialien wie Schaumstoff, Mineralwolle oder speziellen Schallabsorptionsplatten. Sie werden in der Regel an den Wänden, Decken oder in Ecken eines Raumes angebracht, um eine effektive Schallabsorption zu erreichen.

Diffusoren

Akustische Diffusoren werden verwendet, um Schallwellen in verschiedene Richtungen zu streuen oder zu verteilen, anstatt sie zu absorbieren. Wenn Schallwellen auf eine glatte Oberfläche treffen, werden sie normalerweise reflektiert, wodurch starke und gerichtete Reflexionen entstehen können. Diffusoren sind so konstruiert, dass sie diese Reflexionen aufbrechen und in verschiedene Richtungen streuen, was zu einer gleichmäßigeren Verteilung des Schalls im Raum führt.

Durch den Einsatz von Diffusoren wird der Raumklang diffuser und angenehmer, da störende Schallreflexionen reduziert werden, ohne den Raum zu „trocken“ wirken zu lassen, wie es bei einer übermäßigen Schallabsorption der Fall sein könnte.

Diffusoren können in verschiedenen Formen und Materialien ausgeführt werden, einschließlich gewellter Oberflächen, Lamellenstrukturen oder geometrischer Muster. Sie werden häufig an den Rückwänden, Seitenwänden oder Decken eines Raumes platziert, um die Reflexionen zu kontrollieren und eine bessere Klangqualität zu erzielen.

Nachhallzeit

Die optimale Nachhallzeit in geschlossenen Räumen ist von entscheidender Bedeutung für die Akustik und den Komfort in diesen Räumen. Nachhallzeit bezieht sich auf die Zeit, die benötigt wird, damit der Schallpegel in einem Raum nach dem Abschalten der Schallquelle abnimmt.

Eine angemessene Nachhallzeit trägt zu einer besseren Sprachverständlichkeit, einer angenehmen Hörumgebung und einer verbesserten klanglichen Wiedergabe bei. In Räumen mit zu langer Nachhallzeit kann der Schall mehrfach reflektiert werden, was zu einem unklaren Klang führt und die Sprachverständlichkeit beeinträchtigt. Besonders in Veranstaltungsorten wie Theatern, Konzertsälen oder Konferenzräumen ist eine klare Sprachübertragung entscheidend.

Eine optimale Nachhallzeit ist wichtig für die korrekte Wiedergabe von Musikinstrumenten und Gesang. Zu viel Nachhall kann die Klangqualität beeinträchtigen, indem einzelne Töne verschwimmen oder die Klangtextur verloren geht. In der Regel soll die Nachhallzeit 0,6 Sekunden nicht überschreiten.

Umsetzung in der Praxis

Aufstellung der Anlage und der Akustikelemente

Der Raum

Bei einem rechteckigen Raum dreht sich als erstes die Frage darum, ob die Lautsprecher auf die kurze Wandseite oder auf die lange Wandseite gestellt werden. Wie im Bild unten zu sehen ist, habe ich mich aufgrund der Symmetrie für die kurze Seite entschieden. Würde ich die lange Seite nehmen, wäre auf der einen Seite die Tür und auf der anderen das Fenster, die den Schall unterschiedlich reflektieren würden. Die Hörplatz müsste näher an die Rückwand positioniert werden, was ebenfalls ungünstige Schallreflexionen begünstigen würde.

Zufälligerweise ist das bodentiefe schallharte Fenster genau mittig im Raum und wurde mit einem Akustik Vorhang entschärft. Die Raumecken sind besonders empfindlich für Bassmoden, hier könnten noch Basstraps zum Einsatz kommen. Im Moment verzichte ich darauf

Hinter der Hörposition ist ein Bücherregal, welches als natürlicher Diffusor, aber auch als Absorber wirkt. Die Lautsprecher stehen relativ nah an den Seitenwänden (70 cm gemessen vom Hochtöner). Hier weiß ich aus Erfahrung, dass Wanddiffusoren sehr gute Dienste leisten werden. An der Decke sollen Absorber den Nachhall dämpfen. Auf dem Parkett liegt ein Hochflorteppich.

Akustikvorhang

Ich entschied mich für das vollflächige Akustikgewebe ABSORBER LIGHT. Mikroschlitze im Gewebe sorgen für einen Schallabsorptionsgrad nach ISO 11654: αw = 0,80 (Schallabsorberklasse: B), was wirklich viel ist.

Unten in den Messungen siehst du in den Nachhallzeiten, dass der Akustikvorhang ab 300 Hz den Nachhall von 0,4 Sek. auf 0,3 Sek. deutlich reduziert hat.

Seitenwanddiffusoren

Mit Seitenwanddiffusoren habe ich sehr gute Erfahrungen gemacht. Diesmal soll es etwas ganz Besonderes sein: Formfeld 1 vom Münchner Unternehmen Vorhammer Computational Design. Das Design ist inspiriert vom natürlichen Schwarmverhalten von Fischen und Vögeln und wird als Wandpaneel angeboten.

Mit der Lochperforation kann es zusätzlich als Absorber genutzt werden. Für die perfekte Symmetrie habe ich das Muster exakt spiegelbildlich produziert lassen, so dass an beiden Wänden die Diffusion und Absorption gleich erfolgt. Sogar die Löcher sind absolut identisch. Möglich macht es eine computergesteuerte CNC-Fräse.

Deckensegel

Deckensegel sind es nicht geworden, da ich keine Lust auf Bohrtätigkeiten hatte. Beim Hersteller aus Österreich ist es geblieben: Tante Lotte Design GmbH. Es handelt sich um eine selbstklebende Akustikplatte mit dem bezeichnenden Namen „Klebeschaf Apps“ aus Schafwolle (Tiroler Schurwolle). Hier sind einige Eigenschaften laut Hersteller:

– Verbesserung der Nachhallzeit: Alpha-w 0,35
– Regulierung des Raumklimas (Luftfeuchte)
– Filterung von Giftstoffen (Formaldehyde) aus der Raumluft
– allergiefrei, mottengeschützt
– schmutzabweisend

Da ich den Raum nicht Überdämpfen will, habe ich mit 6 Apps (45x45x1,2 cm) begonnen. Gegebenenfalls folgt mehr.

Teppich und Sessel

Um die Bodenreflexionen wirksam zu unterdrücken entschied ich mich für den Hochflorteppich SOLO (rolf-benz.com). Reine Schurwolle ist schmutzabweisend, elastisch, schalldämmend und nimmt im Gegensatz zu Kunstfasern kaum Gerüche an.

Mein bewährter Leolux Sessel Scylla – Leolux ist sehr bequem und hat vor allem eine niedrige Rückenlehne. Achte bei deinem Sessel darauf, dass der Schall nicht von einer hohen Rückenlehne, womöglich noch aus Leder, reflektiert wird. In meinem Fall kommt der Schall ungehindert am Kopf vorbei und wird an der Rückwand durch Filz Absorber (Tür) und der Bibliothek absorbiert und zerstreut.

HiFi Rack

Meine Geräteplattform der HY Serie | Selected High-End AV Racks | Solidsteel konnte ich weiterverwenden. Ich schätze den modularen Aufbau sehr. Jede Plattform ist von der anderen entkoppelt. Die Rohre sind aus massivem Stainless Stahl und wiegen eine Menge. 

Verkabelung

Im Bild unten sieht die Kabelei richtig chaotisch aus, folgt aber einem bestimmten System. Im Newsletter Kabel für die HiFi-Anlage richtig verlegen habe ich beschrieben, dass eine falsche Verlegung der Kabel zu erheblichen Klangeinbußen führen kann. Der Grund liegt in den elektromagnetischen Interferenzen (EMI – Electromagnetic Interference) und Hochfrequenzstörungen (RFI – Radio Frequency Interference).

Verlege die stromführenden Leiter wie AC-Kabel (Wechselstromkabel) oder DC-Kabel (Gleichstromkabel) nie im gleichen Kabelschacht oder parallel mit den signalführenden Leitern. Das sind NF-Kabel (Niederfrequenzkabel), LS-Kabel (Lautsprecherkabel) und HF-Kabel (Hochfrequenzkabel), wobei letztere eine Klasse für sich bilden und getrennt verlegt werden sollen.

Wenn eine räumliche Trennung nicht möglich ist, sollen sich die unterschiedlichen Kabeltypen im 90° Winkel kreuzen. Die LWL-Kabel (Lichtwellenleiterkabel) sind zwar gegen EMI/RFI unempfindlich, aber beachte beim Verlegen den Biegeradius.

Was habe ich mich schon beim Kabel verlegen oder beim Austausch von Kabel verrenken müssen. Meine Frau bemerkte treffend, dass die Geräte „falsch rum“ im Rack stehen. Ich wollte diesmal, dass die Kabel richtig gut zugänglich sind. Unten sind die Netzleitungen zum GigaWatt PC4-EVO+ zu sehen. Getrennt nach High Power, Analog und Digital. Die Stromzufuhr läuft vom Sicherungskasten separat.

Obwohl mein Gerätepark nach mehr aussieht, haben sich die Komponenten nicht verändert: Sonus Faber Amati Futura | T+A M10 | T+A SDV 3100 HV | fis Audio PC mit HQPlayer & fis Audio Server mit Roon | GigaWatt PC4-EVO+ | JCAT OPTIMO S ATX | FARAD Super10 & Super3 | Afterdark Buffalo Switch | fis Audio Cables | Solidsteel HJ-3 / HY-A.

Verifizierung durch Messungen

Die Theorie muss sich durch die Praxis bestätigen. Deshalb sind umfangreiche Messungen mit unterschiedlichen Aufstellungen wichtig.

Nachhallzeit

Mit Acourate – AudioVero lassen sich durch Eingabe der Raummaße und Vergleiche mit gängigen Normen sehr gut die Nachhallzeiten messen und auswerten. Kleinere Räume wie meiner benötigen eine stärkere Dämpfung der Nachhallzeit als größere. Meine durchschnittliche Nachhallzeit liegt bei rund 0,3 Sek. ab 300 Hz. Das ist wenig, aber es geht noch weniger. Zum Vergleich: Musikstudios sind in der Regel stark auf 0,2 Sek. bedämpft.

Oben erwähnte ich es schon, dass der Akustikvorhang sehr wirksam den Nachhall bedämpft. Unten im Bild ist zum Vergleich eine Messung ohne Akustikvorhang. Hier ist gut zu erkennen, dass der Nachhall ab 300 Hz noch bei rund 0,4 Sek. liegt. Das ist bei meinem kleinen Raum schon das obere Limit.

Korrektur des Frequenzgangs

Die Simulation im hunecke.de | Lautsprecher-Rechner zeigte die Probleme bei den Raummoden bereits gut auf. Die Simulation zeigte einen kräftigen Peak zwischen 30-40 Hz und einen Dip ab ca. 50 Hz. Die dünne blaue Linie ist der Frequenzgang ohne Korrektur und zeigt genau das. Die rote Linie zeigt die Korrektur.

Ohne Korrektur war der Bass aufgedickt und unpräzise und verdeckte den Mittel-/Hochtonbereich.

Korrektur der Sprungantwort

Vielen denken bei der Raumkorrektur nur an den Frequenzgang. Mittlerweile halte ich die Korrektur des Timings (Phase) für noch wichtiger. Gerade bei Mehrwegesystemen eilt der Hochtöner (hier umgekehrte Polarität) dem Mittel-/ und Tiefton voraus. Immerhin laufen beide Lautsprecher aufgrund der perfekten Symmetrie im Timing parallel. Das ist eher selten der Fall.

Wer auf Percussion und Transienten Wert legt kommt meines Erachtens nicht um die Korrektur der Sprungantwort herum. Unten im Bild ist gut zu sehen, dass sämtliche Chassis zeitgleich den gleichen Sprung nach oben machen.

Die Messungen kannst du selbst mit geringen finanziellen Mitteln durchführen. Siehe mein Newsletter:

Schwieriger ist die Erstellung von Faltungsfiltern. Aber auch das kann jeder lernen, siehe mein Newsletter:

Zusammenfassung

Eine gute Planung erleichtert die Umsetzung in der Praxis. So habe ich mich schon früh für die kurze Wand entschieden, weil nur so die von mir gewünschte Symmetrie umzusetzen war.

Bei der Aufstellung der Anlage und der Akustikelemente spielt der Raum eine große Rolle. An erster Stelle sollen immer „mechanischeOptimierungen stehen. Das betrifft die Aufstellung der Lautsprecher, aber auch die oft unumgänglichen Akustikelemente.

Die können optisch sehr ansprechend sein. Ein Akustikvorhang, Seitenwanddiffusoren, Deckensegel, Teppich und Sessel sind nicht nur akustisch wertvoll, sondern sorgen auch für die Wohlfühlatmosphäre.

Beim HiFi Rack bevorzuge ich modulare Systeme. Die einzelnen Geräteplattformen sollen entkoppelt sein. Die Verkabelung soll möglichst „luftig“ verlegt sein. Stromführende Kabel sollen von signalführenden Kabel strikt getrennt verlegt werden.

Verifizierung durch Messungen helfen bei der Aufstellung. So habe ich zum Beispiel die Lautsprecher etwas näher zur Rückwand gestellt, um den Bass zu optimieren. Mein Stereodreieck beträgt ca. 2,5 m und ist etwas größer geworden als geplant. Mit Sicherheit folgen weitere Feinkorrekturen. Ein Audiophiler ist nie fertig, wo bleibt sonst der Spaß?

Die Nachhallzeit kannst du nicht elektronisch korrigieren, sondern nur durch Akustikelemente. Bei mir bewirkt zum Beispiel der Akustikvorhang eine hervorragende Dämpfung.

An letzter Stelle stehen die elektronische Korrektur des Frequenzgangs und vor allem die Korrektur der Sprungantwort (Timing).

Und wie hört es sich an? Großartig! Bei einem schwarzen rauschfreien Hintergrund und sehr guter Raumakustik kannst du die Musik sehr leise hören und bemerkst trotzdem viele Details und genießt den präzisen Bass.

Du hast Fragen oder möchtest etwas beitragen? Schreibe uns: Kontaktformular
Oder schreibe per E-Mail an: info@griggaudio.de

Veröffentlicht am

Ein neues Gehäuse und passende LAN-Kabel für das DIY-Projekt Buffalo BS-GS2016

Einleitung

Im Newsletter DIY-Projekt Buffalo BS-GS2016 als Klon des Melco S100 berichtete ich von der Strommodifikation und der Einrichtung eines Managed Switch.

Die Planung eines neuen Hörzimmers befindet sich jetzt in der Umsetzungsphase. Dazu folgt ein eigener Newsletter. Der neue Schaltschrank stellt die Verbindung per LAN-Kabel an die verschiedenen Räume her. Das Originalgehäuse des Buffalo BS-GS2016 ist für den Schaltschrank zu groß, weshalb sich der Handlungsbedarf für ein neues Gehäuse ergab.

Grundlagen

Geschirmtes oder ungeschirmtes Internet Kabel

Im Schaltschrank münden die LAN Kabel aller Wohnräume. Für die Verteilung dient der Buffalo BS-GS2016. Bei den LAN Kabel hat man die Qual der Wahl.

UTP vs. FTP

Es gibt eine grobe Unterscheidung zwischen ungeschirmten UTP Kabel und einem geschirmten FTP- oder STP Kabel. UTP ist die Abkürzung für Unshielded Twisted Pair. FTP bedeutet Foiled Twisted Pair und STP Shielded Twisted Pair.

Der Aufbau, und damit die Schirmung von Internetkabeln ist mit Buchstaben gekennzeichnet.

  • U – Ungeschirmt: ohne Abschirmung.
  • F – Foil: Abschirmung mit Folie um die Adernpaare.
  • S – Geflecht: Die Adernpaare sind mit einem Metallgeflecht abgeschirmt.

Die Wahl zwischen UTP, FTP oder den zahlreichen Varianten hat Auswirkungen auf die Störungsfreiheit, wie unten in der Tabell zu sehen. Interessant sind die EMI-Eigenschaften: 1 (*) – schlechteste Eigenschaften, 5 (*****) – beste Eigenschaften.

Laut dieser Tabelle würde jeder das SF/FTP-Kabel empfehlen.

Gleichtaktstörungen

Gleichtaktstörungen, auch als Common-Mode-Störungen bekannt, treten in elektrischen oder elektronischen Systemen auf, wenn unerwünschte Signale oder Störungen auf gleiche Weise auf alle Leitungen oder Komponenten eines Systems einwirken. Diese Störungen können verschiedene Quellen haben, wie elektromagnetische Felder, unsymmetrische Erdpotentialunterschiede oder externe Störsignale.

Gleichtaktstörungen können die Signalqualität in einem System beeinträchtigen und zu Fehlfunktionen oder Datenverlust führen. Und wirken sich auch auf den Klang aus.

Gleichtaktstörungen von Ethernet werden über die Mittelanzapfung der Transformer in den Endgeräten über einen Kondensator auf die Gehäuse-Masse abgeführt/gekoppelt und gelangen hierdurch in das Masse-System des Endgeräts. Zusätzlich gelangen die Störungen, sofern diese nicht komplett auf Kabelseite des Transformers abgeführt werden können (und das ist in die Regel) auf der anderen Seite des Transformers in die System-Masse. Quelle: Messungen von Ethernet-Infrastruktur – Switches (Nur Lesen) – open-end-music-professional

Dummerweise werden diese Gleichtaktstörungen bei FTP-Kabel über den aufgelegten Schirm über die Masse transportiert. Bei UTP ist das nicht der Fall, weil kein Schirm aufliegt. Freilich macht die fehlende Schrimung UTP-Kabel anfällig für EMI/RFI-Störungen.

Umsetzung in der Praxis

Das neue Gehäuse

Die Platine des Buffalo BS-GS2016, welche auch für den Melco S100 verwendet wird, ist recht kompakt. So lag es nahe ein passendes Gehäuse zu konstruieren. Das geht sehr gut über Schaeffer AG Gehäuse (schaeffer-ag.de). Mit dem kostenlosen Frontplatten Designer sind gute Ergebnisse möglich. Nur aufpassen muss man, wie wir gleich sehen werden.

Alle Gehäuseteile kommen gut geschützt an.

Und hier ist das Malheur passiert: Die Halterungen der Platine in Schraubenform.

Richtig sind aber Buchsen! Ein teurer Spaß. Wenn du dich fragst, warum Geräte so teuer sind, obwohl das Material vergleichsweise preiswert ist, dann ist das ein Erklärungsansatz: Pleiten, Pech und Pannen in der Entwicklung. Forschung & Entwicklung ist teuer.

Die Buchsen passten zum Glück für die Platine. Beachte den beeindruckenden Kühlkörper. Der Hochleistungs-Chip ist eines der Geheimnisse des Buffalos für beste und störungsfreie Leistung.

Das direkt gelötete DC-Kabel von fis Audio wird von meiner selbst konstruierten Kabelklemme gehalten. Huckepack kommt die Halterung für den Schaltschrank.

Ungeschirmtes UTP RJ45 LAN Kabel

Damit keine Gleichtaktstörungen über die Schirmung in die Gehäusemasse gelangen, habe ich mich für diese LAN-Kabel im Industriestandard entschieden: Dünnes Lan Kabel | Netzwerkkabel RJ45 (PVC CM, Blau, 0,6m) – FS.com Deutschland.

Auffällig ist das Kunststoffgehäuse des RJ45-Steckers. Damit können keine Störungen übertragen werden.

Damit kein EMI/RFI über die ungeschirmte Außenhülle des Kabels gelangt, habe ich die sensiblen Stellen mit dickem Kupferblech ausgekleidet. Die Kabel sind mit 0,6m recht kurz gehalten.

Eine gute Belüftung darf nicht fehlen.

Zusammenfassung

Beim Switch im Schalt-/ oder Serverschrank kommt es darauf an, ob du ein geschirmtes oder ungeschirmtes Internet Kabel verwenden möchtest.

UTP ermöglicht, dass sich Gleichtaktstörungen nicht über die Masse bei den angeschlossenen Geräten breit macht und den Klang trübt. Aufgrund der fehlenden Schirmung musst du aber darauf achten, dass du dir nicht anderswo EMI/RFI-Störungen einfängst. Halte die Kabel daher kurz und entfernt von Wechselstrom. Emittierende Geräte kannst du mit Kupfer abschirmen.

Du hast Fragen oder möchtest etwas beitragen? Schreibe uns: Kontaktformular
Oder schreibe per E-Mail an: info@griggaudio.de

Veröffentlicht am

Erfahrungsbericht fis Audio PC mit FARAD SuperATX (Prototyp)

Einleitung

Jeder PC benötigt Gleichstrom (DC). Aus 230V Wechselstrom (AC) werden in der ersten Stufe meist 19V Gleichstrom (DC) erzeugt. In der zweiten Stufe werden aus diesen 19V nach dem jetzigen ATX Standard die Motherboards mit 3,3V, 5V und 12V bedient. Es gibt übrigens einen neuen Standard ATX12VO, der nur noch 12V bereitstellt. Dieses Konzept wäre für einen Audio PC schlecht, da die einfachen Schaltregler dann direkt auf dem Motherboard sitzen.

Nun gibt es natürlich viele Netzteile mit ATX Spezifikation. Diese bringen die notwendigen Molex ATX-Anschlüsse gleich mit. Die von der Computerindustrie bereitgestellte Stromversorgung sind jedoch oft Schaltnetzteile von geringer Bauteilequalität und hohem Ripple Noise. Die ATX-Kabel sind meist von dünnem Querschnitt, schlechter Materialqualität und ungenügend geschirmt. Das machen wir mit dem fis Audio PC deutlich besser.

Grundlagen

Transformator

Wirkprinzip

Ein Trafo besteht meist aus zwei oder mehr Spulen (Wicklungen), die in der Regel aus isoliertem Kupferdraht gewickelt sind und sich auf einem gemeinsamen Magnetkern befinden. Ein Transformator wandelt eine Eingangswechselspannung, die an einer der Spulen angelegt ist, in eine Ausgangswechselspannung um, die an der anderen Spule abgegriffen werden kann. Dabei entspricht das Verhältnis von Eingangs- und Ausgangsspannung dem Verhältnis der Windungsanzahlen der beiden Spulen. So wird zum Beispiel bei einem Windungsverhältnis von 20 zu 1 eine Eingangsspannung von 240 Volt in eine Ausgangsspannung von 12 Volt transformiert.

Verlustleistung

Das Problem unnötig hoher Verlustleistungen bei Linearnetzteilen tritt immer dann auf, wenn die Ausgangsspannung des verbauten Trafos für den konkreten Einsatzzweck zu hoch gewählt wurde. Dies kann bei handelsüblichen Linearnetzteilen vorkommen. Besonders dann, wenn mehrere Ausgangsspannungen gewählt werden können und sich der Auswahlbereich auch noch über den tatsächlich benötigten Wert hinaus erstreckt.

Per Schalter seine Spannungen auswählen zu können ist zwar sehr bequem. Die sehr hohe Verlustleistung macht sich jedoch mit einer hohen Abwärme bemerkbar. Da hat sich schon so manches Netzteil in „Rauch“ aufgelöst.

Diese Probleme habe ich bei FARADs linearen Netzteilen noch nie festgestellt, weshalb ich deren Produkte empfehle. Zum Beispiel hat das FARAD Super10​ für jede Ausgangsspannung ein optimiertes Modul und einen passgenauen Netztransformator und vermeidet dadurch die Nachteile einer hohen Verlustleistung über verschiedene Spannungen. Ein Spannungswechsel ist nachträglich trotzdem möglich und wird von FARAD ausgeführt.

FARAD SuperATX

Technischer Aufbau

Drei Transformatoren

Das FARAD SuperATX Netzteil hat 3x 150VA dreifach geschirmten kundenspezifischen Transformatoren. Einer für die CPU, einer für das Motherboard und einer für SSDs und Peripheriegeräte.

  • Transformator 1 und Rail 1: 12V/8A CPU EPS (max. 100W TDP)
  • Transformator 2 und Rail 2+3: ein volllineares 24-poliges ATX-Steckernetzteil
  • Transformator 3 und Rail 4+5: Dreifache Peripherieausgänge mit 5V/3A (Gesamtsumme 7,5A) und 12V/3A (Gesamtsumme 3A). Einer der Ausgänge kann auf „always on“ umgeschaltet werden.

Weitere technische Spezifikationen

  • Glättungskapazität von ca. 250.000uF. Langlebige automotive Kondensatoren mit niedrigem ESR und Hf-Choke-Pi-Filtern.
  • 24x 15F Supercaps bringen eine effektive Kapazität von 17,5F bei voller Spannung. Das sind 17.500.000uF Gesamtpufferkapazität vor den endgültigen Reglern! Diese Supercaps wirken wie eine Batterie und sind in den Super3 und Super10 Netzteilen erprobt.
  • Doppelte Low-Noise-Regelung mit Hf-Post-Pi-Filterung für noch geringeres Ausgangsrauschen.
  • Mikroprozessorschutz an allen Spannungen (Über- und Unterspannungen, Kurzschlüsse usw.) und Kommunikation mit dem MoBo.
  • Ground-Lift-Schalter und Ground-Post, vergoldete Molex-Ausgangsanschlüsse.

Die Anschlüsse

Während das FARAD Super10 Netzteil noch einen DC/ATX-Konverter benötigt, um aus 19V die drei benötigten ATX Ausgangsspannungen mit 3,3V, 5V und 12V zu erzeugen, ist das beim FARAD SuperATX nicht mehr erforderlich. Denn hier werden die Molex Stecker direkt angeschlossen.

Das Prinzipien-Bild unten verdeutlicht die Anschlüsse. Der wichtigste Anschluss ist der für die CPU, welches mit einem 8 Pin Molex Stecker realisiert wird. Für eine PCIe-Karte für USB oder LAN können 5V abgezweigt werden. 3A reichen dafür in der Regel aus. Das Motherboard wird mit allen drei Spannungen (3,3V, 5V und 12V) von einem 24 Pin Molex Stecker mit sauberen Strom versorgt.

Der Test

Testaufbau

Beim FARAD SuperATX Netzteil handelt es sich um einen Prototypen, den mir Mattijs de Vries von Farad power supplies zu Testzwecken zur Verfügung gestellt hat. Für mein Review erhielt ich kein Honorar. Ich bin jedoch Händler von FARAD Produkten. Diese Informationen dienen zur Offenlegung meiner finanziellen Interessen.

Im Bild unten ist im Vordergrund der fis Audio PC zu sehen, welches als Betriebssystem das HQPlayer OS (Linux Echtzeit Kernel) hat. Bisher wurde es von dem JCAT OPTIMO S ATX mit sauberen Strom versorgt. Für den Test wurden das 24 Pin Molex Kabel für das Motherboard und das 8 Pin Molex Kabel für die CPU getauscht.

Im Hintergrund wurde das FARAD SuperATX mit der legendären fis BF Blackmagic Netzleitung an den Reference Power Line Conditioner GigaWatt PC-4 EVO+ angeschlossen.

Probleme beim Power On / Off

Mattijs warnte mich vor, dass es bei modernen Motherboards zu Problemen beim Einschalten kommen kann. Und so war es auch bei mir. Das Motherboard quittierte die Stromzufuhr noch vor betätigen des Power On Schalters mit roten LEDs und in der Fehlercode-LED mit einer „- -“ Anzeige. Erst nach einem Reset des SuperATX konnte ich dann fehlerfrei booten.

Zu allem Unglück ließ sich der fis Audio PC anschließend nicht mehr herunterfahren. Dies wurde mit dem Fehlercode „95 – PCI Bus Request Resources“ verhindert.

Die Ursache der Power On / Off Fehler liegt lt. Mattijs darin, dass die neueren Motherboards schon im Standby eine höhere Stromstärke bei 5V verlangen. Das SuperATX liefert mit 5V/3A offensichtlich zu wenig Strom. FARAD hat bereits eine Lösung dafür und die endgültige Version wird dieses Problem nicht mehr haben.

DSD1024 ist mit leichten Modulatoren möglich

Mit dieser Einstellung (DSD1024 und dem neuen experimentellen Modulator AHM7EC5L) war der Klang traumhaft. Der Bass ist sehr sauber und geht sehr tief. Die Instrumententrennung ist sehr gut, so dass die Bühnenabbildung sensationell ist. Die Höhen würde ich als seidig beschreiben, ganz ohne Schärfen.

Ich möchte nicht unerwähnt lassen, dass von den drei Trafos keinerlei Brummen zu hören war. Das FARAD SuperATX Netzteil ist völlig geräuschlos.

Version 2.0

FARAD hat schon einige Ideen für die Version 2.0, welche eine höhere CPU Rechenlast erlauben wird.

Zusammenfassung

Ich habe mich sehr auf das FARAD SuperATX gefreut. Es zeichnet FARAD aus vor der Produkteinführung umfangreiche Tests durch Dritte durchführen zu lassen. So ist sichergestellt, dass zum Beispiel die Kinderkrankheiten mit den stromhungrigen Motherboards beim endgültigen Produkt beseitigt sind.

Das Upsampling auf DSD1024 mit leichten Filtern und Modulatoren funktioniert sehr gut und der Klang ist traumhaft. Für höhere Anforderungen an die Rechenlast ist die Version 2.0 in Arbeit.

Für den fis Audio PC ist das FARAD Super10 Netzteil weiter gesetzt, welches auskömmliche 19V/10A (rund 200W) zur Verfügung stellt.

Du hast Fragen oder möchtest etwas beitragen? Schreibe uns: Kontaktformular
Oder schreibe per E-Mail an: info@griggaudio.de

Veröffentlicht am

Jahresrückblick 2023

Einleitung

Ich bedanke mich herzlich bei den vielen Abonnenten und Mitlesenden. Es sind viele interessante Themen besprochen worden. Deshalb möchte ich im Jahresrückblick 2023 die Inhalte gesammelt darstellen.

Grundlagen

Hörvermögen

Was bringt HiRes, wenn der Mensch nur bis 20 kHz hört?

Ultraschallanteile führen zur verstärkten Hinrnaktivität! Das war für mich der Knaller, obwohl die Forschungsergebnisse schon aus 2000 stammen. Eine weitere Studie aus 2014 zeigte, dass erst ab 32 kHz ein positiver Effekt auftrat. Am stärksten wirkte der Ultraschall zwischen 80 – 88 kHz.

Wenn nur Ultraschall ausgestrahlt wurde, war kein Effekt zu beobachten. Erst in Kombination mit den hörbaren Frequenzen reagiert der Mensch darauf. Möglicherweise ist die Hüllkurve (das Summensignal aller Frequenzen, die in einem Musikstück vorhanden sind) dafür verantwortlich. Denn diese verändert sich mit den Ultraschallanteilen.

Transienten spielen vermutlich auch eine Rolle. Nahmikrofonierte Drum-Kits / Percussions erreichen das 100 kHz Spektrum.

Bist du Grundton- oder Obertonhörer?

Ebenfalls aus der Hirnforschung kommen die Erkenntnisse, dass die Grund- und Obertöne verschiedene Hirnareale unterschiedlich ansprechen. Und der Mensch sehr individuell entweder veranlagungs- oder/und lernbedingt mehr Grund- oder Obertonhörer ist.

Lieben Grundtonhörer schnelle, kurze Impulse, virtuose Fingerübungen und präzise Rhythmen, so schmeicheln dem Obertonhörer lange, getragene Melodien, Klangfarben und Harmonien. Hier geht es zu einem interessanten Selbsttest:

Digitale Signalverarbeitung

Wie arbeitet ein DAC und was kann Upsampling bewirken?

Dieser Newsletter war für manche „Bitperfekt-Hörer“ ein Aufreger. Sie wurden nämlich der Illusion beraubt, dass im DAC kein Upsampling erfolgt. Und doch ist es so. Die meisten DACs haben Chips mit der Delta-Sigma-Modulation. Das sind zum Beispiel ESS Sabre oder AKM Chips.

Hier erfolgt dann im DAC zwangsläufig ein Upsampling auf DSD. Konstruktionsbedingt kommen die DACs nie an die Rechenleistung eines Audio PCs heran. Da werden oft Interpolationen und Festkomma-Berechnungen, sowie Modulatoren niedriger Ordnung eigesetzt. Mit Messungen wurde belegt, wie das Upsampling durch einen Audio PC die Rekonstruktion deutlich verbessern kann.

Zur Vertiefung des Themas sind weitere Newsletter verfügbar:

Welchen Messwerten soll man trauen?

Foren wie Audio Science Review (ASR) müssen sich auf einen gewissen Standard des Messverfahrens einigen, damit die Messergebnisse dauerhaft vergleichbar sind. Auf der anderen Seite sind Empfehlungen aufgrund „nur“ dieser Messwerte mit Vorsicht zu genießen.  

An einem Beispiel wurden durch die Verwendung anderer Testinhalte gravierende Fehler aufgedeckt. Außerdem bin ich der Meinung, dass (noch) nicht alles gemessen werden kann, was wir hören, bzw. im Gehirn verarbeiten.

Neue Thesen zum Reclocking

Dieses Thema regt viele Leute auf. Sie verweisen darauf, dass im DAC bei einer asynchronen Datenübertragung sowieso alles aus dem Puffer gelesen und neu getaktet wird. Und deshalb Jitter keine Rolle spielt.

Auf der anderen Seite gibt es Leute wie mich, die beim Reclocking gravierende Verbesserungen mit konturierterem Bass, gesteigerter Instrumententrennung und klareren Höhen ohne Schärfen feststellen. Die These von UpTone Audio sagt, dass das Phasenrauschspektrum der eingehenden Daten das Phasenrauschspektrum der lokalen Clock überlagert. Allerdings nur im niederfrequenten Bereich (Wander). Clocks mit besten Werten bis 10Hz wie zum Beispiel ein Mutec REF10 sind extrem teuer.

Raumakustik

Wie du mit dem Audio PC die Akustik verbessern kannst

Ich höre oft von Leuten, die mit Kabel, Stromversorgung und neuen Geräten versuchen den Klang zu verbessern. Und sind dann trotzdem unzufrieden. Möglicherweise werden die Auswirkungen des Raums nicht genügend bedacht.

Lautsprecher sollen einen ausreichenden Abstand zur Rück- und Seitenwand haben, um den Raum nicht zu sehr anzuregen. Gewisse Raummoden können aber nicht durch Schieben und Rücken der Lautsprecher kompensiert werden. Denn wir reden hier ab 20 Hz von Wellenlängen von bis zu 17 Metern!

  • 343 m/sec : 20 Hz = rund 17 m (17,15 m) Wellenlänge

Eine große Rolle spielen die Nachhallzeit und der Direkt-/ und Diffusschallanteil. Oft helfen einfache Maßnahmen wie Vorhänge, Teppiche, Deckensegel, Wandabsorber und Diffusoren, die wohnlich gestaltet werden können.

Wenn alle raumakustischen Maßnahmen ausgeschöpft wurden, empfehle ich die digitale Raum- und Lautsprecherkorrektur. Hier können dann zwei Aspekte den Hörgenuss gravierend steigern:

Der Frequenzgang wird geglättet, wobei die schnurgrade Linie nicht das Ideal ist. Vielmehr soll sich die Korrektur an psychoakustischen Effekten orientieren.

Oft wird das Timing nicht bedacht ! Als wesentliche Maßnahme wird die Sprungantwort optimiert. Synchronisiert über beide Lautsprecher. Dies verbessert die Wahrnehmung von Transienten und damit die Ortungsgenauigkeit ganz erheblich.

Weitere Fundstellen

Hard- und Software

fis Audio PC

Was gibt es neues auf dem CPU Markt?

Aufgrund der modularen Bauweise des fis Audio PCs können recht schnell die neuesten und besten Prozessoren eingesetzt werden. Wobei wir immer in das obere Regal (Intel® Core™ i9-13900K) greifen, weil hier die sogenannte Silicon Lottery die höchste Qualität erwarten lässt. Und das Upsampling auf DSD eine sehr hohe Rechenleistung erfordert.

Einen großen technischen Sprung plant Intel mit Arrow Lake, weil als Herstellungsprozess Intel 20A – 3 nm geplant ist. Je geringer die Strukturgröße ausfällt, desto mehr Transistoren können je mm² verbaut werden. Die CPU soll Ende 2024 kommen.

Vergleich Intel vs. AMD Prozessoren

Die Fertigungstechnik ist bei AMD mit 5-nm bei Ryzen™ 9 7950X3D deutlich moderner, als bei Intel mit dem sogenannten Intel-7, welches 10 nm Fertigungsprozess entspricht.

Die Energieeffizienz des AMD 7800X3D hat in den gezeigten Tests begeistert. Nur fällt die Rechenleistung bei mathematisch orientierten Anwendungen stark ab. Hinzu kamen dann noch Probleme bei Überhitzungen der Ryzen-7000-Prozessoren, wenn das EXPO Profil für den Arbeitsspeicher geladen wurde. Ebenso wurden hohe Lastspitzen festgestellt.

Für unseren Anwendungsfall des DSD Upsamplings sehe ich Intel nach wie vor an der Spitze.

Wird es einen fis Audio PC Intel 14. Generation Core (Raptor Lake Refresh) geben?

Intels Nachfolger Raptor-Lake-Refresh überzeugte aufgrund der geringen Leistungszunahme nicht. Im Netz ist von einigen Problemen mit der Motherboard Kompatibilität zu lesen. Da Arrow Lake Ende 2024 kommen soll, bleibt es bis dahin bei der bewährten 13. Prozessorgeneration.

Unterschiedliche Speichermedien für Audio erklärt

Für das Betriebssystem empfehle ich 1 Bit (SLC) Speicher oder 3D XPoint Speicher (Intel Optane). Denn die Vorteile sind erheblich:

  • Geringerer Stromverbrauch und dadurch rauschärmer
  • Geringste Latenzen = größere Verarbeitungsgeschwindigkeit
    Verdoppelt sich für jeden Bit pro Zelle, so wie es auch bei der Energie geschieht.
  • Geringere Latenzen bedeuten auch geringerer Jitter.
  • Sehr lange Haltbarkeit
  • Weniger Fehler
    Die Fehler nehmen für jeden Bit pro Zelle zu und damit die Menge an Error Correction Code im SSD-Controller.

Das Problem schlecht sitzender und heißlaufender PCIe-Karten

Selbst Taiko Audio ist es passiert. Deren Extreme Network Card hatte teilweise einen schlechten Sitz, wodurch kein Verbindung zustande kam.

Mit unserer fis Audio PC Alu Rückblende, erstellt mit CNC Fräsmaschinen aus deutscher Fertigung, bieten wir eine sehr gute Lösung für den stabilen Halt von PCIe-Karten an.

Kabel

Kabel für die HiFi-Anlage richtig verlegen

Eine falsche Verlegung der Kabel kann zu erheblichen Klangeinbußen führen. Der Grund liegt in den elektromagnetischen Interferenzen (EMI – Electromagnetic Interference) und Hochfrequenzstörungen (RFI – Radio Frequency Interference).

Verlege die stromführenden Leiter wie AC-Kabel (Wechselstromkabel) oder DC-Kabel (Gleichstromkabel) nie im gleichen Kabelschacht oder parallel mit den signalführenden Leitern. Wenn eine räumliche Trennung nicht möglich ist, sollen sich die unterschiedlichen Kabeltypen im 90° Winkel kreuzen.

Achte auch auf die Stabilität der Anschlüsse. Wackelnde Stecker können hohe Übergangswiderstände produzieren und verursachen eventuell über einen Lichtbogen Kurzschlüsse.

Was macht ein gutes LAN Kabel aus?

Wichtig ist zu wissen, dass die digitale „0“ und „1“ in einer analogen Technik per Hochfrequenz (HF) übertragen werden. Dabei wertet ein Controller die unterschiedliche Spannungszustände aus.

Wo Strom fließt kann es auch Störungen geben. Zum Beispiel Gleichtaktstörungen und Leckströme. Diese Störungen können sich bis zum DAC übertragen. Hier können Isolatoren und die Unterbrechung der Kabelschirmung für Abhilfe sorgen.

Und es gibt sie doch: Qualitätsunterschiede bei LWL (Lichtwellenleiter)

LWL ist aufgrund der galvanischen Trennung eine lohnende Investition. Auch bei LWL gibt es Qualitätsunterschiede. Das fängt mit Transceivern an, die aufgrund ihres eigenen Rauschens sehr hochwertig sein sollen. Und setzt sich mit den Kabelqualitäten fort. Der Mehrpreis für Grade B ist im Gegensatz zu „audiophilen“ LAN-Kabel dermaßen gering, dass ich es jedem empfehle.

Für kurze Entfernungen kommen auch die preisgünstigen 10G-DAC- und AOC-Kabel in Frage. Das stromreduzierte passive DAC-Kabel hat zum Beispiel ein sehr geringes Eigenrauschen.

Für was soll das Ausphasen von Geräten gut sein?

Über die Erdung (Schutzleiter PE) fließen Ausgleichströme, die das Nutzsignal verändern können. Daher soll die Potenzialdifferenz bei den Geräten klein gehalten werdenAchte bei den Netzleitern daher auf die richtige Phase.

Datenübertragung

Was bringen PCIe-Karten im Audio PC?

Mit den PCIe-Karten bist du sehr flexibel und kannst die nicht audiophilen Computeranschlüsse umgehen. Den Ripple Noise vom Computer umgehst du entweder mit einer galvanischen Trennung per LWL (Lichtwellenleiter) oder mit einer externen Stromversorgung der PCIe-Karte durch ein lineares Netzteil. Ein Reclocking kann Jitter verringern.

Welche neuen Datenübertragungsstandards sind für Audio im Gespräch?

Die heutigen digitalen Schnittstellen sind sehr vielfältig und haben ihre Stärken und Schwächen. In amerikanischen Foren hat sich die Erkenntnis mehrheitlich durchgesetzt, dass Schnittstellen mit hohen Bandbreiten wie 10G aufgrund besserer technischer Spezifikationen den Klang steigern. Auch wenn nur 1G genutzt wird. USB4 steckt für Audio noch in den Kinderschuhen

Kleinere Puffer in den USB- und LAN-Treibern reduzieren unter anderem das elektrische Rauschen. Diesen Punkt greift Taiko Audio mit seiner neuen Schnittstelle XDMI (vormals TACD) auf. Wird das Intervall viel kleiner gemacht, wird ein linearer Datenstrom mit einer sehr hohen Frequenz weit außerhalb des Audiobereichs erzeugt. Das bedeutet ein kontinuierliches Rauschen mit niedrigem Pegel bei sehr hohen Frequenzen.

Wie stellst du die Datenpuffer bei USB und LAN richtig ein?

Ausgehend von den Überlegungen von Taiko Audio oben, kannst mit den Puffereinstellungen bei USB und LAN ähnliches erreichen.

Die Puffergröße hat Auswirkungen auf die Latenzen. Ich empfehle (wie üblich ohne Gewähr) geringstmögliche Pufferwerte zu setzen, welche die Latenzen minimieren. Niedrigste Latenzen verringern:

  • Jitter,
  • Biterrors und
  • Elektrisches Rauschen.

DIY-Projekt Buffalo BS-GS2016 als Klon des Melco S100

Wenn du Löten kannst und Geld sparen möchtest ist das DIY-Projekt Buffalo BS-GS2016 als Klon des Melco S100 vielleicht genau das richtige für dich. Wir bieten den Umbau zwar nicht an, liefern aber gern das DC-Kabel und das lineare Netzteil dazu.

Software

Komfortable Bedienung und bester Klang – geht das?

Wenn du wirklich das Beste willst, trenne deine digitale Strecke in einen Control PC (z. B. Roon) und in einen Audio PC (z. B. HQPlayer) auf. Der Control PC muss nicht besonders leistungsstark sein. Es kann sich auch um ein NAS handeln. Der Audio PC soll in jederlei Hinsicht audiophil und mit geringsten Latenzen sehr leistungsstark sein. Wie zum Beispiel der fis Audio PC.

Warum Interrupts beim Audio PC den Klang massiv beeinflussen

Interrupts sind Unterbrechungen im Computersystem, damit zeitnah auf Ereignisse reagiert werden kann. Auch wenn es nicht zu offensichtlichen Drop Outs kommt, können im Millisekundenbereich störende Artefakte entstehen, allen Puffern zum Trotz. Die meisten Menschen können bereits Latenzen zwischen 2-5 ms erkennen.

Deshalb ist ein duales PC-System wie oben beschrieben auch so sinnvoll. Die Musikverwaltung und Steuerung löst starke Aktivitäten aus, die zu Interrupts führen und die Musikwiedergabe stören.

Welche Windows Einstellungen für Audio wichtig sind

In Windows 11 Pro laufen oft 160 Prozesse, zum Beispiel für Audio unwichtige Drucker-, Kalender- und Mailfunktionen. Oder die voreingestellte Energieoption „Ausbalanciert (empfohlen)“ führt bei der Musikwiedergabe wegen hoher Latenzen zu Drop Outs.

Nicht jeder möchte auf Windows verzichten. Viele haben mit dem Betriebssystem langjährige Erfahrungen und manche Programme gibt es nur für Windows. Zum Beispiel Acourate für die Raumkorrektur.

Die Optimierung von Windows ist jedoch mit Arbeit verbunden. Die Mühe lohnt sich. Die meisten Einstellungen musst du nur einmal tätigen.

HQPlayer 5 Desktop und HQPlayer 5 Embedded 5.0.0 veröffentlicht!

Die Idee des HQPlayers ist die begrenzte Rechenleistung eines DACs durch einen Audio PC zu ersetzen. Der Audio PC kann hochwertigere Modulatoren und Filter verarbeiten. Der fis Audio PC bietet dafür die notwendige Rechenleistung und ist trotzdem lautlos. Der DAC soll dabei im NOS (Non Oversampling) mit geringer Rechenlast in seinem Sweet Spot betrieben werden.

Mit effizienteren Algorithmen und verbesserten Filtern und Modulatoren in der 5. HQPlayer Generation konnte die Soundqualität (SQ) erheblich gesteigert werden. Mit der Spektralanalyse in Echtzeit deckst du Mogelpackungen auf.

Ausblick

Für das neue Jahr habe mich mir schon einige Themen vorgenommen:

  • Test des neuen FARAD SuperATX Netzteils
  • LAN Kabel für den Serverschrank
  • Einrichtung des neuen Hörraums
  • Intels neue Prozessorgeneration mit Arrow Lake

Schreib mir, wenn dich bestimmte Themen interessieren. Wenn es (zeitlich) passt, nehme ich es gerne auf meine Todo-Liste.

Du hast Fragen oder möchtest etwas beitragen? Schreibe uns: Kontaktformular
Oder schreibe per E-Mail an: info@griggaudio.de

Veröffentlicht am

Welchen Messwerten soll man trauen?

Einleitung

Jeder möchte natürlich das beste Gerät zum niedrigsten Preis. Und in der Tat kann man preiswerte DACs mit besten technischen Daten kaufen. Am besten verlässt du dich nicht auf die Herstellerangaben, sondern suchst im Internet nach neutralen Messwerten.

Selbst wenn du etwas von Messkoryphäen findest, kannst du dich nicht blind darauf verlassen. Denn das führt zum nächsten Problem: Wird das Richtige gemessen? In diesem Artikel geht es exemplarisch um einen DAC, der die besten Messwerte hatte und trotzdem gravierende Probleme aufwies.

Messungen

Audio Science Review

Im Audio Science Review (ASR) Forum werden regelmäßig Messwerte von Audio Hardware veröffentlicht. Etwas Humor ist immer dabei. Wenn zum Beispiel der kopflose Panther abgebildet ist, weißt du schon wie der Test ausgegangen ist. Jeder kann die Ergebnisse und Beiträge lesen, das Forum ist kostenlos. Jeder kann sein Audio-Equipment kostenlos vermessen zu lassen!

Die Koryphäe

Der sogenannte CFO (Chief Fun Officer) heißt Amir Majidimehr und ist wohl in der Seattle Area im Bundesstaat Washington beheimatet. Er hat einen beeindruckenden Lebenslauf:

  • Unix-„Kernel“-Entwickler (Betriebssystem) 
  • Entwicklung von Motherboards, Audio-Subsysteme, Netzteile, LCD-Displays bei Sony
  • Leitung des Entwicklerteams bei Abekas Video Systems und Pinnacle
  • Leitung der Digital Media Division bei Microsoft

Das Mess Equipment von Audio Precision und Klippel (ASR vermessen Lautsprecher! | Audio Science Review (ASR) Forum) ist beeindruckend. Ich denke man kann davon ausgehen, dass Amir mit den Messgeräten umgehen kann und weiß wovon er spricht.

Messwerte SMSL DO100 (Stereo-DAC)

Als Beispiel nehme ich den SMSL DO100 DAC. Die Firma Foshan ShuangMuSanLin Technology Co., Ltd. (SMSL) wurde 2009 gegründet und hat ihren Sitz in Shenzhen, China. Im DAC sind gleich zwei ESS Technology ES9038Q2M D/A Chips verbaut. Für USB wurde die XMOS-Lösung der 2. Generation verwendet. Der DAC kann natives DSD512 und PCM 768 kHz / 32 Bit verarbeiten.

Ich werde nachfolgend nur einige Messwerte zeigen. Die vollständige Messreihe kann hier nachgelesen werden: SMSL DO100 Review (Stereo DAC) | Audio Science Review (ASR) Forum

SINAD

SINAD steht für „Signal-to-Noise and Distortion Ratio“ und ist eine wichtige Metrik zur Bewertung der Audioqualität. Diese Kennzahl misst das Verhältnis zwischen dem Nutzsignal, also dem gewünschten Signal, und unerwünschten Signalanteilen wie Rauschen und Verzerrungen.

Mit 120 dB ist der SINAD hervorragend.

SMSL DO100 Review (Stereo DAC) | Audio Science Review (ASR) Forum
Mehrtontest

Der Mehrtontest mit einer Sampling Rate von 192 kHz klopft 32 verschiedenen Frequenzbereiche auf Verzerrungen ab, die in diesem Fall sehr gering sind.

SMSL DO100 Review (Stereo DAC) | Audio Science Review (ASR) Forum
Anti-Aliasing-Filter

Bei einem DAC sollen natürlich auch die Spiegelfrequenzen wirksam bedämpft werden. Grundlage ist das Nyquist-Shannon-Abtasttheorem. Dabei wird das Originalsignal mit einer Rate abgetastet, die mehr als doppelt so hoch wie die höchste im Signal vorkommende Frequenz ist. Wird das Abtasttheorem durch eine zu niedrige Abtastrate verletzt, so werden Frequenzanteile, die ursprünglich höher waren als die halbe Abtastrate (Nyquist-Frequenz), als niedrigere Frequenzen interpretiert, da für diese eine Unterabtastung stattfindet. Dieses unerwünschte Phänomen wird Alias-Effekt genannt.

Der Nutzer kann zwischen 7 Filter wählen, die unterschiedlich abrollen und maximal bis -100 dB dämpfen. Die Filter sind beim HQPlayer wesentlich besser, z. B. rollen sie steiler ab und dämpfen bis -200 dB. Das eingeschränkte Filterdesign ist jedoch bei den meisten DAC-Chips so.

SMSL DO100 Review (Stereo DAC) | Audio Science Review (ASR) Forum
Gesamtbewertung

Die weiteren Messwerte um die Linearität, Jitter, etc. fallen auch sehr gut aus, so dass Amir diesen DAC empfiehlt:

Dies ist eine einwandfreie Leistung von SMSL. Jeder Test wird mit Bravour bestanden und lässt keinen Raum für jegliche Beanstandung. Wenn man bedenkt, dass diese State-of-the-Art-Leistung zu relativ geringen Kosten angeboten wird, ist das eine ziemliche Leistung. Es gibt keine Ausrede mehr, sich nicht für volle Transparenz zu entscheiden, Leute.

Es ist mir eine Freude, das SMSL DO100 zu empfehlen.

SMSL DO100 Review (Stereo DAC) | Audio Science Review (ASR) Forum

Signalyst

Die norwegische Firma Signalyst bietet verschiedene HQPlayer Versionen und sogar eine eigene DAC Platine an. Signalyst selbst betreibt kein Forum, sondern nutzt für Ankündigungen und den Support sehr intensiv Foren. Hier ist eine Auswahl:

Die Koryphäe

Jussi Laako ist meines Wissens Mathematiker und hat ebenfalls einen sehr interessanten Lebenslauf:

  • Systemingenieur bei Soft Oy 1997 – 2004
  • Leitender Spezialist bei Nokia 2004 – 2011
  • Leitender Linux-Softwareentwickler Intel Corporation 2011 – 2018

Insbesondere seine Arbeiten bei Intel machen ihn zu einem Experten im Computer Audio Design.

Messwerte SMSL DO100 (Stereo-DAC)

Im Forum S.MS. L D300 Nativer DSD-DAC Test mit Messungen – Seite 3 – DAC – Digital-Analog-Wandlung – Audiophiler Stil (audiophilestyle.com) ist ein Forent auf Auffälligkeiten beim SMSL DO100 gestoßen, welche Jussi Laako (Miska) wie folgt beantwortet hat.

SINAD

In diesem Test des SMSL DO100 hat ein Forent PCM 44,1 kHz (rot) mit DSD256x48 (blau) verglichen. Erwartungsgemäß liegt das Grundrauschen von DSD mit rund -145 dB deutlich unter PCM 44,1 kHz, allerdings kommt es bereits ab 40 kHz zu einem massiven Anstieg des Rauschens.

S.MS. L D300 Nativer DSD-DAC Test mit Messungen – Seite 3 – DAC – Digital-Analog-Wandlung – Audiophiler Stil (audiophilestyle.com)

Lt. Jussi Laako ist dieses Verhalten bei vielen ESS-Chips typisch, wenn der ASRC (Asynchronous Sample Rate Conversion) aktiv ist. Die ASRC ist ein Prozess, der dazu dient, verschiedene digitale Audiosignale mit unterschiedlichen Abtastraten miteinander zu synchronisieren.

Der Chip sollte stattdessen ASRC deaktivieren und IIRC (Intelligent Inference of the Reconstruction Clock) nutzen. Die IIRC-Technologie ist eine Art von Algorithmen und Schaltungen, die zur Reduzierung von Jitter (zeitlichen Verzerrungen) bei der Rekonstruktion des analogen Signals aus dem digitalen Datenstrom verwendet werden. Damit würde der Chip im sogenannten „128fs-Takt“-Modus mit synchronen Takten laufen. Stattdessen läuft im DAC z.B. ein fester 100-MHz-Takt.

Dasselbe Problem führt auch dazu, dass der Chip bei bestimmten Eingangsdaten (PCM-Eingängen) zu einer enormen Rauschspitze um 1 MHz im Ausgang neigt.

1 kHz Testton Frequenzvergleich

Beim Testen des SMSL DO100 mit DSD 256×48 ist ein weiteres Problem aufgetreten. Alles sieht großartig aus, außer dass die tatsächliche Frequenz des Testtons am Ausgang bei Verwendung von 48k-basierten Raten nicht 1 kHz beträgt. Stattdessen sind es bei 1 kHz * 44,1 / 48 = 0,918 kHz:

image.thumb.png.b54ac7eaba7335ac153dbfaa70bd2208.png

S.MS. L D300 Nativer DSD-DAC Test mit Messungen – Seite 3 – DAC – Digital-Analog-Wandlung – Audiophiler Stil (audiophilestyle.com)

Es ist lt. Jussi Laako eine typischer Implementierungsfehler der XMOS USB Audio Class Engine mit dem Referenzcode. Dieser schaltet die Takte nicht um und bleibt stattdessen immer bei der 44,1-Familienclock mit DSD-Eingängen. Der DAC spielt damit etwas langsamer und das ist bei bekannten Stücken natürlich hörbar.

Interpretation

Wie kommt es zu den unterschiedlichen Messergebnissen?

Amir Majidimehr spult bei den Messungen immer das gleiche Programm ab. Es wird stur PCM für den Test genommen und er kommt so beim SMSL DO100 zu hervorragenden Testergebnissen.

Der HQPlayer wurde extra für das PCM zu DSD Upsampling entwickelt, weil das die Delta-Sigma-DACs sowieso machen, nur mit eingeschränkter Qualität. Siehe mein Bericht: Wie arbeitet ein DAC und was kann Upsampling bewirken? Der HQPlayer von Jussi Laako ermöglicht ein geradzahliges Upsampling. Bei einer Quellrate von 44.1 kHz wird beispielsweise geradzahlig auf DSD256 (44.1 x 256 = 11,2896 MHz) hochgerechnet. Bei einer Quellrate von 48 kHz entsprechend geradzahlig auf DSD256x48 (48 x 256 = 12,288 MHz).

Bei DSD256x48 sind beim SMSL DO100 folgende Probleme entstanden:

  1. Der fehlerhafte DAC-Chip führt zu einem erhöhten Rauschen.
  2. Die fehlerhafte XMOS-USB-Implementierung führt zu einer Drift und verlangsamt den DAC.

Fehlervermeidung

Zur Fehlervermeidung ermöglicht der HQPlayer eine Deaktivierung von 48 kHz-Inhalten, so dass dann bei 48 kHz Quellraten immer ungeradzahlig auf DSD hochgerechnet wird.

SMLS bietet auf seiner Homepage Updates an, womit eventuell Fehler behoben werden: SMSL Audio Official -Professional audio product manufacturer (smsl-audio.com)

Zusammenfassung

Foren wie Audio Science Review (ASR) müssen sich natürlich auf einen gewissen Standard des Messverfahrens einigen, damit die Messergebnisse dauerhaft vergleichbar sind. Auf der anderen Seite sind Quellraten von 48 kHz und DSD nicht selten, so dass eine Erweiterung des Testverfahrens zu empfehlen ist.

Dieses Beispiel zeigt sehr schön die Grenzen der Messungen auf. Erst durch die Verwendung anderer Testinhalte konnten die Fehler aufgedeckt werden. Ein erhöhtes Rauschen und die Drift bei 48 kHz Inhalten sind völlig unakzeptabel. Deshalb ist es bei deiner Recherche immer wichtig, unterschiedliche Informationsquellen anzuzapfen. Dies gilt natürlich für alle Geräte.

Letztendlich soll aber immer dein Ohr entscheiden. Denn für mich ist völlig klar, dass nicht alles gemessen wird und (noch) nicht alles gemessen werden kann, was wir hören und wie es unser Gehirn umsetzt.

Du hast Fragen oder möchtest etwas beitragen? Schreibe uns: Kontaktformular
Oder schreibe per E-Mail an: info@griggaudio.de

Veröffentlicht am

Wie Modulatoren den Klang verbessern

Einleitung

In diesem Beitrag geht es um Modulatoren. Du denkst jetzt vielleicht: „Was ist das? Interessiert mich aber auch nicht, weil ich nur bitperfekt im NOS (Non Oversampling) höre“. Ist das mit deinem DAC überhaupt möglich, oder wandelt er vielleicht mehr als du denkst?

Wenn du die Architektur des DACs kennst, kannst du gezielter Verbesserungen vornehmen. Deshalb schauen wir uns einen Delta-Sigma-Chip in der Praxis an. Außerdem hat der HQPlayer einen sensationellen neuen Modulator eingeführt, den ich dir vorstellen möchte.

Grundlagen

Audioformate

Um die Funktion des Modulators richtig einordnen zu können, betrachten wir zunächst die beiden wichtigsten verlustfreien Audioformate PCM und DSD.

PCM-vs-DSD.svgQuelle: Paweł Zdziarski, CC BY 2.5, Link / Direct Stream Digital – Wikipedia

PCM (Pulse Code Modulation)

Das analoge Audiosignal wird periodisch abgetastet, indem es in diskrete Zeitabschnitte unterteilt wird. Diese Abtastwerte werden dann in binärer Form (0/1) kodiert. Dieser Vorgang ordnet dem analogen Wert einen digitalen Wert zu, der dem Amplitudenpegel (Lautstärke) des analogen Signals entspricht.

Die Audio-Abtastrate von 44,1 kHz wurde 1979 von Sony eingeführt und ist aufgrund des CD-Formats (Compact Disc) weit verbreitet. Die Bittiefe der CD beträgt 16 Bit, was einen Dynamikumfang von 96 dB (16 Bit x 6 dB) ermöglicht.

DSD (Direct Stream Digital)

Bei der Delta-Sigma-Modulation (DSD) zeigt jedes 1-Bit-Sample eine positive [1] oder negative [0] Änderung des Amplitudenpegel (Lautstärke) relativ zu seinem vorherigen Wert. Es arbeitet mit einer extrem hohen Abtastrate im Megahertz-Bereich.

Das DSD-Verfahren wurde ursprünglich bei der Super Audio CD (SACD) eingesetzt. Gespeichert wird der direkte Datenstrom eines Delta-Sigma-Modulators, der mit 2,8224 MHz arbeitet. Dies entspricht dem 64-fachen (DSD64) der Abtastrate von 44,1 kHz (Audio-CD/Red Book). Die Bittiefe beträgt 1 Bit, so dass DSD in seiner ursprünglichen Form nicht nachbearbeitet werden kann.

DAC Architektur

Wir konzentrieren uns auf die weit verbreiteten Delta-Sigma-Chips. Es gibt aber auch andere Architekturen, z.B. Ladder (R2R) DACs, die sicherlich einen eigenen Newsletter wert sind.

Delta-Sigma-Chips

Die Delta-Sigma-Modulation ist seit den 1970er Jahren mit den Fortschritten in der CMOS-Technologie kostengünstig realisierbar. Delta-Sigma-Chips werden von vielen großen Halbleiterherstellern als fertige integrierte Schaltungen angeboten. Sehen wir uns das Bild unten näher an:

Oversampling

In einem meist zweistufigen Verfahren wird im DAC ein Oversampling mit und ohne digitale Filter in den gewünschten MHz-Bereich durchgeführt. Dies ist z.B. 5,6448 MHz (44,1kHz x 128 = 5644800 kHz), was DSD128 entspricht. Dieses Oversampling ist zwingend notwendig, da der Delta-Sigma-Modulator nur im Megahertz-Bereich arbeiten kann.

Delta-Sigma-Modulator

In den gängigen Medien wirst du oft einen Modulator für ADC (Analog Digital Converter) finden, zum Beispiel hier: Delta-Sigma-Modulation – Wikipedia. Da wir nicht im Tonstudio sind, sondern Musik hören wollen, interessert uns der umgekehrte Weg.

Die digitalen Samples mit 0 und 1 gehen in den Eingangsdifferenzkonverter, welcher im hexadezimalem Wertbereich arbeitet. Dementsprechend kennt der digitale Modulator nur zwei Werte DRef- und DRef+.

Ein entstehender Messfehler wird integriert (Integrator) und über eine Gegenkopplung (negativ feedback) schrittweise kompensiert. Die Anzahl der Integratoren bzw. die Anzahl der Gegenkopplungsschleifen charakterisieren die Ordnung des ΔΣ-Modulators. Je höher die Ordnung ist, umso stärker wird die Verschiebung des Rauschens, umso höhere Frequenzen können genutzt werden. 

Der Komparator vergleicht, ob sein Eingangssignal größer oder kleiner als ein bestimmter Schwellenwert ist und gibt ein entsprechendes Ein-Bit Signal, den Bitstream aus. Dieser Bitstream wird an einen DDC (Digital-Digital-Converter) solange in eine Gegenkopplungsschleife (negative feedback) abgezweigt, bis die gewünschte Signalqualität erreicht ist. Dieser Zyklus wiederholt sich pro Abtastzyklus.

Digital-Analog-Wandlung

Der fertige Bitstream geht nun an den eigentlichen DAC (Digital-Analog-Converter). Dieser hat die Aufgabe den digitalen Datenstrom in ein analoges Signal zu wandeln. Dabei muss zwingend ein analoger Tiefpassfilter eingesetzt werden.

Die Grundlage für den Filter ist das Nyquist-Shannon-Abtasttheorem, welches nur die halbe Abtastrate (Nyquist-Frequenz) berücksichtigen darf. 

Modulatoren in der Praxis

Beispiel AKM AK4493 Chip

AKM Chips sind weit verbreitet, wie auch die ESS SABRE Chips. Sehen wir uns beispielhaft das Blockschaltbild des folgenden Chips an: AK4493SEQ | Audio D/A Converters | Audio Components | Products | Asahi Kasei Microdevices (AKM). Dieser Chip akzeptiert Quellraten von PCM 32 Bit / 768kHz und DSD512.

Quellformat PCM

PCM wird zuerst in ein Modul DATT (Dynamic Audio Transport Technology) geschoben. Soft Mute dürfte das Absenken der Lautstärke betreffen, vielleicht beim umschalten von Quellraten oder des Audio Formats. Wichtiger ist der Weg zum Modul Interpolator (De-Emphasis ist veraltet und wird nicht mehr benötigt). Der Interpolator rechnet die Quellrate auf die passende Frequenz im Megahertz-Bereich für den Delta-Sigma-Modulator hoch.

Der ΔΣ-Modulator nimmt die Daten in Empfang und erzeugt den in den Grundlagen erläuterten Bitstream, welcher dann über einen analogen Filter (SCF – Switched-Capacitor-Filter) von Digital zu Analog gewandelt wird.

Das bedeutet, dass bei DACs mit diesem oder anderen Delta-Sigma-Chips die Quelldateien im PCM Format zwangsläufig auf DSD umgerechnet werden!

Quellformat DSD

Erhält der AKM Chip Files mit DSD ist eine Umgehung möglich. Wenn bestimmte Bedingungen erfüllt sind, wird der Bitstream direkt dem analogen Filter zugeführt. Ob das in der Praxis funktioniert, ist vom DAC Hersteller abhängig. Manche DACs ermöglichen einen NOS (Non Oversampling) Betrieb, so dass die interne Verarbeitung vollständig umgangen werden kann. Der DAC erledigt dann nur noch seine eigentliche Aufgabe: die Digital-Analog-Wandlung.

NOS-fähige DACs findest du hier: Audio PC Upsampling – unverbindliche Liste von NOS-DACs.

Modulatoren im HQPlayer

Der Schöpfer vom HQPlayer Jussi Laako sagt, nur 50% der Leistung kommt von den digitalen Filtern. Die anderen 50 % stammen aus dem Modulatordesign.

Vorteile externer Modulatoren

Das On-Board-Upsampling erhöht den Jitter im DAC. Weil die Verarbeitung in der Nähe der D/A-Wandlungsstufe EMI/RFI erzeugt. Dadurch wird die eigentliche D/A-Wandlung gestört und Jitter verursacht. Wenn es durch einen externen Modulator stattdessen nur eine minimale On-Board-Verarbeitung gibt, werden EMI/RFI und Jitter reduziert.

Im DAC Chip können mangels Rechenleistung nur recht einfache Filter und Modulatoren umgesetzt werden. Auch wenn Hersteller wie AKM von VELVETSOUND™ technology oder ESS von HyperStream Modulatoren sprechen, handelt es sich vieleicht nur um Modulatoren 3. Ordnung. Das Ziel ist die Umgehung der limitierten internen DAC Verarbeitung.

Der HQPlayer bietet zum Beispiel zahlreiche Modulatoren 7. Ordnung an. Da liegen Welten dazwischen. Dementsprechend hoch ist die Anforderung an die Rechenleistung. Als Faustformel müssen für die anspruchvollsten HQPlayer Modulatoren pro Kanal ein Kern auf mind. 4 GHz getaktet werden. Für Stereo also zwei Kerne.

Für den fis Audio PC ist das kein Problem, da der Intel® Core™ i9-13900K 8 P-Cores hat, die virtuell auf 16 Cores verteilt (Hyper-Threading) eine parallele Verarbeitung ermöglichen.

Neuer HQPlayer Modulator AHM7EC5L

Der neue Modulator AHM7EC5L ermöglicht bei geringerer Rechenleistung eine höhere Abtastrate. Die Bezeichnung ist ein Akronym für Adaptime Hybrid-Modulator, 7. Ordnung, Erweiterte Kompensation, 5-stufig. Dieser Modulator kann nur für DSD1024 und höher eingesetzt werden. Obwohl es sich um einen experimentellen Modulator handelt, ist der Klang bei mir und auch bei anderen überragend!

Meine Wertschätzung für AHM7EC5L @1024 mit dem Holo May DAC. Meiner Meinung nach schlägt es Super @256 oder Light @512 mit Fokus auf saubere, tiefe Basserweiterung und Abbildung

HQ Player – Page 1211 – Software – Audiophile Style

Präzisere Bässe. Ich höre eine bessere Instrumententrennung und mehr Raum.

Which modulator do you use? – Audio Gear Talk / HQ Player – Roon Labs Community

Die Einstellungen können im HQPlayer Client „on the fly“ geändert werden.

Reduzierte Anforderung an die Rechenleistung

Ab der HQPlayer Version 5.0.0 ist positiv festzuhalten, dass die Modulatoren besser wurden und gleichzeitig die Rechenleistung zum Teil reduziert werden konnte. Der Modulator AHM7EC5L fällt in diese Kategorie.

In einem recht anspruchsvollen Szenario wird vom HQPlayer eine 44,1 kHz Datei mit dem Filter:

sinc-MGaApodisierender Gaußscher Konstantzeitfilter mit einer Million Taps bei 16- facher PCM-Ausgangsrate. Mit extrem hoher Dämpfung (65536 Umrechnungsverhältnis). Ähnlich zu poly-sinc-gauss-xla.

auf DSD1024 hochgerechnet.

Im Bild unten ist rechts die Auslastung mit 16 P-Cores (1-16) und den 2 E-Cores (17-18) zu sehen. Die P-Cores laufen auf max. 4,4 GHz, um eine energieeffiziente Verarbeitung zu erreichen. Möglich währen sogar 5,8 GHz, die hier aber nicht benötigt werden. Es ist immer gut eine CPU weit unter ihren Spezifikationen zu betreiben. Die zwei E-Cores werden nur für geringe Hintergrundaktivitäten eingesetzt. Die restlichen E-Cores (14 von 16) wurden im BIOS zur Energieeinsparung und Latenzminimierung deaktiviert. Die Auslastung der Kerne mit den Modulatoren ist mit je 40% (Kerne 1 und 9) moderat, die Gesamtbelastung ist mit 14% auch nicht hoch.

Zusammenfassung

Auch wenn das Audioformat PCM (Pulse Code Modulation) ist, wird es von den meisten DAC Chips zu DSD (Direct Stream Digital) gewandelt. Wenn du ein überzeugter NOS Hörer bist, schau dir die Architektur deines DACs an. Wenn ein Delta-Sigma-Chip verbaut ist, hörst du bei PCM kein NOS!

Bei einem Delta-Sigma-Chip wie z.B. AKM AK4493 ist es besser, DSD als Quellformat zu verwenden, da der Chip PCM zwangsläufig in DSD umwandelt. Mit DSD als Quelle werden die vergleichsweise einfachen Interpolatoren und Modulatoren des DAC-Chips umgangen.

Die Reduzierung der Verarbeitung im DAC Chip minimiert außerdem EMI/RFI und es wird dadurch weniger Jitter erzeugt.

Dabei musst du keine DSD Files kaufen oder streamen. Die meisten Audiofiles liegen sowieso in PCM vor, weil sich diese noch im Tonstudio digital nachbearbeiten lassen. Aber auch bei dir zum Beispiel mit Raumkorrekturfiltern und digitaler Lautstärkeregelung. Nutze einfach einen leistungsfähigen Audio PC und qualitativ hochwertige Filter und Modulatoren wie im HQPlayer. In Echtzeit wird PCM zu DSD gewandelt. Der DAC sieht dann das ursprüngliche Quellmaterial PCM gar nicht mehr, sondern nur noch DSD.

Der neue HQPlayer Modulator AHM7EC5L ist für mich im Moment der beste Modulator für DSD1024. Und das gleichzeitig mit reduzierter Rechenleistung. Aber auch andere Modulatoren bei geringerer Abtastrate sind in der Regel besser als im DAC. Mache dich vom DAC Design unabhängig. Nutze einen NOS fähigen DAC und freue dich über die Vielfalt der Möglichkeiten zur digitalen Musikaufbereitung. Je nach Stimmung und Musikgenre kannst du unterschiedliche Filter nutzen. Und bei Updates bist du immer mit dabei. Dafür haben wir den fis Audio PC konstruiert.

Weitere Fundstellen

Zum Vertiefen des Themas findest du einiges in unseren Audio PC Grundlagen:

Du hast Fragen oder möchtest etwas beitragen? Schreibe uns: Kontaktformular
Oder schreibe per E-Mail an: info@griggaudio.de

Veröffentlicht am Ein Kommentar

Unterschiedliche Speichermedien für Audio erklärt

Einleitung

In diesem Beitrag geht es um den nichtflüchtigen Speicher (Festpeicher) für das Betriebssystem und die Musikfiles. Welche Speicher eignen sich am besten für welche Zwecke?

Bevor wir diese Frage erörten folgen als erstes Grundlagen zu den Speichertechniken.

Grundlagen*

Welche Speichermedien gibt es?

Eine kleine Historie: Vor der SSD-Festplatte (Solid State Disc) gab es HDD-Festplatten (Hard Disk Drive), die mit einem mechanischen Arm und Magnetplatten funktionieren. SSD-Technik läuft ohne diese Bauteile, daher sind die Formen deutlich kompakter, schneller und vor allem lautlos.

HDD-Festplatten (Hard Disk Drive)

Eine HDD ist eine magnetische Datenspeichertechnologie, die zur langfristigen Speicherung großer Datenmengen in Computern und anderen elektronischen Geräten verwendet wird. Sie besteht aus mehreren rotierenden magnetischen Scheiben, die mit einer dünnen Schicht aus magnetischem Material beschichtet sind. Ein beweglicher Arm mit einem Lesekopf liest und schreibt Daten auf diese Scheiben.

Im Vergleich zu Solid-State-Laufwerken (SSDs) haben HDDs typischerweise höhere Latenzzeiten und niedrigere Bandbreiten. Dennoch bleiben HDDs aufgrund ihrer vergleichsweise niedrigeren Kosten pro Speicherkapazität weiterhin weit verbreitet, insbesondere für die Speicherung großer Datenmengen, bei denen schnelle Zugriffszeiten nicht unbedingt erforderlich sind.

SSD-Festplatte (Solid State Disc)

SSD verwendet Flash-Speicherchips anstelle von mechanischen Komponenten, um Daten zu speichern. Eine SSD besteht aus Flash-Speicherbausteinen, die ohne bewegliche Teile funktionieren.

Im Vergleich zu HDDs haben SSDs extrem niedrige Latenzzeiten. Dies liegt daran, dass SSDs auf nicht-mechanischen Speicherzellen basieren, was bedeutet, dass keine beweglichen Teile vorhanden sind, die sich bewegen müssen, um auf die Daten zuzugreifen.

USB-Flash-Laufwerke

USB-Flash-Laufwerke, auch als USB-Sticks oder USB-Flash-Laufwerke bezeichnet, sind kleine, tragbare Speichergeräte, die Flash-Speichertechnologie verwenden und über eine USB-Schnittstelle an Computer und andere Geräte angeschlossen werden können. Sie sind für ihre Benutzerfreundlichkeit, Mobilität und Vielseitigkeit bekannt.

Die Bandbreite und Latenzen von USB-Flash-Laufwerken können je nach verschiedenen Faktoren variieren, einschließlich der verwendeten USB-Spezifikation (z. B. USB 2.0, USB 3.0, USB 3.1, USB 3.2 Gen 1, Gen 2 usw.) und der Qualität des Flash-Speichers im Stick.

SD-Karten (Secure Digital Cards) und microSD-Karten

SD-Karten (Secure Digital Cards) und microSD-Karten sind kleine, tragbare Speicherkarten, die in einer Vielzahl von Geräten wie Kameras, Smartphones, Tablets, tragbaren Spielkonsolen und anderen elektronischen Geräten verwendet werden. Sie bieten nichtflüchtigen Speicherplatz und verwenden Flash-Speichertechnologie für die Datenspeicherung.

Die Bandbreite und Latenz einer SD-Karte oder microSD-Karte hängt von der Qualität des verwendeten Flash-Speichers, der Schreib- und Lesevorgänge sowie der Kompatibilität mit dem Gerät, in dem sie verwendet wird, ab.

Welche Schnittstellenprotokolle gibt es?

SATA (Serial Advanced Technology Attachment)

SATA ist eine häufig verwendete Schnittstelle für den Anschluss von Festplattenlaufwerken (HDDs) und Solid-State-Drives (SSDs) an Computer. Es gibt verschiedene Iterationen wie SATA I, SATA II, SATA III, wobei SATA III die aktuellste und schnellste Version ist.

SATA verwendet oft kabelgebundene Daten- und Stromanschlüsse, die in verschiedenen Größen für unterschiedliche Geräte verfügbar sind.

eSATA ist eine externe Schnittstelle, die ähnlich wie SATA funktioniert, jedoch für den Anschluss externer Festplatten verwendet wird. Es bietet höhere Geschwindigkeiten im Vergleich zu USB 2.0, obwohl nicht so schnell wie USB 3.0 oder Thunderbolt.

SATA war lange Zeit die vorherrschende Schnittstelle für den Anschluss von Massenspeichergeräten in Computern aufgrund seiner einfachen Handhabung, seiner Zuverlässigkeit und seiner Verfügbarkeit. Allerdings hat NVMe (Non-Volatile Memory Express) aufgrund seiner höheren Übertragungsgeschwindigkeiten und niedrigeren Latenzzeiten in den letzten Jahren in Bereichen mit anspruchsvollen Anwendungen und High-End-Computern an Bedeutung gewonnen.

NVMe (Non-Volatile Memory Express)

NVMe ist ein leistungsstarkes, effizientes und hochmodernes Schnittstellenprotokoll, das speziell für die Kommunikation zwischen dem Hostsystem (normalerweise dem Prozessor) und schnellen, nichtflüchtigen Speichergeräten wie Solid-State-Drives (SSDs) entwickelt wurde.

NVMe wurde entwickelt, um die Leistungsfähigkeit von schnellen SSDs voll auszuschöpfen. Es nutzt das PCIe (PCI Express) Businterface, was eine erhebliche Steigerung der Datenübertragungsraten im Vergleich zu älteren Protokollen wie SATA ermöglicht. NVMe bietet im Vergleich zu älteren Standards wie SATA deutlich niedrigere Latenzzeiten. Diese geringe Latenzzeit ermöglicht schnellere Datenzugriffe und schnellere Reaktionszeiten, was insbesondere in rechenintensiven Anwendungen und Workloads von Vorteil ist.

NVMe wurde entwickelt, um die Besonderheiten und Vorteile von Flash-Speicher effizienter zu nutzen. NVMe-basierte SSDs sind oft in Formfaktoren wie M.2-Karten oder als PCIe-Erweiterungskarten verfügbar. Diese SSDs werden direkt an den PCIe-Steckplatz des Motherboards angeschlossen, was Platz spart und die Installation erleichtert.

Welche Speicher-Formfaktoren gibt es?

Neben den USB-Sticks und Speicherkarten, die jeder kennt, gehe ich hier nur auf die Besonderheiten im Audio PC ein.

PCI Express (PCIe)

PCIe ist eine leistungsstarke Schnittstellentechnologie, die in modernen Computern für die Anbindung von Hochleistungs-Solid-State-Drives (SSDs) wie NVMe (Non-Volatile Memory Express) verwendet wird. NVMe nutzt PCIe und bietet sehr hohe Übertragungsraten im Vergleich zu SATA-basierten Laufwerken.

PCIe-Anschlüsse kommen in verschiedenen physischen Formfaktoren, einschließlich x1, x4, x8, x16 und x32, wobei die Zahlen die Anzahl der verfügbaren Lanes angeben. Die x1-Steckplätze sind für kleinere Erweiterungskarten wie Soundkarten oder Netzwerkkarten geeignet, während x16-Steckplätze oft für leistungsfähigere Komponenten wie Grafikkarten verwendet werden. Die im fis Audio PC favorisierte Hochleistungsnetzwerkkarte Solarflare X2522 benötigt einen X8 Steckplatz und hebt sich mit geringsten Latenzen und Jitter von den gängigen Netzwerkkarten ab.

M.2

M.2 ist ein Formfaktor, der mit PCIe oder SATA Schnittstellen verbunden sein kann und in vielen modernen Laptops und Motherboards für den Anschluss von SSDs verwendet wird. Dies ermöglicht eine kompakte Bauweise und schnelle Datenübertragungsraten.

Üblich ist ein Formfaktor (also die Größe der SSD-Karte) von 2280, dass bedeutet eine Breite von 22 mm und einer Länge von 80 mm. Alle M.2-SSDs passen in M.2-Sockel auf Systemplatinen. Der M.2-Formfaktor führt zu mehr Leistung bei kleinerem Platzbedarf und ist die Zukunft für den technischen Fortschritt bei SSDs. Zudem sind weder Strom- noch Datenkabel erforderlich und somit auch keine Kabelführung!

Welche Speicherzellentypen gibt es?

NAND

NAND ist eine Abkürzung für „NOT AND“ und bezieht sich auf eine logische Schaltung in der Digitaltechnik. NAND ist eine der grundlegenden logischen Gatterarten in der elektronischen Schaltungstechnik.

Ein NAND-Gatter ist ein digitaler Schaltkreis, der aus mehreren Transistoren besteht und eine logische Operation ausführt, die das Gegenteil der „AND“-Operation darstellt. Es hat zwei oder mehr Eingänge und gibt einen Ausgang basierend auf der Negation der „AND“-Operation zurück. Das bedeutet, dass das NAND-Gatter „WAHR“ (logisch 1) ausgibt, es sei denn, alle Eingänge sind „WAHR“, in diesem Fall gibt es „FALSCH“ (logisch 0) zurück.

In der Speichertechnologie bezieht sich NAND speziell auf eine Art von Flash-Speicher, der in vielen nichtflüchtigen Speichergeräten wie Solid-State-Drives (SSDs), USB-Flash-Laufwerken, Speicherkarten und anderen Speichergeräten verwendet wird.

Speicherzellen 1 Bit (SLC), 2 Bit (MLC), 3 Bit (TLC) oder 4 Bit (QLC)

Speicherzellen können mit 1 Bit (SLC), 2 Bit (MLC), 3 Bit (TLC) oder gar 4 Bit (QLC) Bit beschrieben werden. Mehr Bit an Informationen haben den Vorteil, das weniger Speicherchips für dieselbe Speicherkapazität benötigt werden. Das senkt die Kosten und macht mittlerweile Endkunden-SSDs im Standardformat mit bis zu 8 TB Kapazität möglich.

Mehr Bits haben aber auch gravierende Nachteile: die Schreibleistung und die Haltbarkeit sinken. Hinzu kommen Berichte, wonach sich Mehrbit-Speicherzellen schlechter anhören.

Im Bild unten sind die Vorteile von 1 Bit (SLC) klar zu erkennen:

  • Geringerer Stromverbrauch und dadurch rauschärmer
  • Geringste Latenzen = größere Verarbeitungsgeschwindigkeit
    Verdoppelt sich für jeden Bit pro Zelle, so wie es auch bei der Energie geschieht.
  • Geringere Latenzen bedeuten auch geringerer Jitter.
  • Sehr lange Haltbarkeit
  • Weniger Fehler
    Die Fehler nehmen für jeden Bit pro Zelle zu und damit die Menge an Error Correction Code im SSD-Controller.

Der Nachteil liegt in den zum Teil exorbitant hohen Preisen.

3D XPoint Speicher (Intel Optane)

3D XPoint ist eine von Intel und Micron Technology entwickelte, im Juli 2015 vorgestellte und im Juli 2022 abgekündigte Bauart nichtflüchtiger Datenspeicher. Im Vergleich zu NAND-Flash-Speicher hat 3D XPoint eine geringere Speicherlatenz und lässt sich häufiger überschreiben. Die Optane SSD verwendet die NAND-Technologie nicht, aber in Bezug auf die Bits pro Zelle ist sie ähnlich wie die SLC SSD. 

Die Technologie basiert auf der Veränderung des elektrischen Widerstands und hat eine räumliche Gitterstruktur. Die Speicherchips kommen ohne Feldeffekttransistoren aus, was eine höhere Integrationsdichte ermöglicht.

Intel hat zur großen Verwirrung beigetragen, da es unterschiedliche Optane-Speicher für unterschiedliche Zwecke gibt. Optane kann durch ein kleines Cache-Laufwerk dargestellt werden, das in Verbindung mit einem langsameren Speichergerät wie einer herkömmlichen SATA-Festplatte gebraucht wird. Solcher Cache kann in ein Hybrid-Speicher-Modul integriert werden und dort ein größeres NAND-basiertes Solid-State-Laufwerk ergänzen. Diese Lösung erforderte einen tiefen Eingriff in den Maschinenraum (BIOS) des Computers und zusätzlich eine aufwändige Treiberkonfiguration.

Zudem kann Optane als schnelles eigenständiges Laufwerk zum dauerhaften Speichern verwendet werden. Diese Lösung funktionert wie jede andere SSD auch. Einfach im Motherboard anschließen und die SSD wird automatisch erkannt. Sehr geeignet für Betriebssysteme. Wir bieten für den fis Audio PC folgende Intel Optane SSDs im Format M.2/80 mm an:

Und schließlich gibt es speicherorientierte Optane-Produkte, die neben DRAM-Modulen eingesetzt werden. Diese Lösung wurde meines Wissens am wenigsten genutzt, da Arbeitsspeicher immer preiswerter wird.

Speicherlatenzen

Warum Latenzen in Audio PCs so wichtig sind habe ich hier beschrieben: Audio PC Latenzen. Geringste Latenzen bedeuten automatisch weniger Jitter!

Bei den Latenzen zeigen sich deutliche Unterschiede. Während sich im Bild unten die CPU mit ihren L1-L3 Cache und der Arbeitsspeicher an der Spitze (links) befinden, liegt ein Intel Optane (PCIe) Speicher mit 10 µs deutlich vor einer NAND (SATA) SSD mit bis zu 1 000 µs (1 ms).

Speicher im Audio PC

Auswahlkriterien

Im fis Audio PC lege ich großen Wert auf den richtigen Einsatz der unterschiedlichen Speichermedien. Denn das Betriebssystem hat andere Anforderungen an den Speicher, als die Mediadaten.

Speichergröße

Beim Betriebssystem wie Windows 11 Pro sollen mindestens 100GB verwendet werden. Beim HQPlayer OS reichen stattdessen 16GB.

Bei den Mediadaten hängt es natürlich von der eigenen Musiksammlung ab. Als Faustformel gilt hier ein Speicherbedarf von 500 MB pro CD im Dateiformat FLAC. Demnach ergibt sich für einen 1 TB großen Datenträger ein Speichervolumen von 2.000 CD’s oder ca. 30.000 Titeln.

Formfaktor

Das beste Kabel ist kein Kabel. Wer diesen Grundsatz beherzigt, investiert lieber in keine teuren SATA Kabel, sondern nutzt gleich die Formfaktoren M.2 und PCIe. Hinzu kommt, dass beide Anschlussarten oft eine direkte Anbindung an die CPU ermöglichen und keinen Umweg über den Chipsatz machen.

Rauschfreiheit

Alle Speichermedien erzeugen elektromagnetisches Rauschen. Dieses gilt es gering zu halten. Wer SATA Speicher verwendet, darf sich neben den ungünstig hohen Latenzen auch noch über das Rauschen des SATA Controllers freuen. Die SATA Kabel führen an hochfrequenten Bauteilen vorbei und können das Rauschen noch verstärken.

Zwar ermöglicht der fis Audio PC Anschlussmöglichkeiten von SATA. Ich rate jedoch dringend davon ab. Im fis Audio PC wird der SATA Controller standardmäßig deaktiviert.

Speicherzellen mit 1 Bit (SLC) oder 3D XPoint benötigen weniger Energie und sind daher rauschärmer als andere Speicherzellentypen.

Haltbarkeit

In der Regel geben Hersteller eine Schätzung mit den so genannten Terabyte(s) written (TBW) ab. Also der maximal möglichen Schreibrate bis zum Ausfall. Die sind auch beim Speichertyp QLC schon so großzügig bemessen, dass eine Haltbarkeit von 5 Jahren (oft die auf TBW eingeschränkte Herstellergarantie) und länger sehr wahrscheinlich ist.

Speicher für das Betriebssystem

Wer die haltbarsten SSD Speicher mit geringsten Latenzen nutzen will, der nimmt die NAND Speicher vom Typ SLC. Hier bieten sich die Intel Optane Serien an, die mit 3D XPoint ähnlich funktionieren. Leider werden sie nicht mehr produziert, aber es gibt noch Restbestände.

Für ein schankes Betriebssystem wie das HQPlayer OS bietet sich der Intel® Optane™ Arbeitsspeicher der Produktreihe M10 16 GB, M.2/80 mm, PCIe 3.0, 20 nm, 3D XPoint™ an. Die sequenziellen Lesezugriffe (bis zu) 900 MB/s und die sequenziellen Schreibzugriffe (bis zu) 150 MB/s sind nicht berauschend. Aber auf die Transferraten kommt es beim Betriebssystemzugriff weniger an, sondern auf die Verarbeitungszeit. Die Lesezugriffslatenz liegt bei sehr niedrigen 7 µs und die Schreibzugriffslatenz bei niedrigen 18 µs. Für größere Betriebssysteme wie Windows 11 Pro reichen 16 GB nicht aus. Für diesen Zweck bietet sich die Intel® Optane™ SSD der Produktreihe P1600X 118 GB, M.2/80 mm PCIe* 3.0 x4, Intel® 3D XPoint™ an.

Speicher für Mediadaten

Als Lösung drängt es sich vordergründig auf die Musikfiles direkt auf dem Audio PC abzuspeichern und abzuspielen. Es muss nur ein Gerät untergebracht werden und je näher die Quelle ist, desto besser könnte es klingen. Wer die beste Qualität haben will, muss tief in die Tasche greifen.

Bei den Mediadaten können die großen Intel Optane Serien verwendet werden. Nur sind die leider sehr teuer, siehe Auswahl auf Geizhals.de: Festplatten & SSDs » Solid State Drives (SSD) mit Kapazität ab 1TB, Speicherzellen-Typ: SLC (1 Bit pro Zelle).

Es gibt Hersteller, welche eine herkömmliche NAND SSD mit TLC Speicherzellen als Pseudo-SLC SSD modifizieren. Dadurch wird der Speicherplatz um ein Drittel reduziert. Der Hersteller Zzyzx ermöglicht sogar noch eine externe (lineare) Stromversorgung und hat eine Femto Clock auf die Platine montiert. Kein billiges Vergnügen.

Revelation Femto SSD | Zzyzx (zzyzxphile.com)

Es ist meines Erachtens sinnvoller für deutlich weniger Geld in ein hochwertiges NAS zu investieren. Dort können dann preisgünstige moderne QLC-SSDs montiert werden. Einen guten Anhaltspunkt bieten Tests von zum Beispiel ComputerBase Bestenliste: SSD-Kaufberatung.

Hinzu kommt meine eigene Erfahrung. Den besten Klang erzielte ich bisher mit einer klaren Trennung zwischen Audio PC und dem Control PC (Music Server – NAS). Der mutmaßliche Grund liegt darin, dass ein Musikplayer wie z. B. Roon ständig mit dem Internet die Metadaten abgleicht und die Festplatten fortwährend nach neuer Musik absucht. Starke Festplattenaktivitäten sind natürlich auch beim eigentlichen Abspielen zu verzeichnen. Es schleichen sich im Hintergrund schnell elektronisches Rauschen und Interrupts ein, welche die typischen digitalen Schärfen und ein anämisches Klangbild ergeben. Siehe auch Grundlagen Audio PC & Control PC.

Der Control PC kann als NAS (Network Attached Storage) dargestellt werden, über den per Netzwerk zugegriffen wird. Ein NAS kann deshalb irgendwo im Keller stehen. NAS von z. B. QNAP oder Synology sind je nach Ausgestaltung preisgünstig und beliebt. Wer sich nicht auf eine proprietäre Software einlassen will und mehr Rechenleistung benötigt oder das NAS in der Nähe der Anlage betreibt, schafft sich etwas Lüfterloses wie zum Beispiel von Cirrus7 oder HFX an.

Unten im Bild wird als Control PC für die Steuerung und Verwaltung der Musik ein NAS mit dem Roon Core eingesetzt. Für die Musikwiedergabe wird der Audio PC genutzt und dieser rendert mit dem HQPLayer die Daten in bester Auflösung und sendet sie störungsfrei an den DAC.

Zusammenfassung

Speicher ist nicht gleich Speicher. Und es kommt auf den Einsatzzweck an. Für das Betriebssystem verwendest du am besten kleine Intel Optane SSDs mit 3D XPoint, die ähnlich wie 1 Bit (SLC) Speicherzellen funktionieren. Den diese rauschärmer und bieten den schnellsten Speicherzugriff mit geringsten Latenzen und Jitter und sind lange haltbar.

Für eine direkte Anbindung an die CPU unter Umgehung des Chipsatzes auf dem Motherboard empfehle ich die Formfaktoren M.2 und PCIe. Diese haben keine Kabel und werden direkt an das Motherboard angeschlossen.

Für deine Mediathek sind höhere Speicherkapazitäten erforderlich. Anstatt die Speicher im Audio PC mit zu verbauen empfehle ich stattdessen die Nutzung eines Control PCs, der auch ein NAS sein kann.

Vermeide SATA Festplatten, denn diese sind nicht nur extrem langsam, sondern erzeugen tendenziell mehr Rauschen.

Manche schwören auf USB-Sticks oder sogar auf SD-Karten, weil letztere besonders rauscharm sein sollen. Ich halte diese Speichermedien für sehr fehleranfällig und langsam. Und sie lassen sich auch nicht direkt an die CPU anbinden. Ich empfehle sie deshalb nicht.

Du hast Fragen oder möchtest etwas beitragen? Schreibe uns: Kontaktformular
Oder schreibe per E-Mail an: info@griggaudio.de

*ChatGPT hat mir beim Schreiben geholfen.

Veröffentlicht am

Bist du Grundton- oder Obertonhörer?

Einleitung

Vielleicht rollst du jetzt die Augen und denkst: Ist doch egal, Hauptsache mir gefällt die Musik. Aber es kann nützlich sein zu wissen, wie Menschen hören und wie man selbst tickt.

Denn das ermöglicht die gezielte Suche nach deinen bevorzugten Stilrichtungen und hilft im Player sogar bei der Auswahl von Filtern.

Wir sehen uns folgend in den Grundlagen die Grund- und Obertöne und die Transienten an. Dann erörtern wir eine interessante Studie, die auch einen eigenen Test ermöglicht.

Grundlagen

Grundtöne und Obertöne*

Der Grundton ist der tiefste Ton oder die Grundfrequenz, die in einem Klang oder Ton erzeugt wird. Es ist der dominante Ton, den wir hören, wenn beispielsweise eine Saite gezupft, ein Instrument gespielt oder eine Stimme singt. Der Grundton bestimmt die Tonhöhe des Klangs. In der Regel hat jeder Klang einen charakteristischen Grundton, der ihm seine spezifische Klangfarbe verleiht. Der Grundton ist der erste und stärkste Ton in einem Klang und wird oft als das Hauptelement eines Klangs wahrgenommen.

Die Obertöne sind zusätzliche Töne, die über dem Grundton eines Klangs schwingen. Diese Obertöne sind ganzzahlige Vielfache der Grundfrequenz und haben eine höhere Frequenz als der Grundton. Obertöne bestimmen die Klangfarbe oder das Timbre eines Tons. Sie verleihen einem Klang seine einzigartige Charakteristik und helfen dabei, verschiedene Instrumente oder Stimmen voneinander zu unterscheiden. Obertöne tragen zur Klangqualität und -textur bei, indem sie dem Klang Reichtum, Wärme und Brillanz verleihen.

Die meisten natürlichen Klänge bestehen aus einem Gemisch aus Grundton und Obertönen. Die spezifischen Obertöne und ihre Intensitäten variieren je nach Klangquelle. Zum Beispiel kann die Art und Weise, wie eine Gitarrensaite gezupft wird oder wie ein Instrument gespielt wird, die Stärke und Anzahl der Obertöne beeinflussen.

In der Musik werden die Obertöne oft genutzt, um Klangfarben zu erzeugen, Harmonien zu erweitern oder Klänge zu formen. Sie spielen eine entscheidende Rolle in der Klangwahrnehmung und sind ein wichtiger Bestandteil der akustischen Eigenschaften von Musikinstrumenten und menschlichen Stimmen.

Transienten*

In der Akustik bezieht sich der Begriff „Transienten“ auf schnelle und vorübergehende Schallereignisse, die eine kurze Dauer haben und einen raschen Anstieg und Abfall der Schallenergie aufweisen. Transienten sind charakterisiert durch ihre schnelle Veränderung in der Schallintensität über einen kurzen Zeitraum. Der Anschlag eines Schlaginstruments wie einer Trommel oder eines Beckens erzeugt eine schnelle Schallwelle, die als Transient bezeichnet wird.

Das Hören von Transienten spielt eine wichtige Rolle in der Evolution des Menschen, insbesondere in Bezug auf die Überlebensfähigkeit und die Anpassung an die Umgebung. Transiente Geräusche können wichtige Informationen über Gefahren liefern. In der Natur könnten plötzliche Geräusche wie das Rascheln von Büschen, das Brechen von Ästen oder das plötzliche Knacken eines Zweigs auf die Anwesenheit von Raubtieren oder anderen potenziellen Bedrohungen hinweisen. Die Fähigkeit, diese Transienten wahrzunehmen und zu interpretieren, könnte dazu beigetragen haben, dass unsere Vorfahren frühzeitig auf Gefahren reagieren konnten, was ihre Überlebenschancen verbesserte.

Studie

Obertonhörer? Grundtonhörer? Hörtypen und ihre Instrumente.

Im Artikel „Obertonhörer? Grundtonhörer? Hörtypen und ihre Instrumente.“ von W.Gruhn, E.Hofmann, P.Schneider 2012 wurde eine Studie aus 2002 mit 2.000 Probanden beschrieben. Es wurde postuliert, dass zwei Möglichkeiten zur Tonhöhenwahrnehmung bestehen. Je nachdem, ob sich ein Hörer eher an der Grundfrequenz eines harmonischen Klangs (das heißt an dessen Grundton) oder an dessen Obertonstruktur orientiert.

Mit der Positronenemissionstomografie (PET) als bildgebendes Verfahren wurde die Aktivierung des auditorischen Cortex (Hörcortex) beim Hören von musikalischen Klängen in Abhängigkeit von spektralen und zeitlichen Aspekten zu untersucht.

Linker Hörcortex – Grundtonhörer

Die zeitlichen Verarbeitungsvorgänge (Tonlänge und Rhythmus) wurden im linken Hörcortex verortet. Die Gitarre spricht zum Beispiel verstärkt den Rhythmus an.

Kurztest  – Forschungsgruppe Musik und Gehirn-PD Dr. Peter Schneider,Heidelberg (musicandbrain.de)

Welche Instrumente Grundtonhörer bevorzugen

Grundtonhörer bevorzugten oft Musikinstrumente, die kurze, scharfe oder impulsive Töne produzieren. Zum Beispiel Schlagzeug, Gitarre, Klavier, Trompete, Querflöte oder hohe Soloinstrumente.

Sie bevorzugten virtuose, impulsive und zeitlich synchrone Spielweisen. Dirigenten sind übrigens oft Grundtonhörer.

Rechter Hörcortex – Obertonhörer

Die spektralen sowie musikspezifischen Verarbeitungsvorgänge (Klangfarbe und Melodiekontur) wurden im Hörcortex der rechten Gehirnhälfte abgebildet. Ein Beispiel ist der Kontrabass.

Kurztest  – Forschungsgruppe Musik und Gehirn-PD Dr. Peter Schneider,Heidelberg (musicandbrain.de)

Welche Instrumente Obertonhörer bevorzugen

Die Obertonhörer bevorzugten in der Regel Musikinstrumente, die länger ausgehaltene Töne mit charakteristischen Klangfarben produzieren. Zum Beispiel Streich-, Blech- oder Holzblasinstrumente in tieferen Lagen, Orgel oder Gesang.

Kurztest zur Grundton- und Obertonerkennung

Du kannst selbst testen, wo deine Schwerpunkte liegen: Kurztest  – Forschungsgruppe Musik und Gehirn-PD Dr. Peter Schneider,Heidelberg (musicandbrain.de). Der Testablauf ist recht einfach. Als erstes wirst du auf der Seite gebeten, die Lautstärke mit einem Testton einzustellen. Anschließend siehst du das Bild unten. Mit „Abspielen“ werden zwei Töne abgespielt. Du sollst beurteilen, ob die Tonfolge ansteigend (klicke auf die linke Schaltfläche o o) oder absteigend (klicke auf die rechte Schaltfläche o o) ist. Wenn du dir unsicher bist, wiederhole die Tonfolge. Die Töne hören sich synthetisch an und sind daher gewöhnungsbedürftig. Du kannst den kompletten Test jederzeit wiederholen.

Kurztest  – Forschungsgruppe Musik und Gehirn-PD Dr. Peter Schneider,Heidelberg (musicandbrain.de)

Wenn alle Tonfolgen gespielt wurden, erhältst du eine kurze verbale Auswertung. Bei mir stand: „Sie sind ein leichter Obertonhörer.“ Also nicht ganz eindeutig, aber realistisch. Denn ich schätze Klangfarben und Gesang sehr. Ich bin aber den perkussiven Instrumenten und generell rhythmischer Musik ebenfalls sehr zugetan.

Die Wahl des richtigen Filters

Bei der Wiedergabe von digitalen Quellen kann die Auswahl des Filters deinen persönlichen Hörgeschmack unterstützen! Hier führt für mich kein Weg am HQPlayer vorbei, weil nur dieser die spezifischen Auswahlmöglichkeiten bietet.

Wenn ich Electronic, Jazz, Blues, Pop und Rock höre, bevorzuge ich aufgrund der Rhythmik einen transientenbezogenen Filter wie zum Beispiel „poly-sinc- gauss-short“. Es handelt sich um einen kurzen gaußschen Polyphasen-Sinc-Filter mit optimalen Zeit-/ und Frequenzgang. Der Filter spricht in erster Linie den Grundtonhörer an. Bei SDM-Ausgängen erfolgt die Verarbeitung in zwei Stufen mit 16-facher Zwischenrate und ist deshalb selbst bei DSD1024 noch gut zu betreiben.

Bei Classical, Jazz und Blues meist in HiRes höre ich gern den Filter „poly-sinc- gauss-xl“. Es handelt sich um einen extra langen gaußschen Polyphasen-Sinc-Filter mit extrem hoher Dämpfung. Optimaler Zeit-Frequenzgang. Bei SDM-Ausgängen erfolgt die Verarbeitung in zwei Stufen mit 16-facher Zwischenrate. Er eignent sich sehr gut für Transienten, Klangfarben und für die räumliche Darstellung. Also ein Allrounder für Grundton- und Obertonhörer.

Die Filterauswahl ist sehr individuell! Einen Überblick erhältst du hier: Audio PC HQPlayer Filtereigenschaften – Grigg Audio Solutions.

Zusammenfassung

Wie schon im letzten Newsletter: Was bringt HiRes, wenn der Mensch nur bis 20 kHz hört? beschrieben, bietet die Hirnforschung einige Überraschungen. Nicht nur, dass der Mensch nachweislich auf Ultraschall reagiert, sondern auch dass die Grund- und Obertöne verschiedene Hirnareale unterschiedlich ansprechen. Und der Mensch sehr individuell entweder veranlagungs- oder/und lernbedingt mehr Grund- oder Obertonhörer ist.

Lieben Grundtonhörer schnelle, kurze Impulse, virtuose Fingerübungen und präzise Rhythmen, so schmeicheln dem Obertonhörer lange, getragene Melodien, Klangfarben und Harmonien. Kommen dem Grundtonhörer Instrumente wie Schlagzeug, Gitarre, Klavier und hohe Soloinstrumente entgegen, bevorzugen Obertonhörer dagegen Streich- sowie Blech- oder Holzblasinstrumente in tieferen Lagen, Orgel und Gesang.

Wenn du es genau wissen willst, was du bevorzugst, dann mache den Kurztest. Und wähle unterstützend zu deiner Hörausprägung bei digitalen Quellen die passenden Filter.

Du hast Fragen oder möchtest etwas beitragen? Schreibe uns: Kontaktformular
Oder schreibe per E-Mail an: info@griggaudio.de

Veröffentlicht am

Was bringt HiRes, wenn der Mensch nur bis 20 kHz hört?

Einleitung

Es ist die stets wiederkehrende Frage, was High Resolution (HiRes) überhaupt bringt? In der digitalen Signalverarbeitung liegen die Vorteile zum Beispiel im Einsatz von flacheren Filtern.

Und Analog? Dazu gibt es mittlerweile gut erforschte und verblüffende Erkenntnisse. In den Grundlagen beleuchten wir das menschliche Hörvermögen und sehen uns dann die möglichen Vorteile von HiRes an.

Grundlagen

Menschliches Hörvermögen

Unser Hörvermögen basiert auf zwei Hauptmerkmalen: der Frequenz (Tonhöhe) und der Lautstärke (Schallintensität und Dynamik). Diese beiden Eigenschaften ermöglichen es uns, Klänge und Geräusche in unserer Umgebung zu erkennen und zu verstehen.

Frequenzbereich*

Das menschliche Hörvermögen erstreckt sich in der Regel über einen Frequenzbereich von etwa 20 Hertz (Hz) bis 20.000 Hertz. Dieser Bereich wird als hörbares Spektrum bezeichnet. Innerhalb dieses Spektrums können wir eine Vielzahl von Tönen und Klängen wahrnehmen. Die Frequenz eines Tons wird in Hertz gemessen, wobei niedrige Frequenzen tiefe Töne und hohe Frequenzen hohe Töne erzeugen. Das menschliche Ohr ist empfindlich für eine breite Palette von Frequenzen, was es uns ermöglicht, Musik, Sprache, Tierlaute und andere Geräusche zu hören und zu unterscheiden.

Lautstärke*

Das menschliche Hörvermögen umfasst einen beeindruckenden Dynamikbereich in Bezug auf die Lautstärke, der in Dezibel (dB) gemessen wird. Der Durchschnittsbereich, den die meisten Menschen wahrnehmen können, liegt etwa zwischen 0 dB (die Hörschwelle, bei der die leisesten hörbaren Töne wahrgenommen werden) und 120 dB (der Schmerzschwelle, bei der Schall als schmerzhaft laut empfunden wird). Dieser Bereich erstreckt sich über insgesamt 120 dB.

Hier ist eine grobe Aufteilung dieses Bereichs:

dBHörbereich
0Die Hörschwelle, bei der leiseste hörbare Töne wahrgenommen werden.
20-40Flüstern, leise Umgebungsgeräusche.
60-80Normale Gespräche, Radio- oder Fernsehgeräusche.
80-90Straßenlärm, Staubsauger, laute Musik in einem Auto.
90-100Rasenmäher, Baustellenlärm.
110Rockkonzerte, Schallpegel in lauten Bars.
>120Flugzeugstart, laute Explosionen, Schmerzschwelle.

Frequenzabhängige Hörschwelle

Die Hörschwelle beginnt beim Menschen nicht linear mit 0 dB, sondern ist von der Frequenz abhängig. Die untere Linie zeigt Hörschwelle und der gestrichelte Anteil beschreibt die mögliche Hörkurvenveränderung durch übermäßige Hörbelastung. Die obere Linie ist die Schmerzgrenze. Die 0 dB-Hörschwelle wird zwischen 1kHz und 5kHz erreicht. Bei den niedrigen und sehr hohen Frequenzen muss der Schalldruck stattdessen deutlich höher sein.

Dynamikbereich

Wenn wir von maximal 110 dB Musik-Lautstärke ausgehen und die Musik ab 20 dB hörbar ist, dann hören wir in der Regel in einem Dynamikbereich von ca. 90 dB. Allerdings umgibt uns auch ein Grundlärmpegel. In einem ruhigen Schlafzimmer bei Nacht liegt das Grundgeräusch bei ca. 30 dB, in einer „leisen“ Bücherei liegt der Grundlärmpegel schon bei 40 dB.

Hinzu kommt der Maskierungseffekt. Dieser tritt auf, wenn mehr als nur ein Ton in Erscheinung tritt. Ist als Beispiel ein 1000-Hz-Ton im Raum vorhanden, bildet sich spektral gesehen um diesen herum eine akustische Maske. Das heisst, Töne in der Nähe (vor allem oberhalb) dieses Tones kann unser Gehör erst aber einer gewissen Lautstärke wahrnehmen. So schmilzt der Dynamikbereich zusammen.

Im Alter abnehmende Hörfähigkeit

Mit zunehmenden Alter nimmt deine Hörfähigkeit ab. Jedenfalls dann, wenn du nicht gerade einem Naturvolk angehörst, denn diese Völker kennen das Problem nicht. Die Schwerhörigkeit im Alter betrifft hauptsächlich die hohen Frequenzen.

Unten im Bild ist der Anstieg der Hörschwelle mit zunehmendem Lebensalter bei Frauen (links) und Männern (rechts) dargestellt. Männer sind stärker vom Hörverlust betroffen als Frauen.

Frequenzbereiche von Musikinstrumenten und Stimmen

Grundtöne und Obertöne

Die Grundtöne bestimmen die wahrgenommene Tonhöhe, während die Obertöne, die ein Vielfaches des Grundtons sind, die Klangfarbe erzeugen. Also beispielsweise, ob wir bei gleichem Grundton eine Geige oder eine Flöte hören. Der Grundton ist oft der lauteste und klarste Bestandteil eines Klangs, während die Obertöne in den höheren Frequenzen leiser werden.

Instrumenten Frequenz-Diagramm

Im Diagramm unten wird die jeweilige Bandbreite der Instrumente dargestellt. Die Grundtöne (Fundamentals) sind in dunkler Farbe dargestellt und die Obertöne (Harmonics) sind aufgehellt. Es ist gut zu erkennen, dass nur einzelne Instrumente mit ihren Grund- und Obertönen über 10kHz hinausgehen.

High Resolution (HiRes)

Definition*

Die HiRes Aufnahmen verwenden oft eine höhere Abtastrate als herkömmliche Audioformate. Während CDs in der Regel eine Abtastrate von 44,1 kHz haben, können HiRes-Dateien Abtastraten von 96 kHz, 192 kHz oder sogar höher aufweisen. Zu beachten ist die Nyquist Grenzfrequenz. Der hörbare Frequenzbereich liegt deshalb immer in der ersten Hälfte der Abtastrate. Bei 44,1 kHz sind maximal 22,05 kHz hörbar und bei 96 kHz sind maximal 48 kHz möglich.

High Resolution Audio bietet in der Regel mehr Bit-Tiefe. Während CDs eine Bit-Tiefe von 16 Bit haben, können HiRes-Dateien 24 Bit oder mehr aufweisen. Dabei steht 1 Bit für eine Lautsärke von 6dB. Bei CDs wird deshalb ein Dynamikumfang von 96 dB angedeckt. HiRes kann 144 dB umfassen.

Was für die CD spricht

Unser Hörvermögen geht maximal nur bis 20 kHz. Wenn du zur Babyboomer-Generation gehörst, dann kannst du froh sein, wenn du noch bis 10 kHz gut hörst. Sieht man sich den Frequenzbereich der Musikinstrumente an, dann gehen die meisten kaum über 10 kHz hinaus. Und unser hörbarer Dynamikbereich liegt bei rund 90 dB. All das spricht auf den ersten Blick für die CD als Medium.

Was für HiRes spricht

Im Bild unten wird eine Hüllkurve (die Summe aller Frequenzen) über einen weiten Frequenzbereich bis 48 kHz gezeigt. Diese bildet eine hohe Dynamik zwischen 3 dB und 144 dB ab. Im kleineren Kästchen (Blau) ist das CD-Format zu sehen. Diese Aufnahme kann in einer CD weder von der Bandbreite, noch von der Dynamik vollständig abgedeckt werden.

Laut dem oben gezeigten Instrumenten Frequenz-Diagramm ist die Bandbreite jedoch im Frequenzrahmen bis 20 kHz angegeben. Kann man das so stehen lassen?

Spektrogramm

Im HQPlayer besteht die Möglichkeit sich das Spektrogramm eines Titels in Echtzeit anzusehen.

Dabei wird Das Frequenzspektrum der Quelle bis zur möglichen Nyquist-Frequenz angezeigt. Die Spektrogramm-Anzeige wird mit der Zeit auf der horizontalen Achse und der Frequenz auf der vertikalen Achse dargestellt. Die Farbcodierung dient zur Anzeige des Signalpegels (in dB) im Zeit-/Frequenzraum.

Im Bild unten sind der HQPlayer Client mit Abbildung des Spektrums im linken und rechten Kanal, rechts daneben Roon und darunter in der Leiste das Programm htop für die CPU-Auslastung zu sehen. Die Bandbreite der HiRes Aufnahmen mit 96 kHz wird mit dem möglichen 48kHz voll ausgeschöpft. Das obere Band scheint sogar etwas beschnitten zu sein.

PCM 96kHz mit Ausschöpfung der Nyquist-Frequenz bis 48kHz

Unten ist ein Spektrogramm mit einer HiRes 192 kHz Aufnahme. Deutlich zu sehen sind Spitzen, die bis zu 96 kHz gehen! Diese Aufnahmen sind mit guten Mikrofonen möglich. Zum Beispiel mit einem 100 kHz Mikro: Sanken Chromatisch | CUX-100K 3-Wege-Niere (nah und fern) & Omini-Mikrofon (sankenchromatic.com). Nahmikrofonierte Drum-Kits / Percussions wie unten in der Aufnahme erreichen das 100 kHz Spektrum.

PCM 192kHz mit Ausschöpfung der Nyquist-Frequenz bis 96kHz

Ultraschallanteile verändern die hörbare Hüllkurve

Hier möchte ich auf ein kleines Experiment verweisen, wo dieselbe Aufnahme auf 15 kHz begrenzt wurde und mit der ursprünglichen HiRes-Aufnahme verglichen wurde:

Die Hüllkurve (das Summensignal aller Frequenzen, die in einem Musikstück vorhanden sind) eines auf 15 kHz begrenzten Musiksignal ist nicht identisch mit der Hüllkurve des HiRes-Musiksignals mit vollem Frequenzumfang. Die fehlende Energie der Frequenzanteile oberhalb von 15 kHz machen sich in einer leicht veränderten Hüllkurve bemerkbar, die notabene im Hörbereich liegt!

Ist HiRes-Audio Unsinn? – Musik-Wahrnehmung (avguide.ch)

Ultraschallanteile führen zur verstärkten Hinrnaktivität

Zur Frage, ob sich Schallanteile oberhalb der Hörschwelle im Hirn bemerkbar machen, gibt es eine interessante Studie aus 2000:

In dieser Studie haben wir nicht-invasive physiologische Messungen von Gehirnreaktionen verwendet, um den Nachweis zu erbringen, dass Klänge, die hochfrequente Komponenten (HFKW) oberhalb des hörbaren Bereichs enthalten, die Gehirnaktivität der Zuhörer signifikant beeinflussen. Als natürliche Schallquelle nutzten wir die Gamelan-Musik von Bali, die extrem reich an HFKW mit instationärer Struktur ist, und teilten sie in zwei Komponenten: eine hörbare niederfrequente Komponente (LFC) unterhalb von 22 kHz und eine HFKW-Komponente oberhalb von 22 kHz. …. Keiner der Probanden erkannte den HFC als Klang, wenn er allein präsentiert wurde. Nichtsdestotrotz stiegen die Leistungsspektren des Alpha-Frequenzbereichs des spontanen Elektroenzephalogramms (Alpha-EEG), die aus der Okzipitalregion aufgezeichnet wurden, mit statistischer Signifikanz an, wenn die Probanden einem Schall ausgesetzt wurden, der sowohl einen HFKW als auch einen LFC enthielt, verglichen mit einem ansonsten identischen Schall, aus dem der HFC entfernt wurde (d. h. LFC allein). … Wir nennen dieses Phänomen den „Hyperschalleffekt“ (orig.: hypersonic effect).

Unhörbare hochfrequente Töne beeinflussen die Gehirnaktivität: Hyperschalleffekt – PubMed (nih.gov)

Das Bild unten zeigt die Gehirnaktivitäten mit

  • Baseline = keine Musik
  • HCS / High Cut Sound = Musik ohne Ultraschallanteile
  • FRS / Full Range Sound = ganzes Frequenzspektrum der HiRes-Aufnahme (96 kHz).

Bei FRS (HiRes) sind signifikant stärkere Gehirnaktivitäten nachweisbar!

Eine weitere Studie aus 2014 behandelte die Frage, ab welcher Frequenz die Hirnaktivitäten anstiegen:

Wenn ein HFC (High-Frequency Component) oberhalb von ca. 32 kHz angelegt wurde, stieg das Alpha-2-EEG signifikant an, verglichen mit einer ausschließlichen akustischen Beaufschlagung (positiver Hyperschalleffekt), während bei HFC unterhalb von ca. 32 kHz das Alpha-2-EEG abnahm (negativer Hyperschalleffekt). Diese Ergebnisse deuten darauf hin, dass die Entstehung des Hyperschalleffekts von den Frequenzen des unhörbaren HFKW abhängt.

Frequenzen unhörbarer hochfrequenter Töne beeinflussen die Gehirnaktivität unterschiedlich: positive und negative Hyperschalleffekte – PubMed (nih.gov)

Im Bild unten wird der Versuchsaufbau dargestellt, wie mit einem Schalter die Superhochtöner zugeschaltet wurden.

Mit einer Clusterung von 8 kHz wurden die Gehirnaktivitäten in den jeweiligen Frequenzbereichen gemessen. Erst ab 32 kHz trat ein positiver Effekt auf. Am stärksten wirkte der Ultraschall zwischen 80 – 88 kHz.

Klangliche Auswirkungen von HiRes

Jussi Laako, der Schöpfer des HQPlayers, hat Experimente mit einem Glockenspiel durchgeführt und kommt zu folgendem Schluss:

Da die Mikrofone in der gleichen Entfernung vom Glockenspiel (im normalen Raum) wie meine Ohren platziert waren, konnte ich den direkten Klang des Instruments mit dem über Kopfhörer aufgenommenen Klang vergleichen. Sicherlich war die 192k-Version viel näher am Original als die 48k-Version.

Sampling- und Filterdiskussion – AudiophileStyle

Zusammenfassung

Das menschliches Hörvermögen ist zwar im Frequenzbereich zwischen 20 Hz bis 20 kHz beschränkt und nimmt im Alter sogar noch ab. Die Frequenzbereiche von Musikinstrumenten und Stimmen spielen sich mit ihren Grundtönen und Obertönen meist bis 10 kHz ab. Die wahrnehmbare Lautstärke ist frequenzabhängig und umfasst einen Dynamikbereich von rund 90 db. Das alles spricht für die CD, deren Abtastrate mit 44,1 kHz eine Frequenz bis 22,05 kHz abdeckt. Und auch die Auflösung mit 16 Bit ermöglicht einen ausreichenen Dynamikbereich von 96 dB.

Im Spektrogramm ist jedoch deutlich zu sehen, dass es auch HiRes-Aufnahmen mit Frequenzen bis 96 kHz gibt. Dies ist möglich, wenn für die Aufnahme sehr gute Mikrofone bis 100 kHz verwendet werden. Durch Messungen wurde belegt, dass nicht hörbare Ultraschallanteile die hörbare Hüllkurve verändern. In der Hirnforschung wurde bewiesen, dass nicht hörbare Ultraschallanteile (ab 32 kHz) zur verstärkten Hirnaktivität führen, wenn sie mit den hörbaren Schallanteilen kombiniert wurden. Die Zusammenhänge sind zwar noch unklar. Subjektive Klangvergleiche mit unterschiedlichen Aufnahmeformaten bestätigen jedoch den positiven Einfluss von HiRes.

Ich denke bei totkomprimierter Musik wie zum Beispiel Rock, Pop muss man sich keine Gedanken über HiRes machen. Gleiches gilt bei HiRes Mogelpackungen. Bei sehr guten Aufnahmen von Klassik und Jazz, aber auch bei Schlagzeug mit einem weiten Frequenz-/ und Dynamikbereich lohnt sich HiRes.

Du hast Fragen oder möchtest etwas beitragen? Schreibe uns: Kontaktformular
Oder schreibe per E-Mail an: info@griggaudio.de

*ChatGPT hat mir beim Schreiben geholfen.

Veröffentlicht am

Das Geheimnis der apodisierenden Filter

Einleitung

Puristen sagen, dass eine bitgerechte Wiedergabe im NOS (Non Oversampling) völlig ausreichend ist. Denn der Mensch hört nur bis max. 20kHz und ein Oversampling kann nichts hinzufügen, was auf der Quelle nicht drauf ist.

Hört sich erstmal logisch an. Bis man tiefer in die Signalverarbeitung einsteigt und feststellt, da können jede Menge Fehler passieren. Schon im Aufnahmeprozess.

In den Grundlagen sehen wir uns den Weg von der Aufnahme bis zur Wiedergabe einer CD in der heimischen Musikanlage an. Anschließend beschäftigen wir uns mit möglichen Verbesserungen von sogar verhunzten Aufnahmen.

Grundlagen

Von der Aufnahme zur Wiedergabe

Analog to Digital Conversion (ADC)

Oben im Bild ist der Aufnahmeprozess im Beispiel beschrieben. Es wird die Produktion und die Wiedergabe einer CD (RedBook) gezeigt. Bei der digitalen Signalverarbeitung kommt die Delta-Sigma-Modulation (DSD) zum Einsatz. Diese Technik kann seit den 1970er Jahren mit den Fortschritten in der CMOS-Technologie preiswert umgesetzt werden. Delta-Sigma-Modulatoren werden von vielen großen Halbleiterherstellern als fertige integrierte Schaltung angeboten und deshalb findest du sie oft in ADC-/ oder DAC-Chips.

Aufgenommen wird mit einer DAW (Digital Audio Workstation) und einem guten Mikro mit einem Frequenzgang bis 50kHz. Die analogen Signale werden digitalisiert und vom Delta Sigma Modulator auf DSD128 (5,6MHz/1Bit) umgerechnet. Ein Dezimator reduziert dann die Samplingrate auf das gewünschte Format von 44.1kHz/16Bit. Anschließend kann ein Mastering erfolgen (im Bild nicht dargestellt) und das Musikstück wird auf einer CD oder einem anderen Datenträger gespeichert.

Digital to Analog Conversion (DAC)

Du nimmst die CD und spielst sie ab. Dabei muss der DAC den umgekehrten Weg gehen und das digitale Signal oversamplen, damit der Modulator DSD128 (5,6MHz/1Bit) im Ausgang die Rohdaten für die Umwandlung in Analog bereitstellen kann. Aufgrund der Nyquist Grenzfrequenz bleibt das Audioband auf die Hälfte der ursprünglichen Abtastrate begrenzt und ermöglicht einen Wiedergabebereich von 20Hz bis maximal 22,05Hz (1/2 von 44,1kHz).

Verbesserte Rekonstruktion

Fehler im Aufnahmestudio kompensieren

Hoffentlich liest das jetzt kein Toningenieur. 😄 Aber ja es ist nun mal Realität, dass sich nicht jeder Musiker ein Abbey Road Studio leisten kann. Manche Tonstudios müssen mit weniger werthaltigem Equipment auskommen. Und so manch Musiker produziert seine Aufnahmen selbst. Oder es passieren einfach Fehler beim Mastering. Jussi Laako, der Entwickler vom HQPlayer behauptet sogar, dass 90% von RedBook kein gutes Mastering ist! Gute und schlechte Qualitäten sind nicht nur hörbar, sondern auch messbar.

Nachfolgend stelle ich einige Beispiele vor. Dafür verwende ich das Spektrogramm vom HQPlayer.

Mogelpackungen

Im Titelbild siehst du eine Quelle mit eigentlich 44.1kHz, die aber nur ein Frequenzspektrum bis ca. 10kHz zur Verfügung stellt! Mogelpackungen kannte ich bisher nur von HiRes-Dateien, womit wir zum nächsten Beispiel kommen.

Kürzlich hörte ich den Titel Alone Together von Chet Baker in der HiRes Version mit 192kHz. Das ist eine Aufnahme von 1959. So richtig wollte das nicht zünden. Im Spektrogramm unten sieht man auch warum. Nur ein Bruchteil der Bandbreite (bis ca. 20kHz) wird genutzt. Möglich wären 96kHz (die Hälfte der ursprünglichen Quellfrequenz). Stattdessen sind im oberen Rand vermutlich Alias-Effekte (roter Bereich) zu sehen. Der Apodisierungszähler links schießt deshalb abartig in die Höhe.

Was machst du, wenn dir die Aufnahme sehr gut gefällt und die Tonqualität gut sein soll? Hier kommt eine Stärke von Roon hinzu. Wenn du auf „Versionen“ klickst, bekommst du alle vorhandenen Versionen angezeigt. Ich fand eine gute 44.1kHz Version. Hier sehen wir jetzt eine schöne Ausnutzung der möglichen Bandbreite bis 22,05kHz und eine gute Dynamik. Der Apodisierungszähler schlägt auch nicht an. 

Beispiel für Stromstörungen

Hier ist ein Titel in 44,1kHz mit einer sehr schönen Dynamik. Das Frequenzspektrum wird bis zur Nyquist-Frequenz von 22,05kHz voll ausgeschöpft. Bei genauerem Hinsehen ist eine horizontale Linie bei ca. 10kHz zu sehen. Die übliche Quelle dafür ist in der Regel ein Schaltnetzteil, das zur Stromversorgung des A/D-Wandlers verwendet wird. Es gibt auch SMPS-betriebene ADCs, die keine solchen Störungen aufweisen.

PCM 44,1kHz mit Ausschöpfung der Nyquist-Frequenz

Beispiel für übertriebene Lautheit

Das Problem der heutigen Zeit sind totkomprimierte Musikstücke (Loudness War). Diese Komprimierung des Audiosignals führt zwar zu einer konstanteren „Hörbarkeit“ der Musik, hat aber auch einen hohen Verlust an Dynamik zur Folge. Es kommt vor, dass die oberen Bänder dadurch beschnitten werden. Im Bild unten sind im Spektogramm die abgeschnittenen Linien mit einem hohen Rot-Anteil gut zu erkennen. Links schießt in der Zeile „Limited / Apod.“ der Apodisierungszähler als Indikator für ein schlechtes Mixing auf über 8.000 nach oben. An den hohen Werten kann auch ein schlechter Dezimator im ADC verantwortlich sein.

PCM 44,1kHz mit abgeschnittenen Spektrum bei 22,05kHz und hohen Apodisierungswerten

Apodisierungsfilter als Problemlöser

Der Einsatzzweck des Apodisationsfilters ist es, die Impulsantwort des ursprünglichen Dezimationsfilters durch eine andere hochwertigere zu ersetzen. Dies ermöglicht das Ändern des Zeit- und Frequenzbereichsverhaltens des ursprünglichen Filters. Ein möglicherweise wichtigerer Punkt ist das Bereinigen des Aliasing-Bands bei den höchsten Frequenzen. Abhängig von den ADC / Mastering-Werkzeugen kann es zu einem gewissen Aliasing-Band am oberen Rand des Frequenzbands kommen.

Nicht apodisierende Filter lassen die (möglicherweise fehlerhaften) produktionsseitigen digitalen Filtereigenschaften durch. Apodisierende Filter sind für Samplingraten von 44.1/48kHz wegen der niedriger liegenden Nyquist-Raten am wichtigsten.

Der HQPlayer stellt eine große Anzahl von apodisierenden Filtern zur Verfügung. Siehe HQPlayer Tabelle mit den Filtereigenschaften.

Der Audio PC als Problemlöser

Mir ist kein DAC mit apodisierenden Filtern bekannt. Auch ist die Rechenleistung im DAC begrenzt. Bei den weit verbreiteten Delta Sigma Chips im DAC erfolgt vor der Wandlung in Analog ein Upsampling in DSD. Warum also nicht gleich dem DAC das Musikstück in DSD zuführen? Weitere Infos erhältst du hier: Wie arbeitet ein DAC und was kann Upsampling bewirken?

Zusammenfassung

Leider wird dem geneigten Musikhörer nicht immer die beste Quelle angeboten. Schlechtes Equipment des Tonstudios oder schlicht Digitalisierungsfehler können den Musikgenuss deutlich trüben. Mit dem HQPlayer Apodisierungszähler kanst du schlechte Quellen schnell erkennen. Und verwende einen apodisierenden Filter für Samplingraten von 44.1/48kHz, weil sich in diesem Bereich am ehesten Aufnahmefehler bemerkbar machen. Fall nicht auf Mogelpackungen herein und verwende bei neuen Aufnahmen zur Kontrolle das Spektrogramm vom HQPlayer. Im Zweifel ist eine andere Aufnahmeversion, sofern vorhanden, zu bevorzugen.

Im DAC wird oft ein Delta-Sigma-Chip eingesetzt. Hier kannst du von den hochwertigen Modulatoren des HQPlayers profitieren und dem DAC die Arbeit erleichtern. Führe ein Upsampling von PCM in DSD mit dem HQPlayer durch und du umgehst die einfachen Filter, Oversampling– und Modulatorenstufen im DAC (in Abhängigkeit des DAC-Designs). Den DAC betreibst du möglichst im NOS (Non Oversampling).

Du hast Fragen oder möchtest etwas beitragen? Schreibe uns: Kontaktformular
Oder schreibe per E-Mail an: info@griggaudio.de