Was bringt HiRes, wenn der Mensch nur bis 20 kHz hört?

Einleitung

Es ist die stets wiederkehrende Frage, was High Resolution (HiRes) überhaupt bringt? In der digitalen Signalverarbeitung liegen die Vorteile zum Beispiel im Einsatz von flacheren Filtern, die deutlich weniger Pre-/ und Post-Ringing aufweisen. Siehe auch Audio PC HQPlayer Filtereigenschaften.

Und Analog? Dazu gibt es mittlerweile gut erforschte und verblüffende Erkenntnisse. In den Grundlagen beleuchten wir das menschliche Hörvermögen und sehen uns dann die möglichen Vorteile von HiRes an.

Grundlagen

Menschliches Hörvermögen

Unser Hörvermögen basiert auf zwei Hauptmerkmalen: der Frequenz (Tonhöhe) und der Lautstärke (Schallintensität und Dynamik). Diese beiden Eigenschaften ermöglichen es uns, Klänge und Geräusche in unserer Umgebung zu erkennen und zu verstehen.

Frequenzbereich^*

Das menschliche Hörvermögen erstreckt sich in der Regel über einen Frequenzbereich von etwa 20 Hertz (Hz) bis 20.000 Hertz. Dieser Bereich wird als hörbares Spektrum bezeichnet. Innerhalb dieses Spektrums können wir eine Vielzahl von Tönen und Klängen wahrnehmen. Die Frequenz eines Tons wird in Hertz gemessen, wobei niedrige Frequenzen tiefe Töne und hohe Frequenzen hohe Töne erzeugen. Das menschliche Ohr ist empfindlich für eine breite Palette von Frequenzen, was es uns ermöglicht, Musik, Sprache, Tierlaute und andere Geräusche zu hören und zu unterscheiden.

Lautstärke^*

Das menschliche Hörvermögen umfasst einen beeindruckenden Dynamikbereich in Bezug auf die Lautstärke, der in Dezibel (dB) gemessen wird. Der Durchschnittsbereich, den die meisten Menschen wahrnehmen können, liegt etwa zwischen 0 dB (die Hörschwelle, bei der die leisesten hörbaren Töne wahrgenommen werden) und 120 dB (der Schmerzschwelle, bei der Schall als schmerzhaft laut empfunden wird). Dieser Bereich erstreckt sich über insgesamt 120 dB.

Hier ist eine grobe Aufteilung dieses Bereichs:

dB	Hörbereich
0	Die Hörschwelle, bei der leiseste hörbare Töne wahrgenommen werden.
20-40	Flüstern, leise Umgebungsgeräusche.
60-80	Normale Gespräche, Radio- oder Fernsehgeräusche.
80-90	Straßenlärm, Staubsauger, laute Musik in einem Auto.
90-100	Rasenmäher, Baustellenlärm.
110	Rockkonzerte, Schallpegel in lauten Bars.
>120	Flugzeugstart, laute Explosionen, Schmerzschwelle.

Frequenzabhängige Hörschwelle

Die Hörschwelle beginnt beim Menschen nicht linear mit 0 dB, sondern ist von der Frequenz abhängig. Die untere Linie zeigt Hörschwelle und der gestrichelte Anteil beschreibt die mögliche Hörkurvenveränderung durch übermäßige Hörbelastung. Die obere Linie ist die Schmerzgrenze. Die 0 dB-Hörschwelle wird zwischen 1kHz und 5kHz erreicht. Bei den niedrigen und sehr hohen Frequenzen muss der Schalldruck stattdessen deutlich höher sein.

Dynamikbereich

Wenn wir von maximal 110 dB Musik-Lautstärke ausgehen und die Musik ab 20 dB hörbar ist, dann hören wir in der Regel in einem Dynamikbereich von ca. 90 dB. Allerdings umgibt uns auch ein Grundlärmpegel. In einem ruhigen Schlafzimmer bei Nacht liegt das Grundgeräusch bei ca. 30 dB, in einer „leisen“ Bücherei liegt der Grundlärmpegel schon bei 40 dB.

Hinzu kommt der Maskierungseffekt. Dieser tritt auf, wenn mehr als nur ein Ton in Erscheinung tritt. Ist als Beispiel ein 1000-Hz-Ton im Raum vorhanden, bildet sich spektral gesehen um diesen herum eine akustische Maske. Das heisst, Töne in der Nähe (vor allem oberhalb) dieses Tones kann unser Gehör erst aber einer gewissen Lautstärke wahrnehmen. So schmilzt der Dynamikbereich zusammen.

Im Alter abnehmende Hörfähigkeit

Mit zunehmenden Alter nimmt deine Hörfähigkeit ab. Jedenfalls dann, wenn du nicht gerade einem Naturvolk angehörst, denn diese Völker kennen das Problem nicht. Die Schwerhörigkeit im Alter betrifft hauptsächlich die hohen Frequenzen.

Unten im Bild ist der Anstieg der Hörschwelle mit zunehmendem Lebensalter bei Frauen (links) und Männern (rechts) dargestellt. Männer sind stärker vom Hörverlust betroffen als Frauen.

Hören im Alter (deutsche-apotheker-zeitung.de)

Frequenzbereiche von Musikinstrumenten und Stimmen

Grundtöne und Obertöne

Die Grundtöne bestimmen die wahrgenommene Tonhöhe, während die Obertöne, die ein Vielfaches des Grundtons sind, die Klangfarbe erzeugen. Also beispielsweise, ob wir bei gleichem Grundton eine Geige oder eine Flöte hören. Der Grundton ist oft der lauteste und klarste Bestandteil eines Klangs, während die Obertöne in den höheren Frequenzen leiser werden.

Instrumenten Frequenz-Diagramm

Im Diagramm unten wird die jeweilige Bandbreite der Instrumente dargestellt. Die Grundtöne (Fundamentals) sind in dunkler Farbe dargestellt und die Obertöne (Harmonics) sind aufgehellt. Es ist gut zu erkennen, dass nur einzelne Instrumente mit ihren Grund- und Obertönen über 10kHz hinausgehen.

Sound Frequency: How To Use the Spectrum For Better EQ | LANDR Blog

High Resolution (HiRes)

Definition*

Die HiRes Aufnahmen verwenden oft eine höhere Abtastrate als herkömmliche Audioformate. Während CDs in der Regel eine Abtastrate von 44,1 kHz haben, können HiRes-Dateien Abtastraten von 96 kHz, 192 kHz oder sogar höher aufweisen. Zu beachten ist die Nyquist Grenzfrequenz. Der hörbare Frequenzbereich liegt deshalb immer in der ersten Hälfte der Abtastrate. Bei 44,1 kHz sind maximal 22,05 kHz hörbar und bei 96 kHz sind maximal 48 kHz möglich.

High Resolution Audio bietet in der Regel mehr Bit-Tiefe. Während CDs eine Bit-Tiefe von 16 Bit haben, können HiRes-Dateien 24 Bit oder mehr aufweisen. Dabei steht 1 Bit für eine Lautsärke von 6dB. Bei CDs wird deshalb ein Dynamikumfang von 96 dB angedeckt. HiRes kann 144 dB umfassen.

Was für die CD spricht

Unser Hörvermögen geht maximal nur bis 20 kHz. Wenn du zur Babyboomer-Generation gehörst, dann kannst du froh sein, wenn du noch bis 10 kHz gut hörst. Sieht man sich den Frequenzbereich der Musikinstrumente an, dann gehen die meisten kaum über 10 kHz hinaus. Und unser hörbarer Dynamikbereich liegt bei rund 90 dB. All das spricht auf den ersten Blick für die CD als Medium.

Was für HiRes spricht

Im Bild unten wird eine Hüllkurve (die Summe aller Frequenzen) über einen weiten Frequenzbereich bis 48 kHz gezeigt. Diese bildet eine hohe Dynamik zwischen 3 dB und 144 dB ab. Im kleineren Kästchen (Blau) ist das CD-Format zu sehen. Diese Aufnahme kann in einer CD weder von der Bandbreite, noch von der Dynamik vollständig abgedeckt werden.

Laut dem oben gezeigten Instrumenten Frequenz-Diagramm ist die Bandbreite jedoch im Frequenzrahmen bis 20 kHz angegeben. Kann man das so stehen lassen?

Spektrogramm

Im HQPlayer besteht die Möglichkeit sich das Spektrogramm eines Titels in Echtzeit anzusehen.

Dabei wird Das Frequenzspektrum der Quelle bis zur möglichen Nyquist-Frequenz angezeigt. Die Spektrogramm-Anzeige wird mit der Zeit auf der horizontalen Achse und der Frequenz auf der vertikalen Achse dargestellt. Die Farbcodierung dient zur Anzeige des Signalpegels (in dB) im Zeit-/Frequenzraum.

Im Bild unten sind der HQPlayer Client mit Abbildung des Spektrums im linken und rechten Kanal, rechts daneben Roon und darunter in der Leiste das Programm htop für die CPU-Auslastung zu sehen. Die Bandbreite der HiRes Aufnahmen mit 96 kHz wird mit dem möglichen 48kHz voll ausgeschöpft. Das obere Band scheint sogar etwas beschnitten zu sein.

PCM 96kHz mit Ausschöpfung der Nyquist-Frequenz bis 48kHz

Unten ist ein Spektrogramm mit einer HiRes 192 kHz Aufnahme. Deutlich zu sehen sind Spitzen, die bis zu 96 kHz gehen! Diese Aufnahmen sind mit guten Mikrofonen möglich. Zum Beispiel mit einem 100 kHz Mikro: Sanken Chromatisch | CUX-100K 3-Wege-Niere (nah und fern) & Omini-Mikrofon (sankenchromatic.com). Nahmikrofonierte Drum-Kits / Percussions wie unten in der Aufnahme erreichen das 100 kHz Spektrum.

PCM 192kHz mit Ausschöpfung der Nyquist-Frequenz bis 96kHz

Ultraschallanteile verändern die hörbare Hüllkurve

Hier möchte ich auf ein kleines Experiment verweisen, wo dieselbe Aufnahme auf 15 kHz begrenzt wurde und mit der ursprünglichen HiRes-Aufnahme verglichen wurde:

Die Hüllkurve (das Summensignal aller Frequenzen, die in einem Musikstück vorhanden sind) eines auf 15 kHz begrenzten Musiksignal ist nicht identisch mit der Hüllkurve des HiRes-Musiksignals mit vollem Frequenzumfang. Die fehlende Energie der Frequenzanteile oberhalb von 15 kHz machen sich in einer leicht veränderten Hüllkurve bemerkbar, die notabene im Hörbereich liegt!
Ist HiRes-Audio Unsinn? – Musik-Wahrnehmung (avguide.ch)

Ultraschallanteile führen zur verstärkten Hinrnaktivität

Zur Frage, ob sich Schallanteile oberhalb der Hörschwelle im Hirn bemerkbar machen, gibt es eine interessante Studie aus 2000:

In dieser Studie haben wir nicht-invasive physiologische Messungen von Gehirnreaktionen verwendet, um den Nachweis zu erbringen, dass Klänge, die hochfrequente Komponenten (HFKW) oberhalb des hörbaren Bereichs enthalten, die Gehirnaktivität der Zuhörer signifikant beeinflussen. Als natürliche Schallquelle nutzten wir die Gamelan-Musik von Bali, die extrem reich an HFKW mit instationärer Struktur ist, und teilten sie in zwei Komponenten: eine hörbare niederfrequente Komponente (LFC) unterhalb von 22 kHz und eine HFKW-Komponente oberhalb von 22 kHz. …. Keiner der Probanden erkannte den HFC als Klang, wenn er allein präsentiert wurde. Nichtsdestotrotz stiegen die Leistungsspektren des Alpha-Frequenzbereichs des spontanen Elektroenzephalogramms (Alpha-EEG), die aus der Okzipitalregion aufgezeichnet wurden, mit statistischer Signifikanz an, wenn die Probanden einem Schall ausgesetzt wurden, der sowohl einen HFKW als auch einen LFC enthielt, verglichen mit einem ansonsten identischen Schall, aus dem der HFC entfernt wurde (d. h. LFC allein). … Wir nennen dieses Phänomen den „Hyperschalleffekt“ (orig.: hypersonic effect).
Unhörbare hochfrequente Töne beeinflussen die Gehirnaktivität: Hyperschalleffekt – PubMed (nih.gov)

Das Bild unten zeigt die Gehirnaktivitäten mit

Baseline = keine Musik
HCS / High Cut Sound = Musik ohne Ultraschallanteile
FRS / Full Range Sound = ganzes Frequenzspektrum der HiRes-Aufnahme (96 kHz).

Bei FRS (HiRes) sind signifikant stärkere Gehirnaktivitäten nachweisbar!

Eine weitere Studie aus 2014 behandelte die Frage, ab welcher Frequenz die Hirnaktivitäten anstiegen:

Wenn ein HFC (High-Frequency Component) oberhalb von ca. 32 kHz angelegt wurde, stieg das Alpha-2-EEG signifikant an, verglichen mit einer ausschließlichen akustischen Beaufschlagung (positiver Hyperschalleffekt), während bei HFC unterhalb von ca. 32 kHz das Alpha-2-EEG abnahm (negativer Hyperschalleffekt). Diese Ergebnisse deuten darauf hin, dass die Entstehung des Hyperschalleffekts von den Frequenzen des unhörbaren HFKW abhängt.
Frequenzen unhörbarer hochfrequenter Töne beeinflussen die Gehirnaktivität unterschiedlich: positive und negative Hyperschalleffekte – PubMed (nih.gov)

Im Bild unten wird der Versuchsaufbau dargestellt, wie mit einem Schalter die Superhochtöner zugeschaltet wurden.

Mit einer Clusterung von 8 kHz wurden die Gehirnaktivitäten in den jeweiligen Frequenzbereichen gemessen. Erst ab 32 kHz trat ein positiver Effekt auf. Am stärksten wirkte der Ultraschall zwischen 80 – 88 kHz.

Klangliche Auswirkungen von HiRes

Jussi Laako, der Schöpfer des HQPlayers, hat Experimente mit einem Glockenspiel durchgeführt und kommt zu folgendem Schluss:

Da die Mikrofone in der gleichen Entfernung vom Glockenspiel (im normalen Raum) wie meine Ohren platziert waren, konnte ich den direkten Klang des Instruments mit dem über Kopfhörer aufgenommenen Klang vergleichen. Sicherlich war die 192k-Version viel näher am Original als die 48k-Version.
Sampling- und Filterdiskussion – AudiophileStyle

Zusammenfassung

Das menschliches Hörvermögen ist zwar im Frequenzbereich zwischen 20 Hz bis 20 kHz beschränkt und nimmt im Alter sogar noch ab. Die Frequenzbereiche von Musikinstrumenten und Stimmen spielen sich mit ihren Grundtönen und Obertönen meist bis 10 kHz ab. Die wahrnehmbare Lautstärke ist frequenzabhängig und umfasst einen Dynamikbereich von rund 90 db. Das alles spricht für die CD, deren Abtastrate mit 44,1 kHz eine Frequenz bis 22,05 kHz abdeckt. Und auch die Auflösung mit 16 Bit ermöglicht einen ausreichenen Dynamikbereich von 96 dB.

Im Spektrogramm ist jedoch deutlich zu sehen, dass es auch HiRes-Aufnahmen mit Frequenzen bis 96 kHz gibt. Dies ist möglich, wenn für die Aufnahme sehr gute Mikrofone bis 100 kHz verwendet werden. Durch Messungen wurde belegt, dass nicht hörbare Ultraschallanteile die hörbare Hüllkurve verändern. In der Hirnforschung wurde bewiesen, dass nicht hörbare Ultraschallanteile (ab 32 kHz) zur verstärkten Hirnaktivität führen, wenn sie mit den hörbaren Schallanteilen kombiniert wurden. Die Zusammenhänge sind zwar noch unklar. Subjektive Klangvergleiche mit unterschiedlichen Aufnahmeformaten bestätigen jedoch den positiven Einfluss von HiRes.

Ich denke bei totkomprimierter Musik wie zum Beispiel Rock, Pop muss man sich keine Gedanken über HiRes machen. Gleiches gilt bei HiRes Mogelpackungen. Bei sehr guten Aufnahmen von Klassik und Jazz, aber auch bei Schlagzeug mit einem weiten Frequenz-/ und Dynamikbereich lohnt sich HiRes.

Du hast Fragen oder möchtest etwas beitragen? Schreibe uns: Kontaktformular
Oder schreibe per E-Mail an: info@griggaudio.de

Verpasse keinen Newsletter:

^*ChatGPT hat mir beim Schreiben geholfen.

2 Gedanken zu „Was bringt HiRes, wenn der Mensch nur bis 20 kHz hört?“

StreamFidelity
11. Mai 2024

Hier ist ein Zitat von Jussi Laako:

„Darüber hinaus ist es zu einfach, das Einschwingverhalten aus der Sicht des reinen Frequenzgangs zu betrachten. Die Begrenzung der Signalbandbreite auf 20 kHz hat viel weitreichendere Auswirkungen als nur einige verschwindende Frequenzkomponenten.
 Abgesehen von den von Ihnen zitierten Informationen zur Knochenleitung in Bezug auf die Frequenz gibt es auch die Frage der Wahrnehmung des Timings. Die meisten Experimente zeigen, dass wir Zeitunterschiede von nur 10 Mikrosekunden wahrnehmen können, was einer Frequenz von 100 kHz entsprechen würde. (Kunchurs Arbeit ergab ein Ergebnis von 4 Mikrosekunden, aber da dies bei vielen Menschen umstritten ist, bleiben wir bei der Mehrheit.)“
Quelle: https://audiophilestyle.com/forums/topic/19715-hq-player/?do=findComment&comment=1277693
StreamFidelity
23. April 2024

Im englischsprachigen Wikipedia ist eine schöne Zusammenfassung zum Stand der Forschung zu finden:
„Ultraschall-Sinuskurven bis zu 120 kHz wurden als erfolgreich wahrgenommen. Zwei konkurrierende Theorien werden vorgeschlagen, um diesen Effekt zu erklären. Die erste besagt, dass Ultraschalltöne die inneren Haarzellen der Cochlea-Basaldrehung anregen, die auf hochfrequente Töne reagieren. Die zweite geht davon aus, dass Ultraschallsignale mit dem Gehirn in Resonanz treten und auf Frequenzen moduliert werden, die die Cochlea dann wahrnehmen kann.“
Quelle: https://en.wikipedia.org/wiki/Ultrasonic_hearing

Die Kommentare sind geschlossen.