Veröffentlicht am Ein Kommentar

Audio Spektrogramm-Analyse

Einleitung

Ein netter Newsletter-Leser hat mich gebeten, das Audio-Spektrogramm zu erklären. Der Hintergrund ist, dass mit dem Spektrogramm unechte HiRes-Aufnahmen entlarvt werden können. Und Spektrogramme lassen Rückschlüsse auf die Klangqualität zu.

In den Grundlagen sehen wir uns an, was ein Spektrogramm ist. Und wie man ein Audio-Spektrogramm ganz einfach in Echtzeit mit dem HQPlayer Client anzeigen kann.

In der Analyse gehen wir verschiedene Spektrogramme durch und interpretieren sie.

Grundlagen

Spektrogramm

Ein Spektrogramm ist eine visuelle Darstellung des Frequenzgehalts eines Audiosignals im Laufe der Zeit. Es zeigt, wie die Energie oder Intensität verschiedener Frequenzen sich über die Zeit hinweg verändern. 

In einem 2D-Diagramm wird auf der x-Achse die Zeit abgetragen und auf der y-Achse die Frequenz repräsentiert. Jede Zeile in der Darstellung zeigt, welche Frequenzen zu einem bestimmten Zeitpunkt im Audiosignal vorhanden sind.

Unterschiedliche Farbverläufe zeigen an, wie hoch der Amplitudenpegel ausfällt.

HQplayers Metering

Um das Spektrogramm im HQPlayer nutzen zu können, muss natürlich irgendwo in deiner Anlage der HQPlayer Rechenkern laufen. Hier gibt es zwei Möglichkeiten:

HQPlayer Desktop

Unter den Endverbrauchern dürfte der HQPlayer Desktop das bekannteste Produkt sein. Es ist für die Betriebsysteme Windows, macOS und Linux erhältlich. Das Installationspaket enthält unter anderem auch den HQPlayer Client zur Steuerung, während der Desktop den eigentlichen Rechenkern beinhaltet. Enthalten ist auch das Handbuch.

HQPlayer Embedded

Dieses Produkt war ursprünglich für Hardware Hersteller gedacht, die in ihren Audio Produkten ein Upsampling ermöglichen wollten. Das erklärt, warum die Konfiguration maximal Bedienerunfreundlich ist. Denn der Endkunde hatte damit nichts zu tun. Voraussetzung ist das Betriebssystem Linux. Nun erfreut es sich jedoch auch bei den Endverbrauchern zunehmender Beliebtheit und ich biete es auch für den fis Audio PC an.

HQPlayer Client Metering

Der HQPlayer Client greift von einer beliebigen Stelle in deinem Netzwerk auf den Rechenkern des HQPlayers zu. Das Spektrogramm nennt der HQPlayer Metering. Wenn du den Schalter „Mtr“ unten rechts aktivierst, siehst du das Spektrogramm. Die Farbverläufe lassen sich einstellen. Rot steht für eine besonders hohe Amplitude (Lautstärke).

HQPDcontrol v4 Spectrogram

Alternativ kannst du ein Drittprogramm verwenden, nämlich das kostenlose HQPDcontrol v4. Ich finde das Spektrogramm nicht ganz so gut gelungen, da keine Farbverläufe für die Amplituden angezeigt werden.

Spektrogramm Analyse

High Resolution (HiRes)

Mit einer der wichtigsten Funktionen des Spektrogramms dürfte das Entlarven von unechten HiRes Aufnahmen sein. Dabei ist wichtig zu wissen, dass der HQPlayer nur den hörbaren Bereich eines Audio Files anzeigt. Bei 96kHz sind das 48kHz und bei 192kHz sind es 96kHz. Grundlage ist die Nyquist Grenzfrequenz, die immer nur die halbe Abtastrate berücksichtigen darf.

Im ersten Beispiel haben wir einen krassen Fall. Angeboten wird der Titel mit 192kHz und hätte demnach einen hörbaren Bereich bis 96kHz. Tatsächlich sind nur 22,05kHz zu sehen, also ist es ein Audio File mit 44,1kHz! In diesem Fall bietet es sich gleich an auf die CD Version zurückzugreifen. Auf Qobuz gibt es oft mehrere Versionen.

Im nächsten Beispiel werden bei den beworbenen 192kHz zwar die 96k gefüllt, aber nur mit Dither. Die eigentlichen Musikimpulse gehen bis 48kHz, welches du an den Spitzen erkennst. Also waren es ursprünglich mal 96kHz.

Hier gehen einzelne Spitzen bis 96kHz, hier haben wir endlich eine echte 192kHz Aufnahme erwischt.

Hier wird es schwierig. Die Spitzen gehen bis ca. 65kHz – 70kHz. Jedenfalls sind es keine echten 192kHz. Aber das Spektrogramm ist recht ordentlich.

Hier ist wieder eine Mogelpackung. Bei einem 176,4kHz File sollten 88,2kHz drin sein. Bei einer vergleichbaren CD-Qualität ist wieder Ende.

Loudness War

Das Problem der heutigen Zeit sind totkomprimierte Musikstücke (Loudness War). Diese Kompression des Audiosignals führt zwar zu einer konstanteren „Hörbarkeit“ der Musik, hat aber auch einen großen Dynamikverlust zur Folge. Es kann vorkommen, dass die oberen Bänder abgeschnitten werden. Im Bild unten sind die abgeschnittenen Linien mit hohem Rotanteil im Spektrogramm gut zu erkennen. Links in der Zeile „Limited / Apod.“ steigt der Apodisierungszähler auf über 8.000 als Indikator für ein schlechtes Abmischen im Tonstudio.

Bei solchen Aufnahmen helfen die im HQPlayer angebotenen Apodisationsfilter. Diese korrigieren bis zu einem gewissen Grad die überschüssigen Spiegelfrequenzen. Abhängig von den ADC-/Mastering-Werkzeugen kann ein gewisses Aliasing-Band am oberen Ende des Frequenzbandes auftreten. Außerdem wird die Impulsantwort des ursprünglichen Dezimationsfilters durch eine andere (höherwertige) Impulsantwort ersetzt. Dadurch wird das Zeit- und Frequenzbereichsverhalten des ursprünglichen Filters verbessert.

Schaltnetzteile

Hier ist eine echte und auch gute Aufnahme mit 192kHz. Leider sind bei ca. 28kHz und oberhalb von 50kHz Linien zu sehen, die von den Schaltnetzteilen der Digital Audio Workstation (DAW) des Tondstudios herrühren können. Sie sind natürlich nicht direkt hörbar, aber sie können eventuell den hörbaren Bereich beeinflussen (demodulieren).

Gute Aufnahmen

Gute Aufnahmen zeichnen sich dadurch aus, dass das, was beworben wird, auch drin ist. Außerdem sollte nicht der ganze Frequenzbereich rot sein (hohe Lautstärke). Gut ist, wenn die Spitzen nicht abgeschnitten sind und eine hohe Dynamik erkennbar ist.

Hier ist ein Titel in 44,1kHz mit einer sehr schönen Dynamik. Das Frequenzspektrum wird bis zur Nyquist-Frequenz von 22,05kHz voll ausgeschöpft. Leider sind Spuren eines mutmaßlichen Schaltnetzteils zu erkennen.

Hier ist echtes 96kHz HiRes zu sehen. Die Bandbreite von 48kHz wird voll ausgeschöpft. Leider werden die Spitzen etwas beschnitten.

Und zum Schluss einer meiner Lieblingsaufnahmen aus meiner Jugend. Wirklich gut remastert und echte 192kHz.

Zusammenfassung

Mit dem HQPlayer Client Metering oder HQPDcontrol v4 Spectrogram kannst du in Echtzeit deine Audio Files analysieren.

Du erkennst bei High Resolution (HiRes) sofort Mogelpackungen. Die Aufnahmen müssen deshalb nicht schlecht sein, aber in diesem Fall ist es besser auf die CD Qualität zurückzugehen.

Loudness War erkennst du an den ausufernden roten Bereichen. Meistens schießt der Apodisierungszähler nach oben und du hast das Problem ganz oft bei 44,1kHz Files. In diesem Bereich verwende ich ausschließlich apodisierende Filter, welche dem entgegenwirken.

Du gibst dir alle Mühe mit der Stromversorgung und kaufst dir vielleicht sogar einen fis Audio PC mit einem linearen Netzteil. Und dann bekommst du HiRes Aufnahmen mit Spuren von Schaltnetzteilen vorgesetzt. Ärgerlich, aber bei älteren Aufnahmen leider oft enthalten. Hier kannst du ausprobieren, ob sich Aufnahmen mit geringeren Samplingraten besser anhören.

Gute Aufnahmen erkennst du an einer hohen Dynamik im Frequenzband mit einer insgesamt geringeren Lautheit (roter Bereich). Die Nyquist Grenzfrequenz wird voll ausgenutzt und die Impulsspitzen werden möglichst nicht beschnitten.

Du hast Fragen oder möchtest etwas beitragen? Schreibe uns: Kontaktformular
Oder schreibe per E-Mail an: info@griggaudio.de

Ein Gedanke zu „Audio Spektrogramm-Analyse

  1. Ein interessierter Leser hat mich auf diesen Artikel hingewiesen:

    Sinn und Unsinn hoher Samplingraten

    Der Autor Alexej C. Ogorek trägt meiner Meinung nach gute Aspekte vor, welche für HiRes bis max. 96kHz und 24Bit sprechen. So führt er an, dass bei höheren Samplingraten weniger steilflankige Filter eingesetzt werden können, welche sich klanglich positiv auswirken. Und die höhere Wortbreite von 24Bit stat 16Bit ermöglicht feinere Lautstärkeabstufungen und entspricht damit mehr den Fähigkeiten des menschlichen Gehörs.

    Seine Bewertung, dass spätestens bei 20kHz für alle Menschen absolut Schluss ist mit der Wahrnehmung auch bei extremsten Lautstärkepegeln, entspricht allerdings nicht dem Stand der Hirnforschung.

    Regelmäßige Leser meiner Newsletter erinnern sich vieleicht an diesen Artikel:

    Was bringt HiRes, wenn der Mensch nur bis 20 kHz hört?

    Hier ist die Zusammenfassung:

    Das menschliches Hörvermögen ist zwar im Frequenzbereich zwischen 20 Hz bis 20 kHz beschränkt und nimmt im Alter sogar noch ab. Die Frequenzbereiche von Musikinstrumenten und Stimmen spielen sich mit ihren Grundtönen und Obertönen meist bis 10 kHz ab. Die wahrnehmbare Lautstärke ist frequenzabhängig und umfasst einen Dynamikbereich von rund 90 db. Das alles spricht für die CD, deren Abtastrate mit 44,1 kHz eine Frequenz bis 22,05 kHz abdeckt. Und auch die Auflösung mit 16 Bit ermöglicht einen ausreichenen Dynamikbereich von 96 dB.

    Im Spektrogramm ist jedoch deutlich zu sehen, dass es auch HiRes-Aufnahmen mit Frequenzen bis 96 kHz gibt. Dies ist möglich, wenn für die Aufnahme sehr gute Mikrofone bis 100 kHz verwendet werden. Durch Messungen wurde belegt, dass nicht hörbare Ultraschallanteile die hörbare Hüllkurve verändern. In der Hirnforschung wurde bewiesen, dass nicht hörbare Ultraschallanteile (ab 32 kHz) zur verstärkten Hirnaktivität führen, wenn sie mit den hörbaren Schallanteilen kombiniert wurden. Die Zusammenhänge sind zwar noch unklar. Subjektive Klangvergleiche mit unterschiedlichen Aufnahmeformaten bestätigen jedoch den positiven Einfluss von HiRes.

    Meiner Meinung nach macht es deshalb schon Sinn, „echte“ HiRes-Aufnahmen bis zu 192kHz und 24Bit zu bevorzugen, falls verfügbar.

Kommentare sind geschlossen.