Der Loudness War und die Normalisierungspraktiken unterschiedlicher Plattformen (z.B. Streaming oder Rundfunk) haben dafür gesorgt, dass Lautheit ein stark diskutiertes Thema ist. In den Weiten des Internets findest du zahllose Tipps, Anleitungen und Erklärungen zu Lautheit in Verbindung mit Kompression, Limiting und der Veröffentlichung von Aufnahmen. Aber was ist mit der Dynamik eines Tracks? Dynamik und Lautheit haben viel miteinander zu tun und wir sind der Meinung, dass ihr weit mehr Aufmerksamkeit geschenkt werden sollte, als sie oft bekommt. Also lass uns über Dynamik reden (und ja, auch ein bisschen über Lautheit)!
Dynamik (& Lautheit)
Die Lautheit und Dynamik eines Tracks sind untrennbar miteinander verbunden: Indem die Dynamik mit einem Kompressor oder Limiter reduziert wird, kann die Lautheit erhöht werden. Leise und laute Bereiche werden näher aneinandergerückt (Peaks werden mit einem Limiter abgeschnitten) und der damit gewonnene Platz kann dafür genutzt werden, das Level eines Tracks zu erhöhen.
Für lange Zeit war es eines der Hauptziele von Produzenten einen Track so laut wie möglich zu machen – was zur Formel „lauter=besser“ führte. Warum? Wenn ein Track lauter als ein anderer wiedergegeben wird, ist die Wahrscheinlichkeit sehr hoch, dass er als kraftvoller und seine Audioqualität als hochwertiger wahrgenommen wird. Das passiert alles nur in unserem Kopf – probiere es einfach selbst und höre dir denselben Track mit unterschiedlicher Lautstärke an…. es funktioniert.
Seit ungefähr einem Jahrzehnt stellen die Normalisierungspraktiken von Streamingdiensten sicher, dass alle hochgeladenen Tracks mit derselben wahrgenommenen Lautheit wiedergegeben werden, um diese Voreingenommenheit (oft als „Loudness Bias“ bezeichnet) zu vermeiden. So bekommen Tracks nicht mehr Aufmerksamkeit nur weil sie lauter als andere sind – und das tut auch der Dynamik gut. Mit der Regulierung von Lautheit wurde nämlich etwas anderes gewonnen: Mehr kreative Möglichkeiten und die Freiheit die Dynamik eines Musikstücks so zu gestalten, dass sie dem musikalischen Inhalt entspricht. Wenn du mehr über Normalisierung und Streamingplattformen wissen willst, solltest du dir diesen Artikel ansehen.
Dynamik aus kreativer Sicht
Die Relevanz von Dynamik zeigt sich schon ganz zu Beginn des Schaffungsprozesses von Musik – das Arrangement und die Wahl der Musikinstrumente. Du kannst Dynamik nutzen um einen Spannungsbogen zu erzeugen damit dein Track über seine ganze Länge spannend bleibt – denke an den Drop bei EDM Tracks.
Die Dynamik spielt auch eine zentrale Rolle beim Definieren des Charakters eines Musikstücks. Während viel Dynamik dabei hilft, einen Song lebendiger und natürlicher zu machen, erzeugt wenig Dynamik Kontinuität und einen anhaltenden Energiefluss.
Jedes Genre hat üblicherweise ein bestimmtes ästhetisches Ideal in Bezug auf Dynamik. Hier ein paar Beispiele: Klassische Musik oder akustische Tracks zielen typischerweise auf viel Dynamik und wenig Verzerrungen ab, da sie sich auf Natürlichkeit, Räumlichkeit und Transparenz fokussieren. Metal oder harte EDM Tracks sind hingegen durch Verzerrungen und einen dichten, kraftvollen Klang geprägt. Für diese Genres ist Dynamik, obwohl wichtig für Transparenz, zweitrangig.
Es ist also nicht die Lautheit, die das „richtige“ Ausmaß und den Stil des Limitings oder der Kompression bestimmt, sondern die erwünschte Dynamik. Beispielsweise verwendet unser Plug-in smart:limit den Dynamik-Wert als Ziel für die Parametrisierung und nicht den Lautheitswert. Es macht keinen Sinn auf bestimmte Lautheitswerte hinzuarbeiten, die nicht dem Stil des Tracks entsprechen (z.B. einen Pop-Track über-dynamisch zu machen, nur um nicht zu laut zu werden).
Der Einfluss von Dynamik auf die charakteristische und ästhetische Wirkung einer Audiospur
Hohe Dynamik
positive Möglichkeiten | Risiken |
---|---|
natürlicher, organischer Sound | Audiospur könnte durch das zeitlich ungleichmäßige Klangbild zerfallen |
druckvoll und transient | potenzieller Verlust an Druck und Energie |
schöne, räumliche Wirkung (natürliche Nachhallzeit möglich) | potenzielle Wiedergabeprobleme auf Wiedergabesystemen mit geringem Dynamikbereich |
keine Verzerrungen (durch Dynamikbearbeitung) | leise Stellen könnten nicht hörbar sein, wenn sie in einer lauten Klangumbegung abgespielt werden |
Geringe Dynamik
positive Möglichkeiten | Risiken |
---|---|
Aufrechterhalten des Flows der Audiospur | Audiospur könnte eintönig und langweilig klingen |
dichtes, kompaktes Klangbild | naturgetreue Sounds könnten ihre Natürlichkeit verlieren |
hohes Wiedergabelevel beim Abspielen auf Wiedergabesystemen ohne Lautheitsnormalisierung | limitierte Räumlichkeit und Klarheit (keine natürliche Nachhallzeit möglich) |
Dynamik und technische Grenzen von Aufnahmemedien
Der maximale (theoretische) Dynamikumfang des menschlichen Gehörs liegt bei etwa 120 – 140 dB (abhängig von der Frequenz) – das ist der Umfang zwischen minimalem und maximalem Schalldruck, welchen das Ohr bewältigen kann.
Das Ohr konvertiert Luftdruckänderungen zu Geräuschen und es kann Schalldruckpegel von 20 μPa (Hörschwelle) bis 20 Pa (Schmerzschwelle) wahrnehmen. Der tatsächliche Schalldruckpegel (SPL) wird über 20 log10 p1/p0 berechnet, wobei p0 der minimale Schalldruckpegel ist und p1 der jeweils gemessene Pegel ist. Unter Verwendung dieser Formel kann man errechnen, dass Geflüster einen SPL von 20dB hat, ein Gespräch einen Pegel von 60dB und laute Clubmusik auf unser Ohr mit einem SPL von 100dB oder mehr trifft.
Der maximale Dynamikumfang des Ohres liegt also bei ca. 140dB – das menschliche Gehör kann jedoch nicht den gesamten Umfang auf einmal bewältigen. Es adaptiert seine Sensitivität auf den durchschnittlichen Eingangspegel um das Innenohr zu schützen (z.B.: das Trommelfell wird steif und weniger empfindlich, wenn du dich in einem sehr lauten Umfeld befindest). Das Ohr aktiviert also einen internen Kompressor. Frühe Aufnahmemedien hatten nur einen begrenzten Dynamikumfang und jedes Audiomaterial musste aufgrund dieser technischen Einschränkungen komprimiert werden. Kassetten oder Vinyl konnten nur einen Dynamikumfang von 60dB bis 70dB bieten – die leisesten (Grundrauschen) und lautesten Stellen eines Tracks mussten also in diesen Bereich fallen.
Die CD verwendet eine Auflösung von 16Bit, was einen Dynamikumfang von 96dB ergibt – mit Hilfe von Dithering kann dieser sogar bis zu wahrgenommenen 120dB erweitert werden. Was die Dynamik anbelangt, ist die Notwendigkeit das Signal zu komprimieren hier also kaum mehr gegeben. Moderne Medien verwenden typischerweise eine Kodierung von 24Bit, was zu einem Dynamikumfang von über 140dB führt. Da dies mehr ist als das Ohr (selbst theoretisch) bewältigen kann, sind technische Einschränkungen bei modernen Aufnahmemedien nicht mehr relevant.
Dynamik messen
Es gibt verschiedene Messwerte um die Dynamik eines Tracks zu erfassen. Immer wenn du mit einem Tool zur Dynamik-Messung arbeitest, wirst du auf manche von ihnen stoßen. Es ist also gut, eine Ahnung davon zu haben wie diese Werte gemessen werden und was sie dir sagen.
PLR (Peak to long-term Loudness Ratio)
PLR wird oft dazu verwendet um die Gesamt-Dynamik eines Tracks zu beschreiben. Es ist der Unterschied zwischen der Lautheit (integrated) und dem maximalen True Peak Wert, die über die einen langen Beobachtungszeitraum (z.B.: ganzer Track) gemessen wurden. Es zeigt dir eine „Makro-Perspektive“ der Dynamik deines Tracks.
PLR = Max. Peak - Integrated Loudness (berechnet über die gesamte Beobachtungszeit)
PSR (Peak to short-term Loudness Ratio)
PSR ist der Unterschied zwischen der Lautheit (short-term) und dem maximalen True Peak Wert, gemessen in Intervallen von 3 Sekunden. In sehr lauten und stark komprimierten Teilen eines Songs, kann dir der Wert zeigen ob noch immer eine „gesunde“ Dynamik vorliegt.
PSR = Max. Peak - Short Term Loudness (berechnet in Fenstern von 3 Sekunden)
Dynamik in unserem Plug-in smart:limit
smart:limit verwendet den Medianwert aller gemessenen PSR Werte um die Dynamik zu ermitteln. Der PLR-Wert ist zwar jener, der üblicherweise zur Beschreibung von Dynamik herangezogen wird (siehe oben), aber interne Tests haben gezeigt, dass diese alternative Berechnungsmethode die tatsächliche Dynamik eines Tracks häufig besser abbildet.
Der reine PLR-Wert ist manchmal etwas irreführend, da er (im Grunde) nur eine andere Beschreibung für die „integrated“ Lautheit ist. Beispielsweise entspricht der PLR-Wert, wenn mehrere Tracks auf -1dB True Peak normalisiert werden, nur deren „integrated“ Lautheit-Werte minus 1.