Hast du jemals über die Ursachen von Zischlauten in der Tontechnik nachgedacht? Man könnte annehmen, dass es sich hierbei um ein Artefakt handelt – tut es aber nicht.
De-Esser sind gängige Werkzeuge im Plugin-Ordner eines jeden Produzenten oder Mixing-Engineers. Es gibt eine Vielzahl von Optionen, die Produzenten zur Verfügung stehen – wir von sonible haben kürzlich unseren eigenen De-Esser namens smart:deess herausgebracht.
Aber warum brauchen wir eigentlich De-Esser? Warum sind Zischlaute ein solches Problem bei Audioaufnahmen und warum haben wir kein Problem damit, wenn wir uns im echten Leben unterhalten?
In diesem Artikel gehen wir der Frage nach, warum wir Zischlaute aus Gesangsaufnahmen entfernen müssen.
Wenn du auf der Suche nach einem neuen De-Esser für deine Plugin-Sammlung bist, könnte smart:deess die beste Option für dich sein. Als erster De-Esser mit künstlicher Intelligenz ist smart:deess nicht nur ein sehr leistungsfähiger De-Esser, sondern auch ein Plosiv-Entferner und Zischlautformer.
Du möchtest smart:deess ausprobieren? Dann solltest du unsere kostenlose 30-tägige Testversion ausprobieren.
Was sind Zischlaute?
Zischlaute in Gesangsaufnahmen treten auf, wenn Menschen Wörter aussprechen, die S-Laute enthalten. Sie können auch bei der Aussprache von ch-, t- und sh-Phonemen auftreten. Bei der Aussprache dieser Laute produziert die menschliche Stimme Informationen im oberen Mittenbereich des Frequenzspektrums, in der Regel zwischen 5 kHz und 10 kHz.
Warum entfernen wir Zischlaute?
In alltäglichen Gesprächen fallen Zischlaute im Vergleich zu anderen Klängen der menschlichen Stimme nicht besonders auf. Bei der Aufnahme von Gesang oder Sprache mit einem Mikrofon können sie jedoch schnell zum Problem werden.
Zischlaute können bei der Aufnahme mit einem Mikrofon hart und unangenehm klingen. Sie klingen auf Aufnahmen oft viel lauter als der Rest des Takes, obwohl sie eigentlich die gleiche Lautstärke haben.
Zischende Silben (Zischsilben) liegen im Frequenzspektrum höher als andere Silben, was dazu führt, dass sie aus Audioaufnahmen herausstechen und lauter klingen. Das ist aber nicht der Fall, wenn wir uns mit Menschen im wirklichen Leben unterhalten – aber warum?
Die Antwort liegt in der Positionierung des Mikrofons im Verhältnis zum Mund. Wenn wir uns mit jemandem unterhalten, stehen wir meist in einem angemessenen Abstand zueinander und es kommt sehr selten vor, dass wir unseren Mund direkt an das Ohr des Gesprächspartners halten und direkt in dieses hineinsprechen.
Eigentlich tun wir das nur, wenn wir jemandem etwas zuflüstern. Wenn jemand direkt in dein Ohr flüstert, wirst du feststellen, dass die Zischsilben deutlicher zu hören sind.
Bei der Aufnahme der menschlichen Stimme ist es üblich, dass der Aufgenommene nur wenige Zentimeter vom Mikrofon entfernt ist. Aus diesem Grund hat die hohe Energie der Frequenzen von Zischlauten keine Zeit sich zu zerstreuen, bevor sie auf die Mikrofonmembran trifft und wird so zu einem Problem bei Aufnahmen.
Profis mit guter Mikrofontechnik können die Auswirkungen von Zischlauten bei Gesangsaufnahmen einschränken, indem sie ihre Positionierung zum Mikrofon verändern.
Wenn Zischlaute bei Gesangsaufnahmen zu einem Problem werden, muss die Lautstärke der zischenden Frequenzen reduziert werden. Dies geschieht in der Regel mit einem De-Esser.
Warum brauchen wir De-Esser?
Es gibt viele Möglichkeiten, unerwünschte Zischlaute zu beseitigen, ohne einen De-Esser einzusetzen. Diese Methoden erfordern jedoch oft ein ausgeklügeltes Routing und mehrere Prozessoren, damit sie funktionieren.
Die am häufigsten angewandte und schnellste Lösung für das Zischlaut-Problem ist, zischende Frequenzen mit einem EQ in einer Aufnahme abzusenken. So lassen sich zwar harsch klingende Frequenzen entfernen, ein Nachteil ist jedoch, dass die Tonalität der Aufnahmen negativ beeinträchtigt wird, wenn keine Zischlaute auftreten. Da du die oberen Mittenfrequenzen absenkst, kann sich die Aufnahme dumpf und leblos anhören. Zudem ist es kein guter Weg, den Klang einer gesamten Gesangsaufnahme zu verändern, nur um die Zischlaute zu entfernen.
Zischlaute treten nur an bestimmten Stellen in Aufnahmen auf. Um bestmöglich mit ihnen umzugehen, muss ein Prozessor Zischlaute dynamisch aus dem Audiomaterial herausschneiden und sofort reagieren, wenn sie auftreten. De-Esser sind genau für diese Aufgabe konzipiert. Sie erkennen die Lautstärke im Bereich der Zischlaute und dämpfen sie nur dann, wenn Zischlaute erkannt werden.
Eine andere Methode ist, den Vocal-Channel zu duplizieren, ihn mit einem EQ auszustatten, der den Frequenzbereich der Zischlaute anhebt, und diesen Kanal dann als Sidechain-Eingang eines Kompressors für den ursprünglichen Gesangskanal zu verwenden. Diese Methode funktioniert gut, ist aber viel unhandlicher als ein einzelner Prozessor im Kanalzug, der diese Aufgabe übernimmt.
Durch den Aufstieg der De-Esser würde man heutzutage eigentlich erwarten, dass ein Produzent einen De-Esser verwendet, um Zischlaute zu beseitigen und nicht auf irgendeine andere Technik zurückgreift. Mit der Weiterentwicklung der Phonem-Erkennungstechnologie ist unser smart:deess-Plugin nun auch in der Lage, Plosive aus Audioaufnahmen zu entfernen.
Was sind Plosive?
Da smart:deess künstliche Intelligenz einsetzt, um Phoneme in Sprachaufnahmen zu erkennen, kann das Plugin sowohl Plosive als auch Zischlaute herausfiltern.
Aber was sind Plosive und warum sind sie ein Problem?
Plosive entstehen, wenn wir Silben aussprechen, bei denen der Mund vollständig geschlossen werden muss. Dadurch wird der Luftstrom aus unserem Mund gestoppt, und wenn wir den Mund dann wieder öffnen, strömt ein Luftstoß heraus. Plosive treten häufig auf, wenn wir P- und B-Laute aussprechen.
Das Problem bei Plosivlauten ist, dass die Vibration der Mikrofonmembran, die durch den Luftstrom aus dem Mund des Sängers oder der Sängerin verursacht wird, als laute Bass-Antwort in einer Aufnahme auftritt.
Entfernen von Zischlauten und Plosiven mit smart:deess
Schauen wir uns an, wie einfach es ist, Zisch- und Plosivlaute aus einer Sprachaufnahme mit smart:deess zu entfernen.
Schritt 1: Lade smart:deess
Hier haben wir eine Gesangsaufnahme, die einige Zischlaute und Plosive enthält. Du kannst sogar in der Wellenform sehen, wo ein Plosiv auftritt, da sich die Welle in eine laute, niederfrequente Welle verwandelt.
Lade smart:deess auf den Kanal.
Schritt 2: Analysiere das Audiomaterial
Als nächstes müssen wir smart:deess dazu bringen, unsere Gesangsaufnahme zu analysieren, um Zisch- und Plosivlaute zu lokalisieren.
Das geht ganz einfach: Klicke auf den Button Analyze Voice und spiele die Audioaufnahme ab. Nach ein paar Sekunden können wir mit der Bearbeitung der Aufnahme beginnen.
Schritt 3: Zischlaute entfernen
smart:deess hat nun alle Zischlaute und Plosive in unserer Aufnahme lokalisiert. In der Wellenform-Sektion der Benutzeroberfläche werden Zischlaute in grün und Plosive in blau angezeigt.
Wir können nun die Lautstärke der unerwünschten Phoneme reduzieren und ihren Klang formen.
Wir beginnen mit den Zischlauten und stellen den Regler für die Unterdrückung ein, um die Lautstärke der Zischlaute anzupassen. Wir können zudem die Klangfarbe der Zischlaute und die Stärke der Färbung der Zischlaute in Richtung dieser Klangfarbe mit dem Shape-Regler einstellen.
Schritt 4: Plosive entfernen
Nun können wir uns den Plosiven in der Aufnahme widmen. Auch hier können wir einstellen, wie stark die Plosive unterdrückt werden und wie stark die Spektralformung auf die Plosive angewendet werden soll.
Die gesamte Plosivunterdrückung wird getrennt von der Zischlautunterdrückung durchgeführt, um eine zusätzliche Kontrolle zu erhalten.
Probiere es selbst aus
Wenn du mehr über smart:deess erfahren möchtest, solltest du unseren Artikel lesen, in dem alle Funktionen im Detail erklärt werden. Außerdem findest du auf unserem YouTube-Kanal ausführliche Video-Erklärungen zum Plugin.
Um smart:deess selbst auszuprobieren, nutze unsere kostenlose 30-tägige Testversion.