Mehr als ein traditioneller De-Esser: Wie und warum?

Mit unserem neuen KI-gesteuerten Plugin smart:deess haben wir den De-Esser auf ein neues Level gehoben.

smart:deess ist in der Lage, Aufgaben zu erfüllen, die traditionelle De-Esser einfach nicht erfüllen können. Er kann Zischlaute in Aufnahmen erkennen, ihren spektralen Charakter formen und sogar Plosive entfernen. Aber wie?

In diesem Artikel erklären wir dir, wie herkömmliche De-Esser funktionieren, wie smart:deess arbeitet und warum wir bestimmte Funktionsweisen verändert haben.

Wenn du smart:deess selbst ausprobieren möchtest, kannst du dies jetzt kostenlos mit unserer 30-Tage-Testversion tun.

Die Geschichte des De-Essers

De-Esser gibt es schon seit mehreren Jahrzehnten und das Konzept geht auf das analoge Aufnahme-Zeitalter zurück.

In der Anfangszeit verwendeten Toningenieure hardware-basierte De-Esser, bei denen es sich häufig um in Racks eingebaute Geräte handelte. Diese Geräte arbeiteten in der Regel mit einer frequenz-selektiven Kompression, um die mit Zischlauten verbundenen hochfrequenten Komponenten zu dämpfen.

Im Zuge des technischen Fortschritts wurden De-Esser auch als Software-Plugins verfügbar gemacht, auch wenn sich diese in Bezug auf das Design und die Verarbeitungsschritte an ihren analogen Vorgängern orientierten.

De-Essing vor De-Essern

In der Anfangszeit der populären Musik begann der Prozess des De-Essings oft mit dem Sänger und nicht mit dem Tontechniker oder Produzenten. Professionelle Sänger wie Frank Sinatra waren gut auf das Singen mit Mikrofonen trainiert und reduzierten Probleme wie Zischlaute während der Aufnahme, indem sie ihre Position zum Mikrofon veränderten.

Man erzählt sich sogar, dass John Lennon seine Hand jedes Mal zwischen Mund und Mikrofon bewegte, wenn er ein Ess sang!

Außerdem wurde nicht so nah am Mikrofon gesungen, wie es heute üblich ist. Die Sänger und Sängerinnen waren ein paar Meter von der Mikrofonmembran entfernt – im Gegensatz zu den wenigen Zentimetern Entfernung, mit denen viele Sänger heute aufnehmen.

Auch die in den 50er, 60er und 70er Jahren verwendeten Geräte spielten beim De-Essing eine Rolle. In den letzten Jahrzehnten wurden die Klang-Profile von Kondensatormikrofonen, die typischerweise für Gesangsaufnahmen genutzt werden, so optimiert, dass sie eine Anhebung der oberen Mittenfrequenzen bewirken. Das sorgt für den Glanz, den man mit modernem Pop-Gesang assoziiert, erhöht aber auch die Präsenz von Zischlauten.

Trotz guter Gesangstechnik und unterschiedlicher Geräte war das Zischen schon immer ein Problem bei Gesangsaufnahmen und Produzenten haben Techniken entwickelt, um dem entgegenzuwirken.

smart:EQ 4

Eine dieser Techniken bestand darin, einen Kompressor via Sidechaining mit dem Vocal-Signal zu versorgen, das mit einem Boost per EQ im Zischlautbereich ausgestattet wurde. Der Kompressor wendet dann eine breitbandige Kompression auf das originale Vocal-Signal an, wird aber nur bei Frequenzen im Zischtonbereich ausgelöst.

Eine andere Methode war die Anwendung einer sogenannten Splitband-Kompression. Bei dieser Methode wird das Vocal-Signal in zwei Teile aufgeteilt: Ein Signal, das die Frequenzen der Zischlaute enthält und ein Signal, das diese nicht enthält. Auf diese Weise wird die Kompression nur auf das Zischlautsignal angewendet.

Wie funktionieren traditionelle De-Esser?

Heutzutage gibt es spezielle De-Esser, die kein Signal-Splitting, Sidechaining oder Routing erfordern. Alles, was du machen musst, um eine Stimme zu de-essen, ist, einen De-Esser in deine Signalkette zu laden.

Aber wie funktionieren De-Esser eigentlich?

Ein herkömmlicher De-Esser ist im Wesentlichen ein Kompressor, der nur ausgelöst wird, wenn der Threshold in einem ganz bestimmten Frequenzbereich überschritten wird – dem Bereich, in dem Zischlaute auftreten, in der Regel bei 4–10 kHz.

Wenn ein herkömmlicher De-Esser ausgelöst wird, wendet er eine breitbandige Kompression auf das gesamte Frequenzspektrum an.

Wie bei einem Kompressor können Anwender bei einem De-Esser in der Regel den Threshold, die Stärke der Gain-Reduktion und die Geschwindigkeit der Reduktion einstellen. Einige De-Esser bieten auch die Möglichkeit, den Frequenzbereich zu steuern, der den De-Esser auslöst. Das ist nützlich für das De-Essing von Stimmen mit unterschiedlichen Frequenzinformationen, beispielsweise von Männer- und Frauenstimmen.

Solche De-Esser können sehr effektiv sein, haben aber auch ihre Grenzen.

Was sind die Grenzen herkömmlicher De-Esser?

Sie können durch Geräusche ausgelöst werden, die keine Zischlaute sind.

Ein Problem bei einem herkömmlichen De-Esser besteht darin, dass der De-Esser nicht wirklich Zischlaute erkennt, sondern die Energie in einem bestimmten Frequenzbereich als Stellvertreter für das Auftreten von Zischlauten verwendet.

Das bedeutet, dass De-Esser durch jedes laute Geräusch im Frequenzbereich der Zischlaute ausgelöst werden können, was dazu führen kann, dass die Kompression manchmal unerwünscht ausgelöst wird.

Sie können Plosive und andere unerwünschte Geräusche nicht beseitigen

De-Esser eignen sich hervorragend zur Beseitigung von Zischlauten, es gibt aber auch andere unerwünschte Geräusche, die in Gesangsaufnahmen auftreten können.

Zu den häufigsten und schädlichsten Bestandteilen von Gesangsaufnahmen zählen Plosive. Plosive entstehen bei der Aussprache von “Be” und “Pe“, wenn ein Luftstrom aus dem Mund des Sängers kommt. Dieser Luftstrom trifft auf die Membran des Mikrofons und versetzt sie in Schwingung. Die Vibration wird in deiner Audioaufnahme als bass-lastiges Rumpeln zu hören sein.

Da Plosive in einem anderen Teil des Frequenzspektrums auftreten als Zischlaute, können sie herkömmliche De-Esser nicht entfernen. Das ist einer der Hauptvorteile unseres KI-gestützten smart:deess.

Sie dämpfen das gesamte Audiospektrum

Ein weiteres Problem herkömmlicher De-Esser besteht darin, dass sie, wenn sie ausgelöst werden, eine Breitbandkompression durchführen und die Lautstärke über das gesamte Frequenzspektrum hinweg reduzieren.

In einer idealen Welt würden De-Esser nur die spezifischen Frequenzen ausblenden, bei denen Zischlaute auftreten.

Wie smart:deess das Problem der traditionellen De-Esser löst

smart:deess ist der neue KI-gesteuerte De-Esser von sonible, und wir sind stolz darauf, mit ihm eine Reihe neuer Technologien einführen zu können, die die Probleme herkömmlicher De-Esser-Plugins lösen.

smart:deess erkennt Zischlaute

smart:deess identifiziert Zischlaute nicht auf die gleiche Weise wie herkömmliche De-Esser. Bei smart:deesss haben wir künstliche Intelligenz in den Erkennungsalgorithmus eingebaut. Dadurch kann smart:deess das eingehende Audiomaterial analysieren und Phoneme im Audiomaterial identifizieren.

Diese Technik basiert nicht auf der Lautstärke oder dem Frequenzbereich. smart:deess kann Zischlaute von Anfang bis Ende innerhalb einer Audioaufnahme ausmachen.

Aus diesem Grund hat smart:deess nicht die Probleme, die traditionelle De-Esser haben, wenn es darum geht, von zischenden Geräuschen ausgelöst zu werden. Das bedeutet auch, dass smart:deess leise Zischlaute in einer Gesangsaufnahme erkennen kann, die von einem herkömmlichen De-Esser nicht erfasst werden würden.

smart:deess kann Plosive entfernen

smart:deess erkennt mit seiner KI-gestützten Phonem-Erkennung nicht nur Zischlaute. Der Algorithmus kann auch andere unerwünschte Geräusche erkennen, wie beispielsweise Phoneme, die in anderen Bereichen des Frequenzspektrums als Zischlaute auftreten. Dazu gehören auch Plosive, die ein sehr häufiges Problem bei Audioaufnahmen sind.

Da smart:deess in der Lage ist, diese Plosive zu isolieren, ist es auch in der Lage, sie aus Audioaufnahmen zu entfernen.

smart:deess entfernt nur unerwünschte Frequenzen

smart:deess verwendet Spektralverarbeitung, um Zischlaute, Plosive und andere unerwünschte Elemente aus Gesangsaufnahmen zu entfernen. Bei der spektralen Verarbeitung wird das Frequenzspektrum in Tausende von Bändern aufgeteilt. Man kann sich das wie eine sehr fortschrittliche Multiband-Verarbeitung vorstellen.

Das bedeutet, dass smart:deess – im Gegensatz zu herkömmlichen De-Essern, die das gesamte Frequenzspektrum unterdrücken – nur spezifische Frequenzen unterdrückt, in denen die unerwünschten Geräusche auftreten. Unterschiedliche Zischlaute werden auf unterschiedliche Weise behandelt – SS, SH, CH, P, T Phoneme werden jeweils einzeln verarbeitet.

Mit smart:deess kannst du Zischlaute umgestalten

Mit smart:deess kannst du nicht nur die Lautstärke des Zischlauts reduzieren, sondern auch die Color und den Ton der Zischlautfrequenzen verändern.

Das ist aus einer Reihe von Gründen nützlich. Ein herausragender Anwendungsfall ist die Möglichkeit zu “Re-Essen”. Wenn dein Voice-Recording etwas dumpf klingt, kannst du mit smart:deess die Zischlautfrequenzen aufhellen, um sie stärker hervorzuheben und deiner Aufnahme mehr Glanz zu verleihen.

Aber smart:deess ist auch ein weiteres Werkzeug in deinem De-Essing-Arsenal. Anstatt nur die Lautstärke der Zischlaute zu dämpfen, können wir mit den Ton-Reglern von smart:deess Zischlaute abdunkeln, so dass sie weniger harsch klingen.

Probiere smart:deess noch heute aus

Wenn du smart:deess selbst ausprobieren möchtest, um zu erfahren, wie es deinen De-Essing-Workflow verändern kann, kannst du das Plugin 30 Tage lang kostenlos testen.

Weitere Informationen zu diesem Tool findest du in unserer kleinen Einführung zu smart:deess.