Suche Programm zur Zeit-Frequenzanalyse für Windows

  • Ersteller Stadtmensch
  • Erstellt am
Stadtmensch
Stadtmensch
Registrierter Benutzer
Zuletzt hier
25.03.20
Registriert
07.05.11
Beiträge
110
Kekse
1.613
Ort
Österreich
Liebe Usergemeinde,

ich habe einige Samples von Glocken, Gongs, Ambossen etc. aufgenommen und suche nun ein Programm, mit welchem ich eine Frequenzanalyse durchführen kann. Und zwar eines, welches idealerweise und insbesondere nach den jeweils mitschwingenden Partialtönen zu suchen vermag und das klingende Material in einem Zeitdiagramm darstellen kann.

Besten Dank im Voraus!

Stadtmensch
 
Eigenschaft
 
Hallo,

auch wenn es schon eine Weile her ist...

Wenn ich dich richtig verstehe suchst du nach einer Software, die eine Fourier-Transformation durchführt. Du möchtest ein komplexes Klangereignis in seine Sinusbestandteile aus Grundton und dem harmonischen Obertonsprektrum zerlegen und dies in einem Zeitdiagramm darstellen?

Als reines Messwerkzeug kannst du dafür Wavelab von Steinberg nutzen. Wavelab bietet eine Funktion, mit der du Audio Samples analysieren und auswerten lassen kannst. Das Ergebnis der Messung wird in einem Wasserfalldiagramm dargestellt. Wie präzise diese Darstellung ist musst du für dich entscheiden.

Aus meiner Sicht kannst du mit dem Thema auch bei der Additiven Synthese bzw. Resynthese einsteigen. Hierzu gibt es einige Hard- und Softwarevarianten, die mehr oder weniger anwendbar sind. Diese richten sich aber primär an musikalische Anwendungen und nicht an physikalische. Du wirst also kaum die Möglichkeit haben auf die Spektraldaten zuzugreifen.

Beispiele:

Es gibt für den Kawai K 5000 Synthesizer ein Plugin für Emagic Sounddiver. Dieses Programm beinhaltet eine Fourier Analyse inkl. Umrechnung in die entsprechenden Syntheseparameter des Synthesizers. Nach der Analyse eines Audiosamples beliebiger Länge, ermittelt die Software die Pegelverhältnisse im vorhandenen Frequenzspektrum und erzeugt daraus eine neue Reihe additiver Oszillatoren. Dieses Spektrum wird dann in den Synthesizer übertragen und kann dort reproduziert werden. Auf diese Weise kann man alle nur erdenklichen Wellenformen erzeugen und kopiert somit das klangliche Vorbild. Das funktioniert allerdings nur statisch. Zeitliche Änderungen des Spektrum innerhalb des Samples werden dabei nicht berücksichtigt. Dies kann nur eine reiner Re-Synthesizer tun.

Auf Softwarebasis gibt es auch einige Additive Synthesizer, die ähnlich funktionieren. Aber wie gesagt bekommt man bei diesen Systemen kaum Zugriff auf die Analysedaten.

Die Firma Audio One aus Berlin vertreibt auch eine Software zum akustischen Messen von Räumen (Audioease). Hier kommen ähnliche Dinge zum tragen.

Ein anderes Anwendungsgebiet dieser Technologie ist die Reproduktion von Halleffekten. Der sogenannte Faltungshall arbeitet ebenfalls mit einer Fourier Transformation. Bei diesem Einsatzgebiet wird innerhalb eines Raumes ein sogenannter idealer Impuls erzeugt. Ein Speziallautsprecher (Kugelabstrahlung) erzeugt ein sehr kurzes und sehr lautes Signal (Peak). Der Peak hat die akustische Eigenschaft alle Frequenzen in einem nahezu linearen Frequenzverhältnis abzustrahlen. Man regt also den Raum auf allen Frequenzen gleichmäßig dazu an, eine akustische Antwort zu geben (Impulsantwort). Diese Impulsantwort wird dann über Mikrofone aufgenommen und als Sample gespeichert. Möchte man nun wissen welches Nachhallspektrum der Kölner Dom nach 5 Sekunden hat, analysiert man das Sample und erhält ein Spektrum, dass mit einem beliebigen Audiosignal verrechnet werden kann. So kann man eine perfekte Kopie der Raumakustik reproduzieren.

Gruß
 
Ein anderes Anwendungsgebiet dieser Technologie ist die Reproduktion von Halleffekten. Der sogenannte Faltungshall arbeitet ebenfalls mit einer Fourier Transformation. Bei diesem Einsatzgebiet wird innerhalb eines Raumes ein sogenannter idealer Impuls erzeugt. Ein Speziallautsprecher (Kugelabstrahlung) erzeugt ein sehr kurzes und sehr lautes Signal (Peak).

Eine Raummessung mit einem Impuls ist praktisch so gut wie unmöglich, da man mit einem Impuls nicht genügend Energie in den Raum bringt, um eine vernünftige Messung mit genügend Rauschabstand (vor allem akustisch (Nebengeräusche im Raum)) hinzubekommen. Deshalb misst man Impulsantworten von Räumen über einen Sinus-Sweep, das Messergebnis kann man dann in eine Impulsantwort umrechnen, mit der ein Faltungshall gespeist werden kann.

Im Resultat kommt es aber auf dasselbe raus wie ein Peak.

Banjo
 
Ja, auch das ist wohl möglich. Nur habe ich bisher nie verstanden, wie man bei dieser Messmethode den ausgesendeten Sinussweep aus dem Antwortsample entfernt. Der Sweep an sich hat einen gewissen zeitlichen Verlauf (z.b. Start f 20Hz, End f 20 kHz, Dauer 10 Sekunden). Das Messmikrofonsystem nimmt also sowohl den Sweep als auch die Raumantwort auf. Wenn ich dieses Sample dann als Impulsantwort nutze, bleibt also der Direktschallanteil im Antwortsignal vollständig erhalten.

Wie erzeuge ich dann aber den reinen Nachhall des Raumes ohne Direktschallanteil?

Den Sweep über Delay und Phasenauslöschung aus dem Sample zu entfernen ist nicht möglich, da der Frequenzgang am Mikrofon in jedem Fall anders ist als im Originalsignal oder am Sendelautsprecher.

Möglicherweise habe ich auch einen Denkfehler in der Sache...
 
Das Direktsignal ist ja ganz am Anfang der Impulsantwort, wenn man diese in der Zeitebene aus der Sweepantwort berechnet hat. Wie Du schon sagst, ist das Direktsignal aufgrund der Frequenzgänge von Lautsprecher, Mikrofon und Luft verfälscht und sieht dann wie ein etwas verwaschener Peakimpuls aus. Den kann man dann in der Zeitebene ganz einfach vorne wegschneiden bzw. diese Samples auf 0 setzen und dann mit einem kleinen FadeIn das Raumsignal einblenden.

Gute Raumimpulsantworten werden eigentlich immer noch nachbearbeitet, da gehört dieser Schritt dann dazu, wie auch das Abschneiden am Ende der Impulsantwort, wo das ausklingede Signal allmählich im Rauschen und dem akustischen Grundgeräusch des Raums versinkt.

Banjo
 
Auch damit habe ich ein Problem. Beim entfernen des ersten Teils des Samples gehen Informationen verloren, die man aus dem nachfolgendem Audiomaterial nicht mehr entnehmen kann. Angenommen der Sweep dauert 5 Sekunden und man schneidet dann 5 Sekunden vom Antwortsample weg. Woher kommt dann die Rauminformation über die ersten 5 Sekunden Nachhall des Raumes? Gerade hier treten frühe Reflektionen (ER´s) des Raumes auf, die akustisch sehr relevant sind.

Weiterhin habe ich ein Verständnisproblem was den zeitlichen Verlauf des Nachhalls betrifft. Beim Verfahren des Idealen Impulses werden alle Frequenzen zeitgleich angeregt. Das Nachhallverhalten des Raumes wird als zeitlich korrekt für alle Frequenzen abgebildet.

Beim Sweep Verfahren werden aber alle Frequenzen zeitlich versetzt angeregt. 1. entsteht dadurch ein Kammfiltereffekt der das Messergebnis verfälscht und Phasenprobleme hervorbringt 2. stehen die Frequenzen nicht mehr in einem zeitlich richtigen Verhältnis zueinander. Das Sample eines Sweeps muss also im Nachgang irgendwie zeitlich korrigiert werden. Wie tut man das mit unendlich vielen Frequenzen?
 
Für Räume mit langer Nachhallzeit nimmt man einen deutlich längeren Sweep.

Und man versucht erst gar nicht, den Direktanteil aus dem Messignal direkt zu entfernen, sondern transformiert das ganze Signal inklusive Direktanteil in die Zeitebene. Dazu muss man für die einzelnen Frequenzen Betrag UND Phase ermitteln, dann wird der zeitliche Ablauf bei der inversen Transformation zurück in die Zeitebene auch korrekt hergestellt und der Direktanteil ist ganz vorne.

Natürlich muss man bei der Ermittlung der Phase berücksichtigen, wann das jeweilige Band im Sweep angeregt wurde. Ich hab das selber nie programmiert, deshalb habe ich mich mit dem Problem der unendlich vielen Frequenzen und der Überlappung von weiter laufendem Sweep und nachklingenden vorher angeregten Frequenzen nie beschäftigt und kann Dir diese Fragen nicht beantworten. ich kann Dir nur sagen, dass es funktioniert. Ich arbeite beruflich für eine Firma, die sich im Laufe der Jahre eine große Bibliothek von Räumen erarbeitet hat und auch andere Firmen bei der Erstellung von Raumimpulsantworten berät und das wird alles mit Sweeps gemacht.

Der Direktanteil ist im zurücktransformierten Zeitbereich keine 5 Sekunden lang, sondern es geht um einige Samples ganz am Anfang, die man entfernen muss. "Ganz am Anfang" ist auch nicht ganz korrekt, denn eine gewisse Laufzeit vom Lautsprecher zum Mikrofon gibt es natürlich auch noch. Aber dann geht es mit dem Direktanteil los, bevor die ersten Reflektionen und dann der Raum folgt.

Banjo
 
Zuletzt bearbeitet:
Jetzt hast Du meine Neugierde geweckt wie das ist mit dem Ermitteln der Impulsantwort aus dem Sinus-Sweep und ich habe folgendes gefunden:

http://aurora-plugins.forumfree.it/?t=53443032

Im Prinzip läuft es darauf hinaus, dass man das gemessene Signal mit der inversen Impulsantwort des Sweeps selbst faltet, dann hat man die reine Impulsantwort (inklusive Direktanteil) als Spektrum in komplexen Zahlen (also Betrag und Phase) vorliegen. Das noch zurück in die Zeitebene transformiert und man hat die Impulsantwort als Wave.

Banjo
 
Aus deinen Beschreibungen entnehme ich, dass man bei der Auswertung nicht das komplette Frequenzspektrum betrachtet, sondern nur einzelne Frequenzen heraus nimmt. Wenn man z.B. aus dem Bereich 20Hz bis 20kHz nur einige tausend Frequenzen zur Errechnung der Impulsantwort herausfiltert, könnte das machbar sein. Der Rest fällt dann einfach weg (ähnlich MP3), da die fehlenden Frequenzen "nicht" wahrgenommen werden bzw. durch die vorhanden überdeckt werden. Man darf den Frequenzabstand nur nicht zu groß wählen um es nicht synthetisch klingen zu lassen. Die einzelnen Frequenzen lassen sich natürlich anhand der Sweepdauer zeitlich berechnen und in der Phase entsprechend zurück schieben.

Was aber dennoch bleibt ist das Problem des Direktsignals und der frühen Reflektionen. Wenn der Sweep sogar noch länger als 5 Sekunden dauert, gehen definitiv Informationen verloren und ich kann nicht erkennen wie diese zurück gewonnen werden sollen. Trotz Laufzeit (Lautsprecher > Mikrofon (Milisekundenbereich) würde der Sweep dann möglicherweise 10 oder 20 Sekunden lang zu hören sein. Das heißt während des Sweeps erfolgen auf annähernd allen Frequenzen frühe Reflektionen und auch Nachhal, die vom Direktsignal überlagert werden. Man könnte das Direktsignal theoretisch herausrechnen. Dazu müsste man aber wissen welchen Frequenzgang (Beträge) jede einzelne Frequenz am Mikrofon hat.

Eine andere Möglichkeit ist natürlich, dass man später bei der Anwendung (Faltungshall), dass zu bereichernde Signal (Direktsignal / Gesangsstimme) durch Phasenauslöschung aus dem Hallanteil entfernt. Somit würde man das Direktsignal nicht doppelt hören. Möglicherweise ist es ja auch ganz anders :)
 
Nein, es wird schon das gesamte Spektrum genommen. Vielleicht habe ich mich da missverstänlich ausgedrückt.

Leider entzieht sich das Ganze ein wenig der Vorstellung und ist nur mathematisch zu greifen. Wenn man einen Sinus-Sweep in eine Raum jagt, erzeugt man eine Faltung des Sweeps mit der Impulsantwort des Raums (inklusive Direktanteil). Wann man dieses Signal mit dem invertierten Sinus-Sweep faltet, bleibt wieder die Impulsantwort des Raums samt Direktanteil übrig. Der invertierte Sweep ist im Wesentlichen ein rückwärts laufender Sweep mit einer frequenzabhängigen Pegelkorrektur. Man muss natürlich länger messen als der Sweep dauert, denn der Raum klingt ja noch aus.

Dass bei dieser Methode der Direktanteil mit in die Messung eingeht, ist kein Problem. Denn die durch Faltung mit dem inversen Sweep berechnete Impulsantwort enthält den Direktanteil vom Lautsprecher direkt ins Mikrofon ganz am Anfang, wo man sie einfach wegschneiden kann. Man versucht also erst gar nicht, direkt im Messsignal den Direktanteil irgendwie zu eliminieren, sondern macht das erst später, nachdem man den Sweep per Faltung mit seinem inversen Signal rausgerechnet hat und die reine Impulsantwort des gemessenen Signals hat.

Banjo
 
Wenn ich dich richtig verstehe suchst du nach einer Software, die eine Fourier-Transformation durchführt. Du möchtest ein komplexes Klangereignis in seine Sinusbestandteile aus Grundton und dem harmonischen Obertonsprektrum zerlegen und dies in einem Zeitdiagramm darstellen?
Wo ihr grad schon technische Feinheiten diskutiert: die FT transformiert das Audiosignal ja in den Frequenzraum. Was meint ihr dann mit Zeitdiagramm? Wird da ein Spektrogramm anstelle der "kompletten" FT gemacht oder geht's um was anderes?
 
Man kann die FT statisch betrachten oder innerhalb eines Samples mehrere Messungen (Zeitfenster) durchführen. So erhält man nicht nur ein statisches Frequenzsprektrum des kompletten Ereignisses, sondern einen zeitlichen Verlauf der Frequenzanteile. Dieser wird dann in einem Wasserfalldiagramm dargestellt. Man sieht dann quasi die vollständige Hüllkurve "jeder" Frequenz im Signal.

Ein FFT Analyser zeigt ja auch das zeitlich aktuelle Spektrum an und nicht nur die Gesamtverteilung der Frequenzen in einem 2 Minuten langen Signal.
 

Ähnliche Themen


Unser weiteres Online-Angebot:
Bassic.de · Deejayforum.de · Sequencer.de · Clavio.de · Guitarworld.de · Recording.de

Musiker-Board Logo
Zurück
Oben