Pitching

von Caleb, 28.07.06.

  1. Caleb

    Caleb Registrierter Benutzer

    Im Board seit:
    28.01.05
    Zuletzt hier:
    5.11.06
    Beiträge:
    26
    Zustimmungen:
    0
    Kekse:
    10
    Erstellt: 28.07.06   #1
    hiho,

    mich würde interessieren wie ein pitching tool bei folgender situation rechnet:

    Fall 1:
    Ein Ton (im bsp. ein A''', also 440Hz) soll eine oktave tiefer gepitcht werden, also wird die Herzzahl halbiert (ergebnis A'' = 220Hz).
    soweit ist mir das ganze klar.

    Fall 2:
    2 Töne (440Hz & 640 Hz) sollen eine oktave tiefer gepitcht werden, eigentlich müssten ja beide töne in ihren frequenzen jeweils halbiert werden, d.h. es würde einmal 220Hz und einmal 320Hz herrauskommen... von der theorie her.

    ist das aber praktisch umsetzbar, wenn ich jetzt die anzahl der frequenzen gegen \infty (unendlich) laufen lasse, bzw. wird das tatsächlich von programmen gemacht?

    mfg
    caleb
     
  2. .Jens

    .Jens Mod Emeritus Ex-Moderator HCA

    Im Board seit:
    18.08.03
    Zuletzt hier:
    3.12.16
    Beiträge:
    10.615
    Ort:
    Hamburg
    Zustimmungen:
    1.926
    Kekse:
    23.787
    Erstellt: 29.07.06   #2
    Nicht nur dort, auch in der Praxis ;)

    Ja. das ist sogar noch viel einfacher, weil beim "ursprünglichen" Pitchen das Programm sich gar nicht die Frequenzen "ansieht", sondern einfach die Zeit schneller oder langsamer laufen lässt - damit hat man den gleichen Effekt, allerdings auch ein anderes Tempo.
    Einen Schritt weiter kann man hingehen, und das Audiomaterial in kleine "Scheibchen" unterteilen, pitchen und dann soviele "Scheibchen" wiederholen, bis das Originaltempo wieder stimmt.

    Die heute AFAIK üblicherweise eingesetzte Methode beruht aber auf FFT-Techniken: Man bildet die Fourier-Transformation des Audiomaterials, staucht die Frequenzen zusammen (oder streckt sie) und transformiert wieder zurück. Für heutige Rechner kein Problem, vor ein paar Jahren noch (in Echtzeit) undenkbar ;).
    Man hat bei solchen FFT-Filtern allerdings auch nicht unendlich viele Frequenzen, sondern soviele, wie im Ursprungsmaterial Samplepunkte waren. Also: 1024 Samples ergeben in der FFT 1024 Frequenzen - was ein typischer Wert für solche "Chunks" ist...
     
  3. Caleb

    Caleb Threadersteller Registrierter Benutzer

    Im Board seit:
    28.01.05
    Zuletzt hier:
    5.11.06
    Beiträge:
    26
    Zustimmungen:
    0
    Kekse:
    10
    Erstellt: 29.07.06   #3
    danke erstmal für die hilfe, ich hätte jetzt nicht gedacht, dass man das auf der ebene macht. aber dieses FFT ist mir noch ein wenig unklar.

    wenn ich das richtig verstanden habe, dann ist das genau die theorie die ich beschrieben hatte, bei der jede einzelne Frequenz angegriffen werden muss.

    durch die sache ist bei mir jetzt noch eine frage aufgekommen:
    wenn ich auf einem spectrum analyzer den aktuellen frequenzgang sehe, dann sehe ich dort quasi eine linie.
    in der mathematik sieht es so aus, dass eine linie unendlichfach teilbar ist (ich nehme 50hz und 100hz, dazwischen sind noch 75hz, zwischen 100hz und 75hz sind noch 87,5hz usw., das kann ich unendlich oft machen und ich bekomme immer ein erg.), doch wenn ich das mit den Samples richtig interpretiere, dann währe das quasi eine gruppe von frequenzen (1024).... also wirklich die "treppchen" die ich z.b. bei PinguinAM sehe.

    erstmal habe ich das richtig verstanden? und was bedeuten dann die 1024?


    danke nochmal an dich, dass du mir meine frage beantwortet hast... das brannte einfach wie eine große lücke in meinem hirn ^^.

    mfg
    caleb
     
  4. .Jens

    .Jens Mod Emeritus Ex-Moderator HCA

    Im Board seit:
    18.08.03
    Zuletzt hier:
    3.12.16
    Beiträge:
    10.615
    Ort:
    Hamburg
    Zustimmungen:
    1.926
    Kekse:
    23.787
    Erstellt: 29.07.06   #4
    Ist auch auf die Schnelle etwas schwer zu erklären - vor allem müsste man dazu erstmal wissen, auf welchem Kenntnisstand deinerseits man da ansetzen kann. Also etwa "Schulwissen, 11. Klasse" oder sowas

    Muss nicht, das ist halt eine sehr "einfache" Möglichkeit. Pitch-shifting ohne eine Tempoveränderung (oder umgekehrt) ist so ganz trivial eben nicht.

    Richtig, eine Sinuskurve entspricht im Frequenzraum einer Linie. Bei einem unendlich langen Sinus ist die auch unendlich "schmal". Da aber ein reales Signal irgendwo anfängt und aufhört, ist das in der Realität nicht so: Die Breite der "Linie" ist umgekehrt proportional zur Länge des Signals.
    Beispiel: Ein 1kHz-Ton von 1s Länge hat einen Frequenzgang mit einer Breite von 1Hz, die Linie auf dem Spektrumanalysator ginge also von 999,5Hz bis 1,005 kHz.

    Das, was du bei der digitalen Darstellung einer Wellenform siehst, sind nicht die einzelnen Frequenzen, sondern die einzelnen Samples. Bei solchen diskreten Signalen steckt aber nur begrenzt viel Information drin, so dass im Frequenzraum nicht mehr Frequenzen betrachtet werden müssen/können als Samples im Zeitbereich da sind.

    Der FFT-algorithmus ist eine sehr schnelle Art der Berechnung der Fourier-Transformation - funktioniert aber nur mit ganzzahligen Potenzen von 2. also z.B. 8, 16, 256, oder eben 1024 (das ist ein guter Kompromiss aus "schnell genug" und "wenig Scheibchen", denn zwei Scheibchen mit 1024 Samples sind schneller berechnet als eins mit 2048).

    wenn du dich in die Materie etwas einlesen möchtest:
    Audio timescale-pitch modification - Wikipedia, the free encyclopedia
    Fourier-Transformation - Wikipedia
    Schnelle Fourier-Transformation - Wikipedia
    Wavelet-Transformation - Wikipedia
     
  5. Caleb

    Caleb Threadersteller Registrierter Benutzer

    Im Board seit:
    28.01.05
    Zuletzt hier:
    5.11.06
    Beiträge:
    26
    Zustimmungen:
    0
    Kekse:
    10
    Erstellt: 04.08.06   #5
    uff, ist alles wirklich ne menge stoff.

    der tipp mit der 11. klasse war ein volltreffer, komme jetzt in die 12. mit Mathe und Physik LK, ich muss mich also mit dem gedanken anfreunden mir auch sowas mal reinzupfeifen...
    und ich will die ferien ja auch nutzen ;).

    leider ist das was ich so überblicken konnte weit über meinem physikalischen know how, wellen kommen bei uns in den grundsachen gerade mal in 12 dran (ein grund warum ich das ganze schonmal starten musste), aber es kann durchaus sein, dass etwas zu wenig davon hängen geblieben ist oder einfach es wirklich zu weit über den mir bekannten themen liegt.

    wie bist du an dein wissen gekommen und wie weit kannst du das wissen dann live oder im studio anwenden?

    wenn du nicht noch verständnishilfen auf meiner seite hast, würde ich dieses thema vorerst schließen.

    grüße
    caleb
     
  6. .Jens

    .Jens Mod Emeritus Ex-Moderator HCA

    Im Board seit:
    18.08.03
    Zuletzt hier:
    3.12.16
    Beiträge:
    10.615
    Ort:
    Hamburg
    Zustimmungen:
    1.926
    Kekse:
    23.787
    Erstellt: 04.08.06   #6
    Alo, ich kann dich beruhigen: Fouriertransformation und speziell die FFT muss man nach der 11 nun wirklich nicht beherrschen. In zwei Jahren sprechen wir uns wieder ;) - wobei ich nicht glaube, dass die FT wirklich Stoff für einen Mathe-LK wäre. Fourier-REIHEN vielleicht noch, und im Physik-LK könnte man davon ansatzweise auch was hören, aber ansonsten gehört das eher nicht zum Schulstoff. Ich müsste noch mal nachsehen, aber da müsste ich mich schon sehr täuschen.

    In so einem Physikstudium bleibt eine Menge hängen ;) Sicher auch vieles, was sich live und im Studio anwenden lässt, aber nicht gerade die FT. Über digitale Signale und ihre Eigenschaften etwas mehr zu wissen als "Otto N." ist allerdings bei der Fehlersuche im Umgang mit digitalen Aufnahmetechniken sicher von Vorteil. Aber man muss nicht wirklich wissen, wie eine FFT funktioniert (um ehrlich zu sein: auswendig weiß ich das auch nicht, und ich würde mich auch schon mit dem Nachvollziehen des Algorithmus schwertun. Aber so ein paar grundlegende Eigenschaften kennt man halt, wenn man den Algo schon etliche Male benutzt hat...)

    Jens
     
Die Seite wird geladen...