Jens: Hab noch nie eine komplizierte Art gesehen das zu schreiben, Gratulation!
Zum Thema: Generell kriegst du Musik und Gesang nur dann 100% getrennt wenn wie zB bei alten beatlesplatten jeweils eins davon hart gepannt ist, sprich zB Gesang L, Musik R.
Bei normalen Stereotracks ist das schwierig, denn Musik und Gesang sind ja zusammengemischt.
Womit man aber arbeiten kann (und was Jens oben so schön erklärt hat) ist die Tatsache, daß ein musiksignal, das in der Phase gedreht wurde sich mit dem Orginalsignal komplett auslöscht. Oder in Volt gesagt:
Unser Signal sei +10V
Wir drehen die Phase um 180 Grad.. was einer invertierung des Signals entspricht (man kann die Phase auch durch tauschen der Beiden Drähte des Signalkabels drehen, zB an einem Lautsprecher oder im Mikrofonkabel...), also erhalten wir
Orginal 180Grad Phasendrehung: -10V
Mischen wir Orginal mit phaseninvertiertem Signal zusammen erhalten wir?
+10V + -10V= 0V
Was bringt uns das nun? Ganz einfach: In einem Stereosignal wird die Position innerhalb des Stereopanoramas durch das Verteilen des Signals auf L und R gemacht. Signale die exakt in der mitte des Panoramas sind (sprich monosignale) haben auf L und R exakt den gleichen Pegel. mischen wir L und R einfach so normal zusammen, erhalten wir ein Monosignal, in dem die mittigen Signale sehr laut sind, die vorher links oder Rechts befindlichen Signale noch vorhanden.
Mischen wir nun aber zB das Signal von L mit dem 180 Grad verdrehten Signal von R zusammen...
verschwindet alles was im Stereosignal mittig war: denn diese Signale löschen sich aus wie im obigen Voltbeispiel die Spannung. Übrig bleiben die seitlichen Signale (gepannte Instrumente usw), sowie evtl vorher gegenphasigen Signale... das sind meist Halleffekte oder die Stereomikros des Drumsets. Da Snare, Bass und andere Instrumente meist aber ebenfalls in der Mitte sind, fallen diese ebenfalls raus... Meist bleibt dabei wirklich nur Hall und stark gepannte Sachen wie Adlibspuren, zweite Stimmen usw übrig...
man sieht also, man kann nur stark gepannte oder "breite" signale von den mittigen trennen. Und: Wie Jens schon sagte ist es nicht möglich nur die Mitte zu isolieren. Ich versuch mal Jens´ Matematik zu vereinfachen.
L= Signal Links des Stereosignals
R= Signal Rechts des Stereosignals
M= Signal Mitte des Stereosignals
L= L+M
R= R+M
Das ist was jeweils auf den Kanälen des Stereosignals anliegt: Links eben das linke Signal plus ein Teil Mittesignal usw.
Bei normaler Monomischung bekommen wir:
L+R = (L+M) + (R+M)= L+2M+R
(Sprich man hört das mittesignal lauter und den Rest normal. Kennt man vom Mixing: Im Monomix fällt der Sound einigermaßen zusammen, die Verhältnisse von Instrumenten und zB Hall kann sich deutlich verschieben... alles klingt plötzlich f*rztrocken...
jetzt invertieren wir mal R:
R inv= -R + -M
und mit Links summiert:
L+ -R= (L+M) + (-R+-M) = L+ -R
+M und -M löschen sich gegenseitig. Man sieht aber auch: Man erhält immer eine Mishung aus L und R.
Ich denk aber ein bissl in den Hintergrund kriegt man die Musik zumindest, wenn sie einigermaßen breit gemischt ist: Per Wandlung des LR in M/S, Absenken des S Pegels, und rückkonvertierung in L/R...