Hi,
ich beschäftige mich seit einiger Zeit mit "alternativen" Techniken der Stereofonie. Auch mit eher unbekannten oder neuen Surround-Technologien (Ambisonics, Wellenfeldsynthese, etc.).
Eins vorweg: Stereo ist eine über 70 Jahre alte Technologie und so wie wir es heute im allgemeinen kennen und verwenden eigentlich ein Witz, v.a. im Vergleich mit anderen Möglichkeiten.
Die Idee hinter der Kunstkopfstereophonie ist eigentlich sehr naheliegend und einfach: Wenn der Mensch nur zwei Ohren hat, muss man jedes beliebige natürliche Klangereignis mit Hilfe von zwei Kanälen nachbilden können. In Zeiten von 22.2 Surround und Wellenfeldsynthese mit 100ten von Lautsprechern, vergisst man schnell diese einleuchtende Tatsache.
Das Ohr wertet erstaunlich viele Informationen aus, v.a. ermittelt es Signalunterschiede zwischen den beiden Ohren (HRTF = Head Related Transfer Function), z.B. Laufzeit-, Lautstärke-, Phasen- und Frequenzunterschiede. Auch Reflexionen von den Schultern, Unterschiede zwischen Direktschall und frühen Reflexionen. Man kennt längst nicht alle Mechanismen. Die Kunstkopfstereofonie ist natürlich da natürlich ein sehr praktischer Ansatz, da man damit automatisch bekannte und sicherlich auch einige unbekannte psychoakustische Gesetze ausnutzt.
Man kann die Technologie auch ohne Kunstkopf anwenden: Es gibt Mirkofone, die man in die eigenen Ohren stecken kann (z.B. von Core Sound). es gibt die sog. Trennkörperstereofonie, wo eben eine physikalische Barriere zwischen zwei Mikrofonen "trennt". Es gibt auch kommerzielle Produkte (z.B. Jecklin-Scheibe). Man kann auch mit Hilfe von Impulsantworten (mit Raumanteil oder "schalltot") bereits aufgenommene Singale mit der entsprechenden HRTF ausstatten. Geht mit den regulären Faltungsplugins wie SIR, Waves IR, etc.
Hier gibt es entsprechende Impulsantworten zum Experimentieren:
http://sound.media.mit.edu/KEMAR.html
Es gibt auch weitere Softwarelösungen, z.B. CATT, die aber eher für bauakustische Zwecke verwendet werden.
Allerdings hat die Technologie einige sehr gravierende Nachteile, die wohl auch ihre allgemeine Verbeitung verhinderten:
- Man muss (normalerwiese, s.u.) über Kopfhörer hören. Aufnahmen sind nicht Lautsprecherkompatibel.
- Jede Mensch hat seine eigene HRTF, bei verschiedenen Menschen funktionieren verschiedene Mikrofonsysteme unterschiedlich gut oder schlecht.
- Es gab immer - vielleicht habt ihr das auch festgestellt, ich jedenfalss immer - das Problem der vorne-hinten-Verwechselung, meist nimnt man einfach alles von hinten wahr. Man hat vor nicht allzu langer Zeit herausgefunden (obwohl es eigentlich offensichtlich ist), dass der Mensch auch leichte unbewusste Kopfdrehungen nutzt, um eine Schallquelle zu lokalisieren. Das funktioniert natürlich unter dem Kopfhörer nicht mehr.
Man hat Hörversuche mit einem motorisierten "nachgeführten" Kunstkopf gemacht, der die Kopfdrehungen fast in Echtzeit mitmacht und ein Live-Ereignis überträgt. Damit war das Problem der vorne-hinten-Verwechslung praktisch verschwunden und die Richtungswahrnehmung war verbessert. Allerdings kann man damit natürlich keine Aufnahmen machen.
Aber es blieb natürlich spannend: Da man ja - gerade mit wachsender Rechenleistung - ermittelte HRIR (Head Related Impulse Response) auf aufgenommene Singale anweden kann, sind natürlich weitere Anwendungen entwickelt worden. So hat das Institut für Rundfunktechnik, ein Produkt entworfen, das zwar keine Aufnahmen ermöglicht, aber etwas anderes Interessantes: Virtuelle Regieräume. Man geht einfach her und stellt einen Kunstkopf an die Abhörposition von Top-Regieräumen. Man misst die HRIR jedes Lautsprechers (Stereo, Surround, völlig egal...), dann dreht man den Kopf um sagen wir 1° und misst wieder. Am Ende hat man dann jede Menge IRs. Die implementiert man dann in ein System, das mit einem Headtracker die Kopfbewegungen misst und praktisch in Echtzeit die jeweilige "korrekte" IR anwendet. Damit hat man dann zwar keine Kunstkopfaufnahe, aber den realistischen Eindruck, das entsprechende (beliebige) Signal in dem jeweiligen Regieraum über die entsprechende Abhöre zu hören. Das Verfahren nennt sich "Binaural Room Scanning (BRS)"
Ähnlich funktioniert wohl auch das "Headzone"-System von Beyerdynamic, das erst kürzlich auf den Markt kam.
Es gibt aber noch weitere höchst interessante Ansätze, die in der breiten Öffentllichkeit und auch bei den Profis wenig bis gar nicht beachtet werden.
Beispiel Ambiophonics:
Warum ist das Signal eines Kunstkopfes nicht lautsprecherkompatibel? Hauptgrund ist die Tatsache, dass das Signal der rechten Box auch am linken Ohr ankommt (mit der eigenen natürlichen HRTF) und umgekehrt. Also die Signale werden auch von dem "falschen" Ohr gehört und die eigene HRTF kommt zur "Künstlichen" dazu und macht das Bild zunichte.
Nun hat sich mal jemand zunächst gedacht, da stell ich einfach eine Wand zwischen die Boxen! Siehe da, es war erstaunlich. Dann: hm...da die Signale ja bei der Wiedergabe bekannt sind, und man auch ziemlich genau weiss wann dieses Signal das Ohr erreicht, dass es eigentlich nicht hören sollte, könnte man doch dieses "fehlgeleitete" Signal so auf den anderen Kanal mischen, dass es das "Störsignal" auslöscht. Man hätte annähernd einen virtuellen Kopfhörer, ohne die Nachteile eines "Echten". Man kann den Kopf drehen und vorne-hinten-verwechslung ist kein Problem. Das Verfahren nennt sich Crosstalk-Cancellation.
Entscheidener Nachteil der entsprechende Filter gilt nur an exakt EINER Abhörposition, die mit millimetergenauer Genauigkeit eingehalten werden muss. Man hat sich auch dem Problem angenommen, und es brauchbar entschärft. Die Ergebnisse sind wirklich erstaunlich und das selbst bei Aufnahmen, die NICHT mit Kunstkopfstereophonie aufgenommen wurden. Zwar erhält man mit zwei Lautsprechern keine 360°-Abbildung (aber mit 4 Boxen), aber eine frontale Abbildung von 120° mit phänomenalem Realismus. Und das Beste, jeder, der zwei Lautsprecher besitzt - also JEDER hier - kann das selbst ausprobieren, man muss lediglich seine Boxenaufstellung wie beschrieben verändern:
http://www.ambiophonics.org/Ambiofiles.htm
Man höre und staune! Vor allem der "Händel"-Ausschnitt kann einem fast das Wasser in die Augen treiben.
Aber vorsicht: Wenn man wieder in die normale "Stereo-Welt" zurück muss - da ja leider nicht mal die vom Konsumenten sachgerecht verwendet wird - möchte man vielleicht heulen und fluchen, bei dem Gedanken, welche Möglichkeiten es eigentlich gäbe, Musik zu erleben - und man kann sie doch keinem wirklich so näher bringen. Wer liest sich schon das Booklet durch, in dem vielleicht steht, stellen sie ihre Boxen bitte, bitte, bitte unbedingt in einem Winkel von 10° auf und setzen sich in einem Abstand von 2,30 in die Mitte. Wer würde denn das befolgen?
Weiterer Ansatz eines virtuellen Kopfhörers unter Verwendung von Wellenfeldsynthese:
http://www.hauptmikrofon.de/binauralsky.htm
Es gibt noch weitere faszinierende Technologien, die - im Gegensatz zur brachial-aufwändigen Wellenfeldsynthese - ohne Probleme für interessierte Benutzer zugänglich sind.
Beispiel Ambisonics: Ein vor über 30 Jahren (!) erfundenes 3D (echtes 3D mit Höhe, das nicht einmal die aktuellsten Wellenfeldsysthese-Systeme beherrschen) Aufnahme und Wiedergabeverfahren. Mit unglaublichen Features: Mischungen und Aufnahmen sind Beispielsweise kompatibel zu ALLEN erdenklichen Lautsprecheraufstellungen, es gibt 4 (in aktuellen Systemen auch die Möglichkeit 9 und mehr) Übertragungskanäle (Stereo=2, 5.1 = 6), die NACH Aufnahme oder Mischung vor der Wiedergabe auf eine bliebiges Lautsprecher-Setup dekodiert werden. Also im Idealfall verlässt eine Mischung mit vier Kanälen das Studio und erst beim Endkonsumenten dekodiert der Verstärker die Signale für das jeweilige Lautsprecher-Setup. Hat jemand nur Stereo - gut - hört er Stereo. Er kann sogar das virtuelle Hauptmikrofon, dass er ja praktisch hört, einstellen: Richtcharakteristik, Winkel, gehörte Entfernung. So kann man beispielsweise selbst entscheiden, ob man ein Orgelkonzert wie in einer Kirche von hinten hören möchte oder doch lieber frontal. Hat jemand einen Würfel mit acht Boxen erhält er 3D-Wiedergabe mit Höhe!
Da das System 360° aufnimmt (bzw. Mischungen solche Informationen enthalten) kann man die Aufnahme/Mischung beliebig um alle Achsen rotieren, auch eine Zoom-ähnliche Manipulation ist möglich! Das heisst auch, dass eben das, was mit dem Kunstkopf NICHT möglich ist, nämlich eine Aufnahme mittels Headtracker den Kopfbewegungen folgen zu lassen, hier möglich ist. Man kann mit Hilfe von HRIR (s.o.) ein virtuelles 3D-Laustprecher-Setup für Kopfhörer generieren. Der Headtracker kann dann nicht nur - wie bei bestehenden Systemen (BRS, etc.) die Rotation um eine Achse messen, sondern um 3 plus eine vorwärts-rückwärts-Bewegung. Mit all diesen Informationen kann man das gehörte Schallfeld entsprechend in Echtzeit manipulierern. Solche Kopfhörer-Systeme existieren bereits, aber nicht als kommerzielle Produkte. Für Lautsprecherwiedergabe gibt seit Beginn analoge Hardware-Decoder und heute Freeware.
Ambisonics findet leider fast nur in der Forschung Aufmerksamkeit.
Auf Darstellung der Wellenfeldsynthese verzichte ich, das sie für den Normal-User viel zu aufwändig ist.
Es gibt also jede Menge Ansätze, die Stereo im wahrsten Sinne des Wortes uralt aussehen lassen. Auch 5.1-Surround ist eigentlich für Musik und realistische Schallübertragung völlig UNGEEIGNET. Es wurde auch gar nicht dafür erfunden. Es ist lediglich gedacht für diffuse Ambience- und Effekt-Sounds (Menschenmasse, Schlachtenlärm, etc.) beim Film (!), nicht aber für exakte Wiedergabe von Phantomschallquellen, Reflexionen, Nachhall, etc.. Es hat eigentlich keine physikalisch-mathematische Grundlage. Auch existiert kein bestimmtes Aufnahmeverfahren für 5.1 und Hersteller und Tonmeister übertreffen sich im erfinden von Selbigen. Im Gegensatz dazu ist beispielsweise Ambisonics direkt aus physikalischen, mathematischen und psychoakustischen Zusammenhängen abgleitet (wurde auch von dem Mathematiker Gerzon erfunden).
Man könnte nun argumentieren, dass diese System nicht das leisten, was sie versprechen, sonst hätten sie sich wohl durchgesetzt. Wir wissen aber nur allzu gut, dass sich eben nicht immer (eher selten) die besten Technologien auf breiter Basis behaupten. Beispiel: VHS schlug Beta, obwohl Letzteres technisch eindeutig überlegen war. Das passierte nicht zuletzt deshalb, weil die Pornoindustire das System verwendet hat.
Auch sehen wir am Beispiel Ambiophonics, dass eben zu wenige Nutzer an echtem und bewusstem Klangerlebnis interessiert sind, man setzt sich halt nicht 1 Stunde in einen Sessel und hört ein Album durch. Nein, man lässt sich berieseln bei allen möglichen Tätigkeiten.
Es ist schade, welches Potential da brach liegt...
Gruß,
Uranus
Edit: Weil MS angesprochen wurde: Ambisonics bedient sich aufnahmeseitig praktisch einer dreidimensionalen MS-Technik. Drei "Achten" und eine Kugel in einem virtuellen Punkt im Raum. Ein solches Mirkofon verwendet 4 Nierenkapseln in einer sphärischen Anordnung. Daraus können die exakten "virtuellen" Signal dieser drei "Achten" und einer Kugel in einem Punkt im Raum ermittelt werden. Daraus wiederum kann man jede (!) bliebige koizidente Mikrofonanordnung in drei Dimensionen ableiten. Das geht sogar schon mit der weniger bekannten Doppel-MS-Anordnung, allerdings nur auf horizontaler Ebene.