Ist doch eigentlich recht einfach, wenn man das vergleicht was man hört, mit dem, was man sieht. Es sind ja viel mehr Instrumente zu hören als zu sehen. Also geht es um Overdubbing.
Schlagzeug und Holzbläser ( z.B. die Ethnoflöten am Anfang und Ende) sind zu hören, aber nicht zu sehen. Der Chor steht auf den gleichen Stufen, wo vorher die Blechbläser saßen, vor den gleichen Wänden. Also ist der zeitlich versetzt aufgenommen worden. In der Totalen sieht man ja auch nie Chor und Orchester gleichzeitig. Du hörst eine Celesta, siehst sie aber nicht.
Klicktrack weil Filmmusik, besseres Hören des eigenen Instrumentes oder der Anderen, Anweisungen vom Chef aus dem Aufnahmeraum, Referenztrack, Gehörschutz, ...Da kann man viel spekulieren.
Klicktrack halte ich auch für höchstwahrscheinlich. Anweisung aus dem Aufnahmeraum reicht nicht aus, da müsste es schon einen guten inhaltlichen Grund geben.
Übrigens: Kein Orchester würde so eine Tonaufnahme in einer solchen Konzerthalle machen, und hoffentlich auch kein Toningenieur, kein Komponist und kein Arrangeur. Wofür gibt es denn Studios oder Probensäle? Wie will man den druckvollen Sound mit diesem riesigen Raumanteil dieser Konzerthalle hinbekommen?
Aus dem gleichen Grund, aus dem Bands Inear machen: Besseres Monitoring und Gehörschutz, denke ich. Da die meisten Orchestermusiker angestellt sind, dürfte das auch im Sinne des Arbeitsschutzes sein.
Gehörschutz scheidet aus, dafür werden in Orchestern professionelle Gehörschutze verwendet (z.B. Otoplastiken, genauso wie bei professionellen Bands), aber sicher kein billiger Bosch-Kopfhörer. Wobei man als Musiker natürlich selbst entscheiden kann, was man nimmt. Ich habe als Keyboarder bei solchen Produktionen am liebsten gar nichts im Ohr. Wenn es nicht anders geht, einen einzelnen In-Ear-Stecker locker in einem Ohr - weil man als Musiker im klassischen Orchester
immer die Kollegen hören muss, und zwar idealerweise ohne Technik dazwischen.
Chor und Orchester tragen Auftrittskleidung. Wofür? Die gehörte Musik ist sicher nicht komplett zum Zeitpunkt entstanden, als die Bildaufnahmen waren. Das ist schön zusammengeschnitten. Da steht "Recording Session Footage" im Youtube-Titel, aber die Videoaufnahme zeigt nur Ausschnitte von Szenen, in denen ich eine Tonaufnahme für extrem unwahrscheinlich halte.