Was ich nur nicht verstehe, ist der letzte Satz... Ich dachte immer digitale Signale bestehen aus Waagerechten Strichen zwischen den Samples. Wie sonst käme ich denn auch auf die Idee, dass es Stufen sein könnten? Oder wie meinst du es zwei Punkte mit geraden Strichen zu verbinden?
blau: analoges Signal sowie das rekonstruierte Signal
grün: in fixen, gleichbleibenden Abständen (!) wird abgetastet, die Anzahl der Bits entscheiden nur wie genau (auf der y-Achse) der Punkt den momentanen Wert des analogen Signals trifft => ungenauer heißt einfach nur mehr Rauschen
So zeigen es manche Audioeditoren (fälschlicherweise) an:
rot: Samples mit geraden Linien verbunden
lila: "zero order hold", also der letzte Samplewert wird bis zum nächsten gehalten
Ohne entsprechende Rekonstruktionsfilter sind beide Ansätze schlecht bis unbrauchbar. Das betrifft nicht nur den Frequenzgang, der schon weit vor 20 kHz abfällt, sondern auch nichtlineare Verzerrungen.
Das Argument für 24 Bit Recording war, glaube ich, dass man so nicht nur mehr Dynamik, sondern auch mehr Headroom zur Verfügung hat... Wenn das Eingangssignal allerdings z.B. SNR von 84 dB hat, so bleiben bei 16 Bit Aufnahme immer noch 12 dB für Headroom. Es kommt halt darauf an, welche Dynamik das aufzunehmende Signal hat, bzw. wo dort der Rauschpegel liegt. Und die Sache mit dem Orchester wurde auch noch nicht geklärt. Ich hatte mal gelesen, dass da bis zu 120 dB kommen können. Wenn es Mikrofone gibt, die das alles auch erfassen können, dann wären 24 Bit Wandler schon sinnvoll. Bzw. effektiv 21 Bit: 20 Bit für die eigentliche Dynamik des Orchesters (120 dB) plus 1 Bit (= weitere 6 dB) für Headroom, falls es doch in einem der Peaks bis zu 126 dB sein sollten

). Ich selber mache allerdings keine Orchester-Aufnahmen, sondern benutze fertige Samples, und da reichen mir für meine Zwecke auch 16 Bit Samples.

Wenn sie aber ursprünglich mit höherer Auflösung bzw. Bittiefe aufgenommen wurden - um so besser!

Was aber z.B. gar nicht geht, sind
Samples im MP3-Format.
Ja, der Headroom hängt aber von der Performance des Wandlers ab. Wenn dieser effektiv 20 Bits schafft ist es egal ob 24, 32 oder 64 drauf steht.
Dynamik in einem Konzertsaal liegt im Bereich von ungefähr max. 80 dB. Sicher kann es laut werden (110 dB
SPL), aber das "Grundrauschen" (30 dB SPL) ist nicht zu vernachlässigen. (Quelle: Handbook of Recording Engineering - John Eargle)
Sicher ist ein 24 Bit Wandler zur Aufnahme sinnvoll. So hat man mehr Spielraum und Sicherheit sowohl nach oben als auch nach unten.
Melody, zulu: ich habe es extra betont, das kann manchmal mehr, manchmal weniger ausfallen. Und ja, es ist Verzerrung - aber so gesehen sind alle Obertöne an sich Verzerungen bzw. tragen dazu bei. Das macht ja die Tonfarbe eines Instruments überhaupt aus.
Die Rolle der Obertöne braucht man wohl nicht diskutieren, jeder der ein akustisches Instrument spielt, kann es nachvollziehen. Das Beispiel mit Bässen habe ich nur zur Erklärung genommen - verzerrt oder nicht, man hört es, das ist der Punkt. Anderes Beispiel, nimm mal einer Bandaufnahme oder auch nur einem Bass alles weg jenseits von 18 KHz (für die Mehrheit bereits Ultraschall) und schau wie sich der Sound verändert - Ultraschall oder nicht, man hört es in der gefühlten "Fülle" und Färbung, Details werden verwischt etc. Hat nichts mit Audiophilen zu tun, kannst selber mit einer Gitarre oder Bass und einem EQ nachvollziehen. Oder sample mal eine CD runter auf 30 KHz und hör es dir an. Oder vergleiche deine eigene Aufnahmen mit 44.1/16 und 96/24...
Ja, man hört die Obertöne im Bereich der hörbaren Frequenzen.
Wenn du auf einer Orgel den höchsten Ton spielst, dann entspricht das ca. 3.5 kHz. Bei einer Violine ist der Grundton viel niedriger, aber die Obertöne reichen hier bis ca. 16 kHz.
Darüberhinaus mag zwar noch ein bisschen Energie in noch höheren Obertönen sein, aber diese werden alleine schon aufgrund der geringen Lautstärke maskiert. Das ist noch
ohne Berücksichtigung der Hörgrenze von ca. 20 kHz (eher niedriger bei Erwachsenen) bzw. der steigenden Unempfindlichkeit mit höheren Frequenzen.
Was das "abschneiden" von Frequenzen betrifft: Beim Resamplen auf 30 (eher 32) kHz wurde sehr wahrscheinlich ein linearphasiger Filter verwendet. Da dieser unter 16 kHz abschneiden muss, ist das Pre-Ringing klar im hörbaren Bereich.
Bei 18 kHz wird es schon schwieriger aber nicht unmöglich den Filter zu hören.
Was den Vergleich betrifft: probier es doch selbst eine 96/24 Datei ordentlich auf 44.1/16 zu resamplen, dann wieder auf 96/24 und die Datei dann mit dem Original zu vergleichen (am besten mit ABX Software).