24 bit oder 32 bit float

ich habe den zuvor verlinkten Wiki Beitrag zwar gelesen, aber nicht im Detail verstanden...
nur soviel ist mir in Bezug auf digitales Audio (vage) in Erinnerung:
die Auflösung ist in beiden Formaten identisch, weil sie über den Integer-Anteil definiert wird
32 bit float sind auch 'nur' 24 bit Integer plus Exponent (was immer man mit dem anstellen mag...)
das ist Halbwissen - also wer es vervollständigen kann... :D

cheers, Tom
 
die Auflösung ist in beiden Formaten identisch, weil sie über den Integer-Anteil definiert wird
32 bit float sind auch 'nur' 24 bit Integer plus Exponent (was immer man mit dem anstellen mag...)

Na, so einfach kannst du es dir nicht machen. Bei 32 bit Floating Point werden alle Bits genutzt, der Unterschied zu 32 bit Integer ist aber, dass sich die darstellbaren Zahlen anders verteilen. Bei Ganzzahlen ist der Abstand von einer Zahl zur nächsten immer gleich. Bei Fließkommazahlen wird dieser Abstand mit wachsendem Exponenten größer.

Siehe https://en.wikipedia.org/wiki/Audio_bit_depth#Quantization letzter Absatz vor "Audio Processing".
 
sorry, aber wer redet von 32 bit Integer ?
es geht (ausschliesslich) um 24 bit integer versus 32 bit float
die sind was die Darstellung diskreter Werte angeht praktisch identisch
alles andere würde nebenbei Kraut und Rüben beim Austauschen von Daten verursachen
das Fliesskommaformat hat von der Definition her einen grösseren Wertebereich
das impliziert aber nicht, dass der ständig genutzt wird... ;)

cheers, Tom
 
  • Gefällt mir
Reaktionen: 1 Benutzer
Ich bin nicht sicher, ob ich dich richtig verstehe. Meinst du, um der Austauschbarkeit willen würden von 32 bit float nur die 23 bit der Mantisse verwendet? Das kann ich mir beim besten Willen nicht vorstellen.

Was den größeren Wertebereich angeht, halte ich deine Sichtweise für einen Irrtum. Mit einer festen Anzahl Bits kann man auch nur eine feste Anzahl an Werten ausdrücken, ob die nun als ganze Zahlen oder Fließkommazahlen interpretiert werden. Wenn es um Audio geht, ist der größtmögliche Wert einfach 0 dbFS, egal, durch welche Zahl der repräsentiert wird.

Reden wir aneinander vorbei?
 
die dB Skala ist in diesem Zusammenhang nicht hilfreich, weil sie relative Werte verkörpert
bei konkreten Werten ist der Bereich, der sich im Fliesskommasystem darstellen lässt schlicht grösser
(was allgemein bekannt ist und auch gern zu diversen Interpretationen hergenommen wird...)

ich bin mathematisch nicht sattelfest genug um Abhandlungen im Stil des Wiki-Eintrags 100% zu folgen
manche Dinge merke ich mir einfach unter praktischen Aspekten, wie zB den nicht kontinierlichen Wertebereich von float
(das muss ich nicht herleiten können, aber ich es ist auch für mich nachvollziehbar)

letztlich kann man die Sachen drehen und wenden wie man will: der Wandler arbeitet immer mit Ganzzahlen
und selbst bei denen liegt die (reale) physikalische Genauigkeit weit unter der mathematisch möglichen - so what ?

ob da 16 oder 24 bit rein/rausgehen ist imh ears völlig belanglos (in dem hier angesprochenen Kontext)
'meine' DAW fragt da nicht nach - dasselbe Projekt schluckt 16- und 24bit quer durcheinander
beim Ausspielen wird immer das zuletzt verwendete Format vorgeschlagen, ändert man bei Bedarf
mir geht's in erster Linie um den praktischen Aspekt - da gibt es effektiv keinen 'Qualitätsverlust'

ich bin relativ sicher, dass sich mit einer simplen Funktion Fliesskommawerte in ein Integer-Aeqivalent wandeln lassen
den Hinweis auf die identische effektive Auflösung fand ich seinerzeit nachvollziehbar und habe es mir gemerkt
für meinen persönlichen Bedarf reicht das ...
und bei dem Hinweis an den TE, sich keinen Kopp zu machen habe ich ein ruhiges Gewissen
er muss dem Vorschlag ja nicht folgen... :D

cheers, Tom
 
die dB Skala ist in diesem Zusammenhang nicht hilfreich, weil sie relative Werte verkörpert
bei konkreten Werten ist der Bereich, der sich im Fliesskommasystem darstellen lässt schlicht grösser
(was allgemein bekannt ist und auch gern zu diversen Interpretationen hergenommen wird...)

Nein, das ist ein Irrtum, den ich schon versucht habe, zu erklären. Wenn du 0 dBFS nimmst, dann ist das absolut und dieser, höchste Wert ist bei allen Repräsentationen gleich. Stell dir einfach vor, alle Werte würden implizit durch den größtmöglichen geteilt; dabei kommt immer ein Wertebereich von 0 bis 1 heraus. In diesem Sinne sind die ganzen Zahlen eigentlich Festkommazahlen.

Von der Anzahl der Bits, ob nun 8, 16, 24 oder 32 hängt ab, wie viele Zwischenwerte ausgedrückt werden können. Das ist unabhängig davon, ob es um Ganzzahlen oder Fließkomma geht (bei letzteren müssen noch ein paar Sonderfälle wie "keine gültige Zahl" usw. abgezogen werden).

Der interessante Unterschied zwischen ganzen Zahlen und Fließkommazahlen besteht darin, wie der Abstand von aufeinander folgenden Zahlen ist. Bei ganzen Zahlen ist der _immer_ gleich groß, bei Fließkomma wächst der Abstand mit der Größe.

wie zB den nicht kontinierlichen Wertebereich von float
(das muss ich nicht herleiten können, aber ich es ist auch für mich nachvollziehbar)

Fließkommazahlen sind nicht kontinuierlich in dem Sinne, dass die Zwischenwerte zwischen zwei aufeinanderfolgenden Zahlen nicht dargestellt werden können. Das gilt aber für ganze Zahlen ganz genauso, da kann der Zwischenwert zwischen 1 und 2 auch nicht ausgedrückt werden.

ich bin relativ sicher, dass sich mit einer simplen Funktion Fliesskommawerte in ein Integer-Aeqivalent wandeln lassen
den Hinweis auf die identische effektive Auflösung fand ich seinerzeit nachvollziehbar und habe es mir gemerkt

Genau das stimmt nicht. Bedenke, dass mit N Bit, ob Festkomma oder Fließkomma grob die gleiche Anzahl unterschiedlicher Zahlen dargestellt werden kann. Bei kleinen Zahlen sind die aufeinander folgenden Fließkommazahlen dichter beeinander, dafür bei großén Zahlen weiter auseinander. Gerade bei den großen Zahlen muss es daher Festkommazahlen geben, die zwischen zwei aufeinander folgenden Fließkommazahlen liegen. Platt gesagt: Die möglichen Zahlen sind im unteren Bereich schon verbraucht worden, daher sind weiter oben nicht mehr so viele verfügbar.

Daraus folgt auch, dass es bei der Konvertierung zwischen Unterschiedlichen Formaten praktisch immer Verluste gibt, weil nicht alle Werte aus dem einen Formate eine exakte Entsprechung im anderen haben. Ob das klanglich relevant ist, soll jemand anders beurteilen.
 
32bit float kann Werte weit über 0dbfs darstellen. Die 0dbfs Grenze gibt es nur bei den integer Wortbreiten. Das ist ja der entscheidene Vorteil von 32bit oder sogar 64bit float, wie es Studio One intern z.B. kann. Selbst wenn es im Master schon clipped und man dann das Projekt in 32bit float exportiert, kann man einfach die Datei auf 0dbfs normalisieren und hat keine Transienten verloren weil diese in 32bit float noch enthalten sind.
 
Von der Anzahl der Bits, ob nun 8, 16, 24 oder 32 hängt ab, wie viele Zwischenwerte ausgedrückt werden können.
das dürfte wohl für jeden nachvollziehbar sein...
so wie du es beschreibst, scheinst du aber die Sample-Werte direkt zu interpretieren, die berüchtigten Treppen
als leicht mathe-behindert habe ich mir ( nach 2 maligem Lesen des entsprechenden Fachbuchs) einfach gemerkt, dass diese Samples gar nicht wiedergegeben werden, sondern 'Parameter' einer Rekonstruktionsfunktion darstellen
dann sieht das schon ganz anders aus und hört sich vor allem auch anders an

das Frontend digitaler (Audio) Systeme basiert (derzeit standardmässig) auf linearer Quantisierung
was für mich gut zu Ganzzahlen mit ebenfalls immer gleichem Abstand passt
(dem Auflösungsproblem liesse sich algorithmisch eindeutig und zuverlässig begegnen)

das von Novik angeführte Argument ist natürlich verständlich - wird aber über eine (imo) höhere Fehlerträchtigkeit erkauft
in einer idealen Welt existiert keine Software... ;)
es gibt Bereiche in denen die Fliesskomma-Verarbeitung echte Vorteile bringt...
aber alles damit zu machen ist für meinen persönlichen Geschmack eher fragwürdig
es ist aber genau das: mein Geschmack

cheers, Tom
 
Aus dem weiter oben verlinkten Wiki-Artikel habe ich mal den folgenden Satz entnommen:

"A signed 32-bit integer can have a maximum value of 231 − 1 = 2,147,483,647, whereas the maximum representable IEEE 754 floating point value is (1 − 2−24) × 2128 ≈ 3.402823 × 1038."

Da die Summe aus verschiedenen Spuren (+ Effekt-DSP-Wege, Aux-Wege usw.) digital durch Summieren der Pegelwerte gebildet wird, reicht der Zahlenbereich des 32-bit-integer-Formats für "nur" rund 120 Spuren bei Vollaussteuerung jeder Spur aus (z.B. Peak bei 0 dBFs in jeder Spur). Danach folgt selbst hier Clipping. Bei 32-bit float ist der Zahlenbereich so groß, dass Clipping praktisch immer ausgeschlossen werden kann. 0 dBFS entspricht im Prinzip stets dem maximalen Zahlenwert des jeweiligen bit-Formats und diese Grenze wird physisch selbst bei den z.B. 999 maximal möglichen Spuren bei Samplitude nicht erreicht. Deshalb macht es Sinn, intern die DAW mit 32-bit float rechnen zu lassen. Wie jedoch die DAW intern die 0dBFS-Grenze wirklich definiert und welchen Zahlenraum sie gegebenenfalls als Headroom reserviert, teilt sich nicht mit. Bei Samplitude können bei interner 32-bit-float-Berechnung die Spuren sogar sichtbar übersteuert sein ohne dass es am Ausgang hörbar clippen muss - wenn der Master-Fader entsprechend eingestellt ist. Denn für die Ausgabe an den DA-Wandler, die üblicherweise bei max. 24 bit verarbeiten können, muss der Wertebereich von der Software ja wieder an diesen Zahlenbereich angepasst werden.

Das bit-Format und das Quantisierungsrauschen hängen direkt miteinander zusammen. Jedes bit mehr bringt 6 dB mehr an Dynamik. Die so oft zu sehende "Treppe" zur darstellung der Abtsastung ist aber ein irreführendes Bild, denn diese existiert gar nicht. Jeder Samplewert ist ein konkreter Zahlenwert zu einem definierten Zeitpunkt. Bei 44,1 KHz alle 44,1-tausendstel Sekunden (Oversampling mal außen vor gelassen, in der WAV-Datei stimmt es dann aber wieder so).
Nun kann es aber sein, dass dieser Zahlenwert aufgrund der nicht darstellbaren Zwischenwerte bei integeren Zahlen, wie es ein 24-bit Wandler nun mal nur "abzählen" kann, nicht spot on auf der analogen Kurve liegt, sondern knapp daneben (Quantisierungsfehler). Dann wird dieses Signal entsprechend verzerrt und zwar mit einem aufmodulierten rechteckförmigen Signal (Quantisierungsrauschen).
Dieses Rauschen ist nun aber so fein, dass selbst bei 16-bit noch 96 dB Dynamikumfang erreicht werden und bei der so erheblich viel feiner auflösenden 24-bit-Abtastung 144 dB (wobei praktisch im besten Fall wegen der Grenzen im analogen Bereich typischerweise "nur" 120 dB maximal erreicht werden. Jedenfalls liegen bei den 17 Millionen Zahlenwerten des 24-bit-Formats die Samplepunkte generell viel dichter am analogen Signal als bei den "nur" 65 Tausend Zahlenwerten des 16-bit Formats weshalb das Quantisierungsrauschen bei ersterem so viel geringer ist.

Was passiert nun bei "Truncation"?

Als Beispiel habe ich hier mal die Umwandlung eines 5-bit Zahlenraums in einen 4-bit Zahlenraum durch Truncation dargestellt.

Hier zuerst der 5-bit Zahlenraum:

5 bit (2 hoch 5)

31 11111
30 11110
29 11101
28 11100
27 11011
26 11010
25 11001
24 11000
23 10111
22 10110
21 10101
20 10100
19 10011
18 10010
17 10001
16 10000
15 01111
14 01110
13 01101
12 01100
11 01011
10 01010
09 01001
08 01000
07 00111
06 00110
05 00101
04 00100
03 00011
02 00010
01 00001
00 00000

Im übrigen liegt bei der AD-Wandlung der Nulldurchgang des Signals üblicherweise in der Mitte, hier bei 16 (10000).

Nun wird das letzte bit (2 hoch 1, das bit ganz rechts außen) abgeschnitten:

31 1111
30 1111
29 1110
28 1110
27 1101
26 1101
25 1100
24 1100
23 1011
22 1011
21 1010
20 1010
19 1001
18 1001
17 1000
16 1000
15 0111
14 0111
13 0110
12 0110
11 0101
10 0101
09 0100
08 0100
07 0011
06 0011
05 0010
04 0010
03 0001
02 0001
01 0000
00 0000


Wie man sieht, ist nun auf der digitalen Seite jeder Wert doppelt vorhanden, so daß jeder zweite Wert, der nun unsinnig ist, entfällt:

15 1111

14 1110

13 1101

12 1100

11 1011

10 1010

09 1001

08 1000

07 0111

06 0110

05 0101

04 0100

03 0011

02 0010

01 0001

00 0000

Wie man sieht, ist aus dem 5-bit-Raum mit 32 Werten (0-31), der 4-bit-Raum mit nur noch 16 Werten geworden. Der Nulldurchgang liegt immer noch in der Mitte (jetzt 1000) und das ursprünglich mir 32 Werten kodierte Signal wird nun nur noch mit 16 Werten kodiert. Da die Zwischenwerte fehlen ist die Kodierung gröber und das Quantisierungsrauschen wird zunehmen. Aber das Signal selber bleibt erkennbar.


Wenn gleich zwei bit abgeschnitten werden wird der Zahlenraum immer kleiner, hier nur noch 3 bit:

07 111
06 110
05 101
04 100
03 011
02 010
01 001
00 000

Das ursprüngliche Signal ist zwar immer noch rekonstruierbar, aber die Verzerrungen/das Rauschen werden/wird immer größer.


Bei der Umwandlung von 24 bit zu 16 bit gilt es nun, die entstehenden Lücken, die durch den Wegfall der untersten bits entstehen so auf zu füllen, dass das Quantisierungsrauschen bzw. die Verzerrungen minimiert werden. Das ist nun nicht eigentlich ein Verdeckungseffekt, sondern eine Art Rekonstruktion. Indem nun ein leises digitales Rauschen zugefügt wird (Dither), wird erreicht, dass die untersten bits (die vom Pegel des Dithers erfasst werden), quasi zu "Tanzen" anfangen. Damit springen die Zahlenwerte, die ansonsten einfach verloren gegangen wären, auf einen höheren bit-Wert und werden somit erfasst. Dieser höhere bit-Wert ist nach dem Abschneiden der ursprünglich unteren bits (denn es wird immer abgeschnitten, auch bei Dithering) wiederum der unterste bit-Wert. Somit können nicht die untersten Pegelstufen des 24-bit-Formats "gerettet" werden, sondern das Dithering rekonstruiert (mehr oder weniger) alle sonst verloren gehenden Zwischenstufen, denn alle Zahlenwerte haben als Binärzahl "unterste" bist (s.o.).

Auch bei der AD-Wandlung spielt Dither eine Rolle, denn auch hier liegen viele Samplewerte ja minimal neben der analogen Signalkurve. Durch hinzufügen von hochfrequenten Rauschen in Zusammenhang mit Oversampling (hier genügt u.U. sogar schon das vom analogen Eingang kommende unvermeidliche System-Rauschen) wird ebenfalls ein (hochfrequentes) "Tanzen" der untersten bits angeregt das wiederum ein sehr hochfrequentes Quantisierungsrauschen erzeugt. Dieses liegt nun aber über der Hörgrenze von ca. 20 KHz und wird einfach vor der endgültigen Datenerstellung abgeschnitten. So wirkt Rauschen Rausch-vermindernd.

Chapeau vor dieser Ingenieursleistung!

Gruß, Jürgen



P.S.
Das weiter oben zu findende Zitat, wo ich im Zusammenhang mit dem 16-bit-Format von Frequenzumfängen schrieb ist natürlich so geschrieben unsinnig. Richtig muss es heißen, dass 44,1 KHz Samplerate und damit die obere Frequenzgrenze von 20 KHz als Frequenzumfang für uns Menschen genügt. 16 bit bringen mit ihren theoretisch maximalen 96 dB Dynamikumfang wiederum genügend Dynamik mit um jedwege Musik mit ausreichenden Reserven wieder geben zu können.
44.1 KHz/16-bit sind jedenfalls als Endverbraucher-Format mehr als ausreichend.


Nun ist es so, daß das Quantisierungsrauschen bei der AD-Wandlung immer nur in den untersten bits stattfindet (den äußerst rechten bits), denn der Samplewert wird ja immer nur ein klein wenig neben dem originalen Signal liegen (wenn er daneben liegt) und nicht weit entfernt - es wird sozusagen immer der nächst liegende Zahlenwert ausgespuckt.
Das Oversampling führt nun zusätzlich dazu, dass es viel mehr Samplewerte pro Zeiteinheit gibt und beides zusammen, das "Tanzen" und die Vermehrung der Datenwerte,
Nun ist es so, daß das Quantisierungsrauschen bei der AD-Wandlung immer nur in den untersten bits stattfindet (den äußerst rechten bits), denn der Samplewert wird ja immer nur ein klein wenig neben dem originalen Signal liegen (wenn er daneben liegt) und nicht weit entfernt - es wird sozusagen immer der nächst liegende Zahlenwert ausgespuckt.
Das Oversampling führt nun zusätzlich dazu, dass es viel mehr Samplewerte pro Zeiteinheit gibt und beides zusammen, das "Tanzen" und die Vermehrung der Datenwerte,
 
  • Gefällt mir
Reaktionen: 5 Benutzer
32bit float kann Werte weit über 0dbfs darstellen. Die 0dbfs Grenze gibt es nur bei den integer Wortbreiten.

Äh, da bräuchte ich eine ausführlichere Erklärung, denn nach meinem Verständnis kann das nicht stimmen.

0 dbFS ist der Spitzenwert, darüber gibt es nichts mehr. Dast steckt in "Full Scale" drin, wobei es keine Rolle spielt, ob es dabei um ganze (bzw. Festkomma) Zahlen geht oder um Fließkomma. Es gibt eine größte Zahl und die wird als 0 dbFS gesetzt.

Das ist ja der entscheidene Vorteil von 32bit oder sogar 64bit float, wie es Studio One intern z.B. kann. Selbst wenn es im Master schon clipped und man dann das Projekt in 32bit float exportiert, kann man einfach die Datei auf 0dbfs normalisieren und hat keine Transienten verloren weil diese in 32bit float noch enthalten sind.

Bist du ganz sicher, dass du hier 0 dbFS meinst und nicht einen willkürlich von der DAW definierten 0 db-Pegel?

Ich glaube, bei dem Vorgang, den du beschreibst, passiert etwas anderes. Angenommen, du hast mehrere Eingangssignale, die mit N bit kodiert sind. Wenn die einfach summiert werden, überschreiten sie den darstellbaren N bit-Bereich. Es gibt dann mehrere Möglichkeiten, damit umzugehen:

  • Im Master größere Werte ermöglichen, also etwa in 2 x N bit kodieren.
  • "Die Eingangsfader herunter ziehen" - führt zu Verlusten bei der Auflösung.
  • Die Eingangssignale in 2 x N bit umkodieren und dann die Fader herunter ziehen - keine Verluste.
Irgendwas davon macht deine DAW intern.
 
Hallo,

das Argument, 32Bit-Float könne mehr als 0dBFS darstellen, ist ein Scheinargument. Es hängt nämlich rein davon ab, wohin man den "willkürlichen" Wert "0dB" hinsetzt. Üblicherweise bezeichnet "0dBFS" das maximal Mögliche im jeweiligen Zahlenformat, wenn also alle Bits ausgenutzt sind und der Wertevorat des Zahlenformats ausgenutzt sind. (Im 16-Bit-Format liegt "0dBFS" eben bei 2^16, im 24-Bit-Format bei 2^24).
Wenn ich im 24-Bit-Format meine 0dB-Referenz auch auf 2^16 lege, hätte ich im 24-Bit-Format auch die Möglichkeit, Pegel oberhalb 0dB zu speichern.

In der Praxis ist das eh irrelevant. 16 Bit hat um die 96dB Dynamik, 24 Bit hat 144dB (theoretisch, wenn es denn ein Wandler kann...).

Schalldruckpegel von 0dB bezeichnet die Hörschwelle des Gehörs; unterhalb nimmt man Schall nicht mehr wahr.

Ein ruhiges Zimmer hat auch bei Stille einen Störpegel von um die 20-30dB (Heizung, Verkehr, etc..)
Damit man überhaupt die leisesten Stellen einer Aufnahme überhaupt hören kann (um die -90dB bei 16 Bit), müssen diese leisesten Stellen mindestens etwas lauter sein als der Störpegel im Zimmer (von um die 20dB).
Dann wären die lautesten Stellen (0dBFS) schon bei 110dB Schallpegel (bei 16Bit), das ist schon brachial laut und schädigt das Gehör. Von daher sind 16Bit schon völlig ausreichend.

Auch so Argumente, man könne mit höheren Bitauflösungen leise Signale rauschfreier aufnehmen oder "höher" aufgelöst aufnehmen, stimmen nicht.

Acuh ein sehr stilles Studio hat einen Störpegel von um die 10dB Schalldruck, und auch ein Mikro macht einen Rauschpegel, welches bei den Besten einem Geräusch von mindestens um die 10dB entspricht - bei Homerecording-Mikros eher um die 20dB.
Leise Töne von um die 40dB Schallpegel haben also nur eine Dynamik von um die 30dB, denn bei 10dB (oder auch schon bei 20dB) ist ja schon der Noisefloor - egal, welche Bitauflösung man verwendet.
Macht man diese leisen Signale lauter, so verstärkt man auch das Rauschen gleich mit.

Von daher reichen 16 eigentlich auch für die Produktion aus - und ganz besonders im Homerecording-Bereich.

Grüße
 
Ich glaube um die Aufnahme geht es nicht. Auch nicht um das Endergebnis. Aber zwischendurch helfen mehr Bit.

Siehe auch https://xiph.org/~xiphmont/demo/neil-young.html#toc_wd2bm

Theoretisch vieleicht ja, praktisch - vor allem im Homerecording - ohne Belang.
Eine Aufnahme auf einer Spur selber hat ein gewisses "analoges" Grundrauschen, was unabhängig von der Bitbreite ist und vom Mikrofon herrührt. Selbst die besten Mikros machen einen Ersatzgeräuschpegel von um die 10dB (Schallpegel), durchschnittliche Homerecording-Mikros sogar noch etwas mehr, bis um die 20dB.
Die niederwertigsten Bits sind also damit beschäftigt, dieses Rauschen zu kodieren.
Rundungsfehler durch Bearbeitung betreffen nur das niederwertigste Bit, liegen also noch darunter.

Zum anderen werden solche Rundungsfehler (sie machen sich als Rauschen bzw. - wenn schlecht implementiert- als Quantisierungsverzerrungen - bemerkbar) durch das Nutzsignal maskiert, also überdeckt.

Summiert man nun viele Spuren jeweils mit ihrem Vollpegel zusammen, akkumulieren sich solche Störsignale ("analoges" Rauschen von vor dem AD-Wandler, und "digitales" Rauschen aus Rundungsfehlern, und man mag theoretsich etwas Störabstand einbüssen.
Praktisch gibt man seltenst alle Spuren mit Vollpegel auf den Masterbus, und zum anderen ist es praktisch unerheblich, ob man 90dB oder "nur" 70dB Störabstand hat - die Nutzsignale decken es zu. Allenfalls zum Songende, wenn alle Instrumente ausklingen, mag man dann sehr leise vieleicht etwas Störsignale wahrnehmen - vorausgesetzt, man hört laut genug ab.

Praktisch halte ich das für irrelevant. Die Klangqualität geht eher verloren, wenn beim Mastern bis ins Clipping hinein laut gemacht wird.

Aber egal - die üblichen DAWs rechnen intern mit höheren Bitbreiten, weils technisch möglich ist, nichts kostet, und der Klangqualität sicher nicht abträglich ist.
Und auch bequemer beim Mischen ist's auch: Man kann den Masterbus mit 20 oder 30dB übersteuern, den Masterfader entsprechend runterziehen, und alles ist wieder ohne Clipping im grünen Bereich.
Zum Zwischenspeichern von Spuren oder Mixen kann man gerne in 24Bit oder gar 32Bit oder in 16Bit abspeichern, aber ich würde mir darum keinen Kopf machen. Speicherplatz kost heut nix, 24Bit oder 32Bit verschlechtern auch nicht den Klang, aber beruhigen das Gewissen.

Klangqualität entsteht und vergeht aber woanders, in erster Linie schon vor dem Mikro, in zweiter Linie beim Mix. Und erst in letzter Linie bei der heutigen Technik.

Grüße
 
unter rein praktischen Aspekten machen 24 bit bei leisen Mikrofonsignalen durchaus Sinn
ich war früher auch von einem 'pendelnden' letzten bit ausgegangen... wegen theoretisch...

tatsächlich sind das eher 3 bit um die das Grundrauschen pendelt, die 18dB machen sich bemerkbar
(Ausklänge der Akustikgitarre klingen bei 16 bit wie über den Kamm geblasen)
am Rauschen selbst ändert sich bei 24bit nicht viel, aber der ausklingende Ton löst sich klar aus dem Hintergrundgeräusch

da ich hauptsächlich dynamische Mikrofone nutze, ist das für mich ein echtes Thema
ich überlege sogar den garstig teuren Cloudlifter anzuschaffen (anstelle des Triton Audio FetHead)
die damit ausgestatteten Ribbon Mikros haben mich in Aufnahmen sehr angesprochen
speziell in Relation zum AT4081, bei dem das Grundrauschen bei niedrigem Pegel bemängelt wurde
(wobei es sich ansonsten positiv darstellt)
ich nehme an dass ein guter Teil des klareren, 'griffigeren' Tons bei den Cloudlifter Exemplaren auf der Elektronik beruht

in vielen Fällen bleibt man aber interfacetechnisch wegen der miserablen Stromversorgung/Entstörung unter den Möglichkeiten

cheers, Tom
 
tatsächlich sind das eher 3 bit um die das Grundrauschen pendelt, die 18dB machen sich bemerkbar
(Ausklänge der Akustikgitarre klingen bei 16 bit wie über den Kamm geblasen)
am Rauschen selbst ändert sich bei 24bit nicht viel, aber der ausklingende Ton löst sich klar aus dem Hintergrundgeräusch

Hmmm...

Das finde ich interessant.

Hast du womöglich Klangbeispiele, an denen man das festmachen könnte...?
(Was du mit Kamm geblasen meinst, erschliest sich mir jetzt nicht direkt...)

Die theoretischen Überlegungen sind gepostet, wir brauchen die Argumente nicht wiederholen.

Es wäre jetzt dann interessant, das anhand von echten Klangbeispielen nachvollziehen zu können.

Ich habe zur Technik hin ein entspanntes Verhältnis... 16Bit, 24Bit..., egal.

Der Sound entscheidet sich erstmal vor dem Mikro, und dann zweitens über die Mikropostition an oder über der Gitarre: Auf Griffbrett gerichtet, auf Schallloch, auf Korpus, etc.

(Ich nehme eigentlich auch immer in 24Bit auf, aus Gewohnheit, weil es die DAW so standardmässig vorschlägt, weil es dem Klang sicher nicht schaden wird, weil Speicherplatz nix kostet, weil es das Gewissen beruhigt, ...)

Grüße
 
Hallo,

das Argument, 32Bit-Float könne mehr als 0dBFS darstellen, ist ein Scheinargument. Es hängt nämlich rein davon ab, wohin man den "willkürlichen" Wert "0dB" hinsetzt. Üblicherweise bezeichnet "0dBFS" das maximal Mögliche im jeweiligen Zahlenformat, wenn also alle Bits ausgenutzt sind und der Wertevorat des Zahlenformats ausgenutzt sind. (Im 16-Bit-Format liegt "0dBFS" eben bei 2^16, im 24-Bit-Format bei 2^24).
Wenn ich im 24-Bit-Format meine 0dB-Referenz auch auf 2^16 lege, hätte ich im 24-Bit-Format auch die Möglichkeit, Pegel oberhalb 0dB zu speichern.

Im Prinzip verstehe ich deinen Ansatz und rein aus der Sicht der Informatik völlig nachvollziebar und korrekt. 0dbfs bezeichnet den höchst möglichen Zahlenwert im gegebenen Format.
ABER:D

bei digitalem Audio ist der Referenzpunkt nicht der kleinstmögliche Wert, sondern der größtmögliche Wert. Sowohl 16bit als auch 24 bit Vollausschlag in fester Wortbreite erzeugt den selben Gain. Die Dynamik wird also nach unten erweitert.
Da die 0db Marke ja auch unseren Referenzpunkt für 16 und 24bit integer darstellt (denn bei der Wiedergabe über unsere Monitore haben wir ja den Datenstrom am Wandler wieder mit 24bit int.)
Ist diese gleichbedeutend mit 0dbfs bei integer.
Hier hat 32bit float aber eine Sonderstellung. Denn es können Pegel noch sauber dargestellt werden, die höher liegen, als unser Referenzpunkt, solange der Datenstrom in 32bit float bleibt. Der Wertebereich wird also anders Interpretiert als Integer.
 
  • Gefällt mir
Reaktionen: 1 Benutzer
Im Prinzip verstehe ich deinen Ansatz und rein aus der Sicht der Informatik völlig nachvollziebar und korrekt. 0dbfs bezeichnet den höchst möglichen Zahlenwert im gegebenen Format.
ABER:D

bei digitalem Audio ist der Referenzpunkt nicht der kleinstmögliche Wert, sondern der größtmögliche Wert. Sowohl 16bit als auch 24 bit Vollausschlag in fester Wortbreite erzeugt den selben Gain. Die Dynamik wird also nach unten erweitert.

Ja.

Aber. :)
Die Dynamik ist nach unten hin begrenzt. Ganz unten machen Mikros Rauschen, ganz unten machen die Umgebungsgeräusche des Aufnahmeraums Rauschen und Störgeräusche.

Müssen wir eine Tabelle machen...? Wir steuern so aus: (Beispiel)

Schallpegel [dB] dBFS
0 (Hörschwelle) -110
20 (Raumgeräusche -90
und Mikrorauschen)
60 (Zimmerlautstärke -50
Musiksignal)
80 (lauter Schall) -30
100 (echt laut) -10
110 (brachial laut) 0
130 (Schmerzschwelle) +20
140 (jenseit gut und böse) +30

Mit 16bit können wir 96dB Dynamik, also grob 90dB Dynamik erfassen. Also alles vom leisen Mikrorauschen bis "brachial laut".
Der laute Genuß-Lautstärke-Pegel für Musik liegt bei ungefähr 80dB Schallpegel, lauter wird es langsam auf Dauer gehörschädigend und macht auch kein Spaß mehr, weil es das Gehör anstrengt. Und nach einem Konzert mit 110dB mittlerem Schallpegel hat man dann erst mal ein Summen oder Pfeifen im Ohr. ,-)

Macht doch einfach mal ein Experiment:
Ladet in eure DAW einen Pop-Song rein, schneidet ihn in der Mitte auseinander.
Und normalisiert den ersten Teil auf -90dBFS, den zweiten Teil auf 0dBFs.
Und hört dann über diesen Dynamiksprung hinein, und zwar so, dass der Wiedergabepegel so laut ist, dass ihr den auf -90dBFS normalisierten Teil noch gerade so hört....
Und, um 24-Bit-Dynamik auszukosten, normalisiert den ersten Teil auf -120dBFS herab, den zweiten Teil auf 0dBFS. Und hört euch diesen Dynamiksprung an.

Und dann sprechen wir nochmal über Dynamik, Störabstände und dergleichen...

Grüße
 
du hast ja recht, aber du betrachtest das jetzt die ganze Zeit unter dem Aspekt der Aufnahme. Die 32 bit float haben für eine Aufnahme sowieso keine Relevanz.
Es geht um die Weiterverarbeitung innerhalb der DAW.

Du schreibst doch selber genau das, was ich gesagt habe.
Und auch bequemer beim Mischen ist's auch: Man kann den Masterbus mit 20 oder 30dB übersteuern, den Masterfader entsprechend runterziehen, und alles ist wieder ohne Clipping im grünen Bereich.

Mit 32bit float ist man ITB praktisch Übersteuerungsfest

0 dbFS ist der Spitzenwert, darüber gibt es nichts mehr. Dast steckt in "Full Scale" drin, wobei es keine Rolle spielt, ob es dabei um ganze (bzw. Festkomma) Zahlen geht oder um Fließkomma. Es gibt eine größte Zahl und die wird als 0 dbFS gesetzt.
Bist du ganz sicher, dass du hier 0 dbFS meinst und nicht einen willkürlich von der DAW definierten 0 db-Pegel?
Irgendwas davon macht deine DAW intern.
Der Begriff dbFS entstammt nicht der Informatik sondern der Anwendung dieser auf Digitale Systeme, die Pegel mit digitalen Werten beschreiben. Dieser Begriff wurde zu einer Zeit eingeführt, wo Digitale Audiosysteme noch gar nix von Fließkomma gehört haben und wurde rein auf Integer bezogen.
Hier ist die Betrachtung nicht von der mathematischen Seite, sondern von der Seite des Audiosignals. Nämlich der maximal mögliche Pegel bei einer gegebenen Wortbreite. Wärend die unterschiedlichen Festwortbreiten unterschiedliche Spitzenwerte erreichen, verhalten diese sich auf Sicht des digitalen Pegels identisch.

Bei 8bit ist der maximale Wert 255
Bei 16bit ist er 65.535
Bei 24bit ist er 16.777.215
Unterschiedliche Werte aber der selbe digitale Pegel von 0dBFS
mit 32bit float kann diese Barriere sehr weit nach oben durchbrochen werden, womit der Begriff 0dBFS auf 32bit float nicht mehr den selben maximalen Pegel beschreibt. Dieser liegt weit ausserhalb eines noch sinnvollen Bereiches.

Das kannst du selber mal ausprobieren. Blase einen Mix richtig auf so dass du viele dB über 0dbFS bist und exportiere diesen in 32bit float.
importiere diese Datei in einen Audioeditor und belasse sie in 32bit float. Normalisiere auf 0dBFS
 
Grund: Zusammenführung
Zuletzt bearbeitet von einem Moderator:
du hast ja recht, aber du betrachtest das jetzt die ganze Zeit unter dem Aspekt der Aufnahme.

Da hast du recht. Andererseits, irgenwo her müssen ja die Aufnahmen auch herkommen, die man ITB nach bearbeiten möchte.
Und da ist meiner Meinung nach nur so viel Qualität nötig, wie auch die Aufnahmen schon haben.

Große Bitbreiten sind da eher ein "Bequemlichkeitsfaktor". Ist aber nicht klangschädlich und kost auch nix.

Grüße
 

Ähnliche Themen


Unser weiteres Online-Angebot:
Bassic.de · Deejayforum.de · Sequencer.de · Clavio.de · Guitarworld.de · Recording.de

Musiker-Board Logo
Zurück
Oben