Fragen zu DAC, Oversampling und Aliasing

+A -A
Autor
Beitrag
oldpasha
Ist häufiger hier
#1 erstellt: 26. Okt 2018, 06:31
Ich versuche halbwegs zu verstehen, warum Oversampling/Resampling in einem DAC bzw. CD-Player klangtechnisch von Vorteil ist. Während das Jitter-Problem klar ist, habe ich mit dem Aliasing so meine Probleme. Leider habe ich unzählige Artikel gelesen, die meine Verständnislücken nicht wirklich schließen - liegt wohl an meinem mangelnden Wissen über Mathe und Physik :-)

1) Offensichtlich ist OS/RS ein Mittel, um Aliasing im Nutzsignal zu eliminieren, welches durch Sampling von Frequenzen oberhalb der Nyquist-Grenze entstehen. Ich verstehe jedoch nicht wie es zum Bedarf der Vermeidung von Aliasing kommt. Normalerweise müsste Oversampling oder ein Eingangsfilter während der Aufnahme die Sache doch beenden, oder? Gut, früher gabs diese Möglichkeiten wohl nicht. Betrifft das Aliasing-Problem also nur ältere Aufnahmen? Oder passiert da im Lesegerät noch etwas, das Aliasing unterhalb der 22,05KHz-Grenze erzeugt?

2) Aliasing erzeugt zusätzliche Fequenzen durch eine „Missinterpretation“ der gesampelten Werte. Mir hilft insbesondere die Grafik auf http://www.realhd-audio.com/?p=2983. So werden dort also zu einem 7KHz-Ton bei einer Sampling-Rate von 10KHz zusätzliche Frequenzen von 3 und 13 KHz erzeugt. Die 13 KHz würde man rausfiltern, die 3KHz sind doof. Aber wieso entstehen bei der DA-Konvertierung die 3 Frequenzen gleichzeitig? Muss der DAC sich nicht für die Rekonstruktion einer der drei Wellenformen entscheiden, um den passenden Strom dazu zu erzeugen? Entscheidet er sich pro Sample neu, sodass der Eindruck von 3 gleichzeitigen Frequenzen entsteht? Und wenn ja, nach welchen Kriterien fällt die Entscheidung?

3) Wie kann das Erzeugen von Zwischensamples, wie sie beim OS/RS entstehen, nachträglich das Aliasing weiter vom Nutzsignal entfernen? Nehmen wir an, die ersten Beiden Sample-Points 1 und 2 existieren bei einem 44.1KHz Sampling, womit unklar wäre, ob die Frequenz dazwischen 7, 3 oder 13 KHz repräsentiert. Wie will man den Sample-Point für 88.2KHz dazwischen bestimmen? Der läge für die grüne Linie in der Mitte, für die blaue Linie (13MHz) am oberen Scheitelpunkt und für die rote Linie nahe des unteren. Zwei der Entscheidungen wären falsch und würden das ungewünschte Signal beschreiben. Aber wie will der DSP das entscheiden? Und falls er sich richtig (für die 7 KHz-Kurve) entscheidet, habe ich es dann richtig verstanden, dass dann das zusätzliche Sample zwischen 1 und 2 dazu dient, die Interpretation als tiefes 3KHz-Signal zu unterbinden (durch das zusätzliche Sample wäre die „Fehlinterpretation“ als niederfrequente Schwingung nun ja unmöglich) und stattdessen nur noch die Vermutung einer hohen Frequenz zwischen 1 und 2 zuzulassen?

4) Für viele (auch für mich) klingt ein gut oversampletes 24/96Khz-Signal etwas wärmer und breiter als das 16/44-Format. Wie kann das entstehen, wenn bspw. das Aliasing nur die Frequenzen um die 22Khz verschont? Der großzügige Filter müsste doch somit eher die fast unhörbaren hellen Frequenzen durchlassen, sodass der Ton allenfalls deutlicher (heller, steriler, kälter) und nicht wärmer werden müsste…

Würde mich sehr über Erläuterungen freuen.
Passat
Inventar
#2 erstellt: 26. Okt 2018, 09:55
Oversampling wird gemacht, damit die Filter, um die Aliasingkomponenten zu filtern, keine so hohe Flankensteilheit haben muß.

Bei 2-fachem Oversampling haben die Aliasingkomponenten die doppelte Frequenz im Vergleich zu ohne Oversampling.
Der Filter muß also nur noch die halbe Flankensteilheit haben.
Braucht man z.B. ohne Oversampling einen Filter mit 96 dB/Oktave, so braucht man bei 2-fachem Oversampling nur noch einen Filter mit 48 dB/Oktave.
Flacherer Filter = weniger Phasenprobleme, weniger Bauteileaufwand, etc.

Die Aliasingkomponenten entstehen nicht bei der A/D-Wandelung sondern bei der D/A-Wandelung.
Das Nutzsignal wird an der halben Abtastfrequenz gespiegelt.

Ein Signal mit 20 kHz taucht also bei einer Abtastfrequenz von 44,1 kHz auch bei 24,2 kHz auf.
Ein einem Signal mit 1000 Hz taucht auch bei 43,2 kHz auf.
etc.

Das sind die Aliasingkomponenten.
Und die müssen herausgefiltert werden.

Grüße
Roman
oldpasha
Ist häufiger hier
#3 erstellt: 26. Okt 2018, 11:07
Vielen Dank, Roman. Das entspricht ziemlich den Darstellungen, die ich im Netz über Aliasing gefunden habe. Leider hören die Darstellungen auf dieser Ebene immer auf (oder verfangen sich in sehr vielen mathematischen Formeln) - und ich wüsste gerne grob WIE das im DAC technisch vonstatten geht. Der Sinn der Filterungen ist mir weitestgehend klar. Aber WARUM entsteht ein Spiegelsignal parallel zum gewünschten Ton, obwohl der DAC aus den binären Samples doch nur eine von beiden Frequenzen herausinterpretieren kann/muss? WIESO haben die Aliasing-Komponenten plötzlich eine weit höhereFrequenz, obwohl das binäre Signal nur vervollständigt wird (und somit nicht präziser werden kann)? Die doppelte Abtastfrequenz erhöht doch auch nicht die Frequenzen des Nutzsignals...

FG!
Buschel
Inventar
#4 erstellt: 26. Okt 2018, 21:41
oldpasha, ohne Mathematik kommst du dem Verständnis nicht wirklich näher. Die Zusammenhänge erschließen sich dir, wenn du dich mit z-Transformation und der Äquivalenz von Zeit- und Frequenzbereich auseinandersetzt und verstehst. Ansonsten ist der Sachverhalt meiner Erfahrung nach schwierig zu vermitteln.

Praktischer Ansatz: Mache dir mal die Mühe und simuliere die Abtastung eines 22 kHz, 26 kHz und 70 kHz Sinus mit einer Abtastfrequenz von 48 kHz. Das lässt sich einfach per Excel oder ein wenig Programmierung erledigen. Dann vergleiche mal die Ergebnisse. Du wirst sehen, dass sich derselbe Verlauf ergibt, d.h. ein solches abgetastetes Signal beschreibt de-facto alle Signale mit diesen Frequenzen gleichzeitig (und noch unendlich viele mehr). Sie sind nicht voneinander unterscheidbar. Wenn ein DAC jetzt dieses mathematische Konstrukt wieder in die reale Welt (einen zeitkontinuierlichen Spannungsverlauf) übersetzt, entstehen alle diese Spektralanteile wieder gleichzeitig.

Bei einem 2-fach Oversampling berechnet ein Filter Zwischenwerte derart, als ob das Signal mit 2-facher Abtastrate abgetastet worden wäre. In Bezug auf das praktische Beispiel von oben sind dann erst wieder Abtastungen von 96-22 kHz und 96+22 kHz mit der Abtastung von 22 kHz identisch. Das Signal repräsentiert jetzt also nur noch diese Anteile gleichzeitig -- die vorher ebenfalls enthaltenen 26 kHz und 70 kHz entfallen.
oldpasha
Ist häufiger hier
#5 erstellt: 27. Okt 2018, 14:51
[quote="Buschel (Beitrag #4)"]Du wirst sehen, dass sich derselbe Verlauf ergibt, d.h. ein solches abgetastetes Signal beschreibt de-facto alle Signale mit diesen Frequenzen [u]gleichzeitig[/u] (und noch unendlich viele mehr). Sie sind nicht voneinander unterscheidbar. [/quote]

OK, denn die Abtastpunkte wären für alle drei Frequenzen identisch. Soweit verstanden.

[quote="Buschel (Beitrag #4)"Wenn ein DAC jetzt dieses mathematische Konstrukt wieder in die reale Welt (einen zeitkontinuierlichen Spannungsverlauf) übersetzt, entstehen alle diese Spektralanteile wieder gleichzeitig.[/quote]

Genau da liegt wohl das Ende meiner Vorstellungskraft. Ja, die erfassten Samples [u]passen[/u] zu drei möglichen Frequenzkurven gleichzeitig (ich weiß, in Wahrheit sind es unendlich viele). Wieso aber [u]entstehen[/u] diese drei während der Reproduktion auch wieder? Der DAC kann doch zum Zeitpunkt X nur [ul]eine[/ul] der drei möglichen Kurven in Spannung übersetzen - und nicht drei verschiedenen Kurven gleichzeitig folgen, oder?
Buschel
Inventar
#6 erstellt: 27. Okt 2018, 15:06
Das ist genau das Schwierige. Diese eine Kurve enthält eben alle Frequenzanteile. Je nach Umsetzung als Oversampling- oder NOS-DAC werden Teilbereiche des Spektrums abhängig vom benutzten Digitalfilter unterdrückt.
oldpasha
Ist häufiger hier
#7 erstellt: 29. Okt 2018, 17:24
Sorry, aber ich muss da nochmal nachhaken: Was meinst Du mit "diese eine Kurve"? Es sind doch gemäß vorhandenen Samples drei (bzw. n) verschiedene Kurven möglich. Jede entspricht einer anderen Output-Frequenz. Wenn der DAC also bspw. die 22KHz-Welle wiedergibt - dann entsteht exakt zeitgleich eine 26KHz-Welle?
Buschel
Inventar
#8 erstellt: 29. Okt 2018, 17:30
Ja.
Burkie
Inventar
#9 erstellt: 08. Nov 2018, 20:24
Hallo,

der "theoretische" DAC gibt keine "Kurve" aus, sondern nur Nadel-Impulse, die dem Samplewert entsprechen.

Eine solche "Nadel-Impuls-Kurve" ist mathematisch die Summe (Überlagerung) des (Sinus-) Grundtons mit allen Obertönen.
Grundton ist die Sinus-Kurve, die man erhält, wenn man die Spitzen (Scheitelpunkte) der Nadelimpulse "auf kürzestem Wege" mit einer Sinus-Kurve verbindet.
Das ist aber eine Sinus-Kurve, noch keine "Nadel-Impuls-Kurve".
Der erste Oberton ist dann diejenige Sinus-Kurve, die alle Spitzen verbindet, aber jeweils noch eine Schwingung dazwischen "malt".
Und entsprechend für alle weiteren Obertöne.
Wenn man alle diese Sinus-Kurven (Grundton plus alle Obertöne) zusammen addiert, erhält man wieder die ursprüngliche Nadel-Impuls-Kurve des DACs.

Deswegen erzeugt der "theoretische" DAC mit seiner Nadel-Impuls-Folge die Grundfrequenz plus alle Obertöne bis hin zu unendlich hoher Frequenz.

Durch das Rekonstruktionsfilter (Entfernung des Aliasing) werden diese Impulse quasi durch eine (interpolierende) Kurve verbunden. Sodass dann nur noch die Frequenzen des Audio-Signals (Grundton) übrig bleiben.

Theoretisch könnte man die ganze "Hochfrequenz" (Spiegelfrequenzen) auch drin lassen.
Theoretisch hätte man dann aber Hochfrequenz bis hin zu unendlich hohen Frequenzen. Praktisch natürlich nicht, aber vielleicht bis in den 100 kHz-Bereich.

Verstärker sind eigentlich nicht dafür ausgelegt, mit solchen Hochfrequenzen umzugehen - sie könnten auch im hörbaren Bereich verzerren, oder zum Schwingen angeregt werden.
Lautsprecher-Hochtöner würden durch die Hochfrequenz, wenn sie nicht der Verstärker "irgendwie" rausfiltert, zerschossen werden.

Hinzu kommen "Intermodulationsverzerrungen": Wegen unausweglicher geringer Nichtlinearitäten in Verstärkern und Boxen, entstehen Summen- und Differenz-Produkte der beteiligten Frequenzen. Die Differenzen-Produkte lägen dann teilweise im hörbaren Bereich und erhöhten die hörbaren Verzerrungen.


Praktisch geben DACs auch nicht direkt Nadelimpulse, deren Höhen den Samplewerten entsprechen, aus, sondern eher die berüchtigte "Treppenstufen-Kurve". Die hat wegen der scharfen "Knicke" an den Stufen zwar auch noch Hochfrequenz, aber nicht soviel wie eine Nadelimpuls-Folge.
Das gibt man auf ein Tiefpass-Filter, und es entsteht die ursprüngliche analoge Kurvenform (in sehr hoher Genauigkeit).

Rekonstruktionsfilter sind in der Praxis im DAC integriert, und das wird in der Praxis auch nicht unbedingt mit Treppenstufen und Tiefpassfilter gemacht, sondern mit nur 1 Bit als Sigma-Delta-Wandler.

Wichtig ist nur, das eben nur Audio-Signal ohne Hochfrequenzanteile ausgegeben wird.

Gruss


[Beitrag von Burkie am 08. Nov 2018, 21:13 bearbeitet]
Burkie
Inventar
#10 erstellt: 08. Nov 2018, 20:58

oldpasha (Beitrag #1) schrieb:

2) Aliasing erzeugt zusätzliche Fequenzen durch eine „Missinterpretation“ der gesampelten Werte. Mir hilft insbesondere die Grafik auf http://www.realhd-audio.com/?p=2983. So werden dort also zu einem 7KHz-Ton bei einer Sampling-Rate von 10KHz zusätzliche Frequenzen von 3 und 13 KHz erzeugt. Die 13 KHz würde man rausfiltern, die 3KHz sind doof. Aber wieso entstehen bei der DA-Konvertierung die 3 Frequenzen gleichzeitig?



Diese Grafik verdeutlicht das Aliasing-Problem beim "Unterabtasten" des Audio-Signals.
Ist die Sampling-Frequenz bei der Aufnahme zu niedrig, so ergeben die Sample-Werte für den 7 kHz-Ton die gleichen, wie für einen 3 kHz-Ton.


Das andere "Problem" betrifft die Rückverwandlung ins analoge.
Dazu habe ich ja bereits etwas geschrieben.


Wirklich schlüssig und vor allen Dingen genau und exakt, lässt sich das eigentlich nur mit Mathematik erklären.

Da dir Mathematik aber nicht so liegt, habe ich versucht, eine anschauliche Darstellung zu wählen, die hoffentlich das wesentliche beschreibt und plausibel macht. Gewisse Feinheiten an Exaktheit habe ich geopfert, um die Darstellung einfach verständlich und anschaulich zu halten.

Gruss
SteffDA
Ist häufiger hier
#11 erstellt: 10. Nov 2018, 23:35
@oldpasha
"So werden dort also zu einem 7KHz-Ton bei einer Sampling-Rate von 10KHz zusätzliche Frequenzen von 3 und 13 KHz erzeugt. Die 13 KHz würde man rausfiltern, die 3KHz sind doof. Aber wieso entstehen bei der DA-Konvertierung die 3 Frequenzen gleichzeitig?"

Beim Abtasten ensteht ein periodisches Spektrum mit der Summden- bzw. Differenzfrequenz aus Abtastfrequenz und Signalfrequenz.
In deinem Beispiel 3kHz = 10kHz - 7kHz bzw. 17kHz = 10kHz + 7kHz für das 7kHz-Signal.

Das wiederholt sich für jede Oberwelle der Abtastfrequenz (die ist id.R. ein Rechtecksignal mit schmalen Impulsen, so dass im Spektrum bei der Grundfrequenz, hier 10kHz, und deren ganzzahligen Vielfachen ein Signal auftritt, also bei 20kHz, 30kHz...).
Um diese ganzzahligen Vielfache treten ebenfalls die Summen- und Differenzanteile auf.
Also bei 13kHz = 20kHz - 7kHz, 27kHz = 20kHz + 7kHz, 23kHz = 30kHz -7kHz, 37kHz = 30kHz + 7kHz usw..
Deshalb ein periodisches Spektrum.

Wenn ein abgetastetes Signal wieder rekonstruiert werden soll, so muss man sehen, dass sich die Anteile im Spektrum nicht überschneiden (insbesondere, wenn nicht eine einzelne Signalfrequenz, sondern ein Frequenzband verarbeitet wird). Überschneiden sie sich, kommt es zu Störungen.

Daraus ergibt sich, dass die Abtastfrequenz mindestens doppelt so groß sein muß wie die höchste Signalfrequenz.

In deinem Beispiel tritt keine Störung auf, da es genau eine Signalfrequenz von 7kHz gibt.
Bei einem Frequenzband von z.B. 1kHz - 7kHz würde das Spektrum aber so aussehen:
Unteres Frequenzband: 3kHz - 9kHz (10kHz - 7kHz b zw. 10kHz - 1kHz).
Oberes Frequenzband: 11kHz - 17kHz (10kHz - 1kHz bzw. 10kHz + 7kHz).
Analog für alle ganzzahligen Vielfachen der Abtastfrequenz.

Hier würde sich das originale Signal mit dem unteren Frequenzband im Bereich 3kHz - 7kHz überschneiden, was zu Störungen bei der Rekonstruktion führen würde.

Bei einer Abtastfrequenz von min. 14khz würde das Problem nicht mehr auftreten:
Originales Frequenzband: 1kHz - 7kHz
Unteres Frequenzband: 7kHz - 13kHz (14kHz - 7kHz b zw. 14kHz - 1kHz).
Oberes Frequenzband: 15kHz - 21kHz (14kHz - 1kHz bzw. 14kHz + 7kHz).
In der Praxis nimmt man etwas höhere Abtsatfrequenzen als genau die doppelte höchste Signalfrequenz, um noch einen Abstand
zwischen der maximalen Signalfrequenz und der kleinsten Frequenz des unteren Frequenzbandes zu haben.

Die Signalrekonstruktion erfolgt mit einem Tiefpassfilter, welches das origanale Frequenzband von den anderen trennt.
Da es keine idealen Filter gibt braucht man o.g. Abstand zwischen der maximalen Signalfrequenz und der kleinsten Frequenz des unteren Frequenzbandes.

Je größer dieser Abstand gewählt wird (durch Auswahl der Abtastfrequenz) um so einfacher können diese Filter sein. Das führt dann zur Überabtastung (Oversampling), bei der die Abtastfrequenz deutlich größer ist als die doppelte max. Signalfrequenz.


[Beitrag von SteffDA am 10. Nov 2018, 23:36 bearbeitet]
trompet
Ist häufiger hier
#12 erstellt: 14. Nov 2018, 22:49
Super, viel gelernt in diesem Thread.
Danke für die Frage - und die Antworten!
Suche:
Das könnte Dich auch interessieren:
Sony CDP110 PCM54HP Oversampling
rayy am 30.05.2013  –  Letzte Antwort am 10.06.2013  –  10 Beiträge
Fragen zu DAC
fritz12345 am 17.10.2012  –  Letzte Antwort am 18.10.2012  –  6 Beiträge
Erklärungsbedarf Upsampling/Oversampling
el`Ol am 05.05.2009  –  Letzte Antwort am 19.05.2009  –  6 Beiträge
DA-Wandler ohne Oversampling
Wurmholz am 02.10.2010  –  Letzte Antwort am 07.10.2010  –  29 Beiträge
CD-Player ohne SAA7220 = kein Oversampling
HorstS am 14.09.2012  –  Letzte Antwort am 18.09.2012  –  5 Beiträge
DAC & AppleTV oder Netzwerkplayer mit integriertem DAC?
IFeelCream am 21.04.2012  –  Letzte Antwort am 23.04.2012  –  4 Beiträge
Nagra DAC
sakana am 25.11.2010  –  Letzte Antwort am 01.12.2010  –  3 Beiträge
Cambridge Dac Magic Plus ?
-A320- am 08.11.2011  –  Letzte Antwort am 04.02.2013  –  48 Beiträge
Qualität älterer DAC´s
Franco74 am 11.01.2014  –  Letzte Antwort am 12.01.2014  –  6 Beiträge
Wireless DAC
Ralph_P am 02.02.2013  –  Letzte Antwort am 03.02.2013  –  3 Beiträge
Foren Archiv
2018

Anzeige

Produkte in diesem Thread Widget schließen

Aktuelle Aktion

Partner Widget schließen

  • beyerdynamic Logo
  • DALI Logo
  • SAMSUNG Logo
  • TCL Logo

Forumsstatistik Widget schließen

  • Registrierte Mitglieder927.369 ( Heute: 2 )
  • Neuestes MitgliedMazury89
  • Gesamtzahl an Themen1.555.485
  • Gesamtzahl an Beiträgen21.638.620

Hersteller in diesem Thread Widget schließen