Diese Schritt-für-Schritt-Anleitung für die Android App Room Acoustics Meter, genauer zum Lesen von Frequenzgang, Phase, Impulsantwort und verwandten Größen soll einen Einstieg in das Gebiet ermöglichen. Wie bei jeder einfachen Anleitung zu einem komplexen Thema lassen sich manchmal Gegenbeispiele erdenken. Ziel ist, zu helfen bei Messungen eines typischen Wohnraums überhaupt erstmal "den Fuß in die Tür zu bekommen". Für kleinere Räume wie beim Car Hifi oder größere Räume wie Veranstaltungshallen gelten die hier vorausgesetzten Bedingungen nicht. Am Ende werden zur Veranschaulichung einige Messkurven von privaten Wohnräumen interpretiert.

Anleitung zur Durchführung der Messung

YouTube.com: 1. Room Acoustics Meter: Intro + Messung

Voraussetzung der folgenden Abschnitte ist, dass die Daten von einer korrekt ausgeführten Messung stammen. Vor Beginn der Messung sollten wiederum die elementaren Regeln zur Aufstellung von Lautsprechern berücksichtigt worden sein.

Hifi-Apps führen schrittweise durch die Messung. Entscheidbar ist, mit wie vielen Mikrofonpositionen gemessen werden soll. In einem durchschnittlichen Wohnzimmer, bei dem die Hörplätzen nicht mehr als 2 m auseinander liegen, geben zwei oder drei Messungen oft schon einen Überblick, welche Maßnahmen sinnvoll sind. Das Mikrofon sollte sich dort befinden, wo sonst die Ohren der Hörer sind.

Was wird durch mehr Messungen besser?

Wenn möglich, sollten mehrere Aufstellungen der Lautsprecher und Hörpositionen vergleichen werden. Pro Aufstellung sollten wieder mindestens 2 bis 3 Messungen erfolgen. Manchmal entstehen schon durch Änderungen im Bereich von 50 cm deutliche Verbesserungen.

Ein besserer, aber auch aufwändigerer Weg ist eine sog. Schallfeldmessung: Statt innerhalb einer Messung über benachbarte Frequenzen runden (Glättung) werden mehrere (über 10) Messungen in einem Bereich von vielleicht 50 cm gemacht und die (weniger stark gerundeten) Frequenzgänge gemeinsam interpretiert. Das Ergebnis wird die Ergebnisse anderer Messungen sicher nicht umwerfen, liefert aber zusätzliche Präzision für den Feinabgleich eines Soundprozessors oder Equalizers.

Mehr Mikrofonpositionen präzisieren naturgemäß das Ergebnis, wenn es sich um weitere Hörplätze handelt. Für die Wertung des Hörerlebnisses wird im Allgemeinen nur an (potenziellen) Hörplätzen gemessen. Messungen an anderen Mikrofonpositionen haben einen indirekten Nutzen: Bei mehr Interesse kann auch eine komplette Matrix des Raums, z.B. in Ohrhöhe mit 1x1 m Rasterung, aufgenommen werden. Auf diese Weise erhält man ein tieferes Verständnis über das gesamte Wellenfeld im Raum und kann Dämmmaßnahmen und die Positionierung von Schallquellen und Hörplätzen gezielt planen.

Hifi-Apps sind so geschrieben, dass mit wenig Aufwand auch sehr viele Messungen gemacht werden können: Zwischenspeichern und die Bestimmung der Mikrofonposition sind automatisiert. Die Android-Geräte können leicht im Raum umhergetragen werden, da die externe Stromversorgung ebenso wie das externe Audio-Interface entfällt.

Beim Start der App erscheint der Hinweis, das Android Gerät möglichst über Kabel mit dem Wiedergabesystem zu verbinden. Praktische Erfahrungen für verschiedene Verbindungstypen:

Bluetooth: Man darf nicht alle Protokolle und -Geräte über einen Kamm scheren. Es kommt aber vor, dass Frequenzen ab ca. 4 kHz bei der Messung verloren gehen. Dann bitte nicht der "... kann man ja eigentlich trotzdem noch benutzen" Versuchung nachgeben.
Klinkenstecker: Funktioniert gut, allerdings werden bei manchen Geräten sehr hohe und sehr tiefe Frequenzen weggefiltert, siehe hier. Der Tiefbassbereich unter 40 Hz kann dadurch verfälscht werden, die Anpassung von Subwoofern funktioniert in der Praxis aber problemlos.
USB: Die beste Lösung. Bei USB C kann (je nach Gerät) auch das analoge Kopfhörersignal über diesen Stecker ausgegeben werden. Wo der D/A Wandler sitzt, ist also konfigurationsabhängig, die Messergebnisse hängen aber nicht signifikant vom verwendeten Wandler ab. Vorsicht: Manche Geräte schalten nicht zuverlässig auf die externe Quelle um. Zu Beginn der Messung wird ein Mikrofon Test zusammen mit der Möglichkeit Input und Output explizit festzulegen angeboten. Wenn ein Messmikrofon verwendet wird, sollte dieser Schritt nicht übersprungen werden! Die Anzeige sollte deutlich ausschlagen, wenn man mit dem Finger auf den Korb des Mikrofons tippt. Andernfalls ist möglicherweise noch das interne Mikrofon in Betrieb.

Anfangs kann auch ohne Messmikrofon gearbeitet werden, mehr dazu hier. Diese Einführung geht davon aus, dass die Messung mit einem Mikrofon mit Kugelcharakteristik erfolgte. Das ist hat sich etabliert, weil verschiedene Messungen andernfalls kaum vergleichbar wären. Für Interessierte spricht natürlich nichts dagegen, trotzdem z.B. mit sog. 3D-Messverfahren zu experimentieren [Protheroe 2013]: Für die App spielt es keine Rolle, woher die Daten kommen. Grundsätzlich ist Richtungsinformation in der Praxis natürlich nützlich: Die Suche störender Reflexionen kann und sollte durch Klatschen und (Richtungs-)Hören (siehe unten) unterstützt werden.

In den folgenden Schritten führt die App dialogbasiert bis zum Start der Messung. Der verwendete Farina-Algorithmus ist relativ unempfindlich gegen Umgebungsgeräusche während der Messung. Er wird in der Praxis sogar kurz vor Konzertbeginn mit wartendem Publikum eingesetzt. Trotzdem ist es eine gute Idee, ggf. laut mit klappernde Gegenstände bei dieser Gelegenheit unter Kontrolle zu bringen und die Messung zu wiederholen.

Die Messung muss bei moderater Lautstärke erfolgen: Das Messsignal belastet Ohren und Lautsprecher erheblich mehr als Musik der gleichen Lautstärke. Manche professionelle Akustiker tragen grundsätzliche bei jeder Messung einen Gehörschutz.

Setup Einstellungen (für Fortgeschrittene)

Im Setup Menü kann die Dauer des Logsweeps und dessen Grenzfrequenzen eingestellt werden. Da der Sweep aus technischen Gründen langsam ein- und ausgeblendet wird (Blackman windowing 0.05 s leadin, 0.005 s leadout), ist der später verwendbare Frequenzbereich etwas schmaler. 20 Hz als Start sind ausreichend, um Resonanzen in Räumen bis 8 m Länge zu finden. Die obere Grenzfrequenz hilft bei verschiedenen Längenmessungen aus der Schall Laufzeit, 20 kHz sind in der Praxis bewährt. Ob der Lautsprecher laut Hersteller einen größeren Frequenzbereich abdeckt, spielt für den wichtigen Teil der Messwerte keine Rolle.

Die Dauer bestimmt die Präzision der Messung. Sie sollte so lang sein, dass störende Raumresonanzen die Chance haben sich aufzuschwingen und damit in den Ergebnissen gefunden werden können. Um eine Raumresonanz anzuregen, muss der Sweep lange genug in ihrem Frequenzbereich sein. Ein guter Anfang sind 2 Sekunden. Beispiel für Techniker: Für eine Raummode mit 300 ms rise time und 1/3 Oktave Bandbreite vs. 10 Oktaven für den Sweep erhält man 300 ms * 1/(1/3) * 10 ≃ 10 Sekunden. Das ist der höchste einstellbare Wert. Wer bewusst kurze Sweeps einsetzt, um mit der einhergehenden schlechten Auflösung optisch schön gerade Frequenzgänge zu erzeugen, sollte sich wohl besser nach einem anderen Tätigkeitsfeld umsehen.

Im Setup Menü kann die Samplerate eingestellt werden. Die angebotenen Werte erhält die App vom Android System des Gerätes, ebenso die Information "nativ" für einen bestimmten Wert, meist 48.000 pro Sekunde. Von diesem Wert sollte ohne konkrete Gründe (siehe unten im Abschnitt "Impulsantwort") nicht abgewichen werden. Hohe Werte ("viel hilft viel") sind nicht per se hilfreich.

Auswertung des Frequenzgangs

YouTube.com: 2. Room Acoustics Meter: Frequenzgang

Mit "Frequenzgang", auch FR (Frequency Response) und SPL (Sound Pressure Level) ist hier der Summenfrequenzgang gemeint, d.h. der Schalldruck, mit dem eine bestimmte Frequenz irgendwann einmal beim Mikrofon ankommt, nachdem sie in das System eingespeist wurde. Somit sind sowohl direkt vom Lautsprecher ausgesendeter Schall als auch Reflexionen an den Wänden usw. enthalten. Um die Raumeigenschaften zu überblicken ist das ein guter Start.

Nebengedanken zum Summenfrequenzgang und Target Curve

Der Anblick des Summenfrequenzgangs ist anfangs ungewohnt: Verglichen mit den Lautsprechermessungen des Herstellers entstehen durch die Raumeigenschaften viel größere Schwankungen. Herstellerseitige Lautsprechermessungen zeigen i.d.R. ausschließlich den Direktschall - der Raum des Benutzers ist zum Zeitpunkt der Messung schließlich noch nicht bekannt. Die Messung wird manchmal wirklich im Freien durchgeführt. Der Summenfrequenzgang in einem Hörraum hat mit den Eigenschaften des Lautsprechers kaum etwas zu tun. Beide Frequenzgänge haben ihre Berechtigung und spiegeln sich im Höreindruck: Ein ausgewogenes Verhalten im Direktschall kann als Grundvoraussetzung gesehen werden, ähnlich wie die Lichtquelle in einem Projektor weißes Licht liefern muss. In Hintergrundwissen ist beschrieben, welche klanglichen Eigenschaften bei welchen Eigenschaften des Raums zu erwarten sind. Unser Hörsinn ist offenbar imstande, den ersten Direktschall vom Lautsprecher und die Reflexionen so zu trennen, dass nicht alle diese Schwankungen wichtig sind.
Der Summenfrequenzgang sollte an einer Zielkurve orientiert werden, die zu höheren Frequenzen einige dB abfällt [Møller 1974], [Toole 2015], [Websuche "Target Curve spl" oder "Frequenzgang Zielkurven" bzw. "Hauskurven"]. Die App bietet die Möglichkeit, einige etablierte Zielkurven einzublenden.

Voraussetzung für die Interpretation sind korrekt durchgeführte Messungen (s.o.). Die Ergebnisse sollten den hier abgebildeten Kurven ähneln.

Ungefiltert	1/24 Oktav Glättung	1/8 Oktav Glättung	1/3 Oktav Glättung
Bilder zum Vergrössern anklicken

Summenfrequenzgang von zwei Standlautsprechern der Mittelklasse (Quadral Chromnium Style 50) ohne Klangkorrektur in einem 5m x 7m großem Raum. Die Mikrofonpositionen aller Messungen liegen weniger als 20 cm auseinander, also in einem Bereich von Ohrabstand und Kopfbewegungen. Die oberen blauen Kurven und unteren roten Kurven sind vom linken bzw. rechten Kanal. Die Kurven haben einen Shift von jeweils 20 dB. Die Messung erfolgte mit einem geeichten Messmikrofon Audix TM-1, das über einen Shure X2u XLR-auf-USB Adapter mit einem Samsung SM-T510 Tablet verbunden war. Die breite hellblaue Kurve ist die nach [Toole 2015] präferierte Zielkurve von trainierten Hörern.

Die selben Daten, ohne Shift.

Linke Spalte - (fast) Allgemeingültiges: Für eine Intuition, wo die Daten herkommen und welche Genauigkeit zu erwarten ist, schadet es sicher nicht, anfangs ein paar ungefilterte Frequenzgänge anzusehen. Später kann dieser Schritt übersprungen werden. Die extremen Schwankungen ab ca. 300 kHz entstehen durch Reflexionen. Bei Freiluftmessungen und im Nahfeld des Lautsprechers sind sie sehr abgeschwächt oder gar nicht zu sehen. Die Stärke dieses Kammfiltereffektes lässt die jeweilige Unsicherheit in den Ergebnissen erahnen: Es ist strittig, inwieweit sich der Hörsinn an den Spitzen oder an den Durchschnittswerten orientiert. Bei großen Schwankungen kann ein Höhenabfall nach der Mittelwertbildung also eine Folge der Rundungsmethode und für den Höreindruck vollkommen bedeutungslos sein. Bei den Beispielmessungen weiter unten sind diese Rohdaten deshalb ebenfalls angefügt.

"1/... Oktav Glättung" Spalten - (fast) Allgemeingültiges: Vergleicht man (in den unteren Diagrammen) zunächst die verschiedenen Messungen (jeweils eines Stereo-Kanals), dann sieht man, dass die Werte bei ca. 300-400 Hz (also Wellenlängen von 1 m) auseinanderlaufen. Das ist plausibel, weil bei stehenden Wellen Maximum und Knoten 1/4 der Wellenlänge auseinanderliegen, also in dem Bereich, in dem das Mikrofon bewegt wurde. Die Unsicherheiten liegen bei ungefähr 5 dB.
Zwischen eng (≪ 1/3 Oktave) benachbarten Frequenzen innerhalb jeder einzelnen Messung treten ebenfalls Schwankungen von ungefähr 5 dB auf. Offenbar sind ab ca. 300 Hz die wellenlängenabhängigen Verstärkungen und Auslöschungen durch kleine Änderungen der Mikrofonposition sehr vergleichbar mit denen durch kleine Änderungen der Frequenz. Im Bereich unterhalb von 300 Hz ähneln sich die Messungen stärker. Die einzelnen Messkurven schwanken an einigen Stellen aber stärker. Ob das durch Reflexionen oder Raummoden verursacht wird, kann man im Summenfrequenzgang nicht immer erkennen.

Diese Effekte treten bei praktisch allen Summenfrequenzgängen normaler Wohnräume auf. Bei einem höheren Direktschallanteil (s.u.) kann die Schwankungsbreite unter 5 dB fallen, was wünschenswert ist. Bei günstig aufgestellten (und angesteuerten) Subwoofern oder weniger Reflexionen durch einen geeigneteren Grundriss sollten die Peaks im Bereich unter 300 Hz deutlich moderater sein. Der zusätzliche Aufwand für Schallfeldmessungen, d.h. über viele eng benachbarte Mikrofonpositionen zu mitteln, lohnt sich nur in seltenen Fällen. Die Mittelwertbildung über benachbarte Frequenzen führt im oberen Frequenzbereich zu sehr ähnlichen Ergebnissen, im unteren Frequenzbereich ähneln sich die Messungen sowieso. Manche Tontechniker verwenden diese Methode beispielsweise nur für ein endgültiges letztes Einstellen der Klangkorrektur für einen bestimmten Hörplatz.

Qualitativ generalisierbar: Sowohl die 5-dB-Schwankungen benachbarter Frequenzen als auch die wesentlich stärker ausgeprägten Raummoden oder Reflexionen im Bassbereich zeigen, dass der Raum akustisch noch "einige Luft nach oben" hat, aber nicht "katastrophal" ist. Wie bei vielen Wellenbildern in der Natur zählt das Gesamtbild, die einzelnen Schwankungen haben kaum Bedeutung, solange sie gleichmäßig verteilt sind. Grundsätzlich ist nicht jede Reflexion schlecht. Der über 1/3-Oktave geglättete Frequenzgang sollte aber auf jeden Fall Schwankungen unter 10 oder maximal 15 dB haben. Wenn sie gleichmäßig verteilt sind, sind sie weniger problematisch. Setups, bei denen wenige Frequenzen sehr prominent hervorstechen, sollten einem Hörtest unterzogen werden. Positionierungen von Lautsprechern, Hörplätzen und Dämmung mit ausgewogenem Verlauf werden wahrscheinlich besser klingen.

Der Peak bei 35 Hz deutet auf eine Raummmode hin. Obwohl die Lautsprecher in diesem Bereich an Ihre Grenze kommen, ist er deutlich ausgeprägt. Maßnahmen: Daraus ist schon zu ahnen, dass der Einsatz eines einzelnen Subwoofers wahrscheinlich sinnlos ist. Die 35-Hz Mode wird zusammen mit den Peaks knapp unter 100 Hz das Klangbild unerträglich dominieren und beim Versuch, das durch geschickte Aufstellungen zu verhindern, wird sicherlich irgendeine andere Raummode angespielt. (Gegenwärtig sind deshalb 4 Subwoofer im Einsatz, die über einen Soundprozessor angesteuert werden).
Ein weiterer Grund kann ein Subwoofer der unteren Preisklasse sein: Dessen Resonanzen wurden möglicherweise stark und entsprechend schmalbandig ausgelegt - mit dem Ziel möglichst viel Krach pro Geld zu produzieren.
Der schmale Peak bei knapp 70 Hz im linken Kanal und der breitere Peak bei 80-100 Hz im rechten Kanal sind als brummiger, matschiger Bass hörbar. 1/4 der Wellenlänge ist hier ungefähr 1 m. Maßnahmen: Verschiebungen von Lautsprechern oder Hörplätzen um 0,5...1 m können vielleicht eine gewisse Abhilfe schaffen. Im Gegensatz zum "Subwoofer-Bereich", wo Dämmung durch zusätzliche geschickt angesteuerte Lautsprecher ersetzt werden kann, wäre hier eigentlich Dämmung erforderlich. Allerdings ist für diesen Frequenzbereich der Materialaufwand recht hoch. Wenn der Effekt bei allen Hörplätzen ähnlich ist, könnte ein Equalizer ausprobiert werden.
Die Betonung des Bereiches bis 300 Hz erzeugt ein Hörerlebnis, "als ob eine Decke drüber liegt". Erst dicht vor dem Sättigungspegel "öffnen sich die Lautsprecher und werden Live-artig". Maßnahmen: Wie der vorige Punkt spricht das für ein moderates elektronisches Absenken dieses Bereiches.
Die Absenkung der Höhen ab 1500 Hz kann auch an der Messung oder Rundungsmethode (s.o.) liegen. Die Werte können sich stark ändern, wenn die Hochtöner auf das Mikrofon ausgerichtet sind, oder der Abstand zwischen Lautsprecher und Mikrofon kleiner ist. Je nach Zielkurve, Raumeigenschaften und persönlichen Erfahrungen im Umgang mit dem Messequipment sollte sie nicht blind korrigiert werden. Würde man den Pegel hier um 15 dB erhöhen, ergäbe sich (kurz, bis die Bändchenhochtöner durchbrennen) ein furchtbares Klangbild.
Bodenreflexionen (Floor Bounce) sind hier nicht erkennbar, können aber weiter unten in den Beispielmessungen gefunden werden. Sie können das Hörempfinden deutlich stören. Zeigt der Frequenzgang einen m-förmigen Verlauf, kann wie folgt überprüft werden, ob eine Reflexion der Grund ist.
- Öffnen Sie mit SET das Overlay
- Schalten Sie REFLECTION auf ON.
- Benutzen Sie die 3 Slider ↣ ↕ ↑ um die berechnete Reflexionskurve über den Messewerten zu positionieren.
Nur wenn das möglich ist, handelt es sich um eine Reflexion. Für Techniker: Andernfalls haben die jeweiligen Frequenzmaxima kein ganzzahliges Verhältnis von Wellenlänge zu Umweg. Details und Maßnahmen.
Schwankungen nach unten im Bassbereich bis ca. 150 Hz sind wahrscheinlich auf sich gegenseitig auslöschende Wellen zurückzuführen. Grundsätzlich fallen fehlende Frequenzen im Hörerlebnis erheblich weniger auf als Anhebungen. Zumindest so lange, wie das System nicht zum Abmischen eigener Produktionen benutzt wird und diese dann überkompensiert werden. Versuche, sie durch Verschieben der Lautsprecher zu beseitigen erzeugt meist neue Schwankungen. Es lohnt sich aber durchaus, mehrere Messungen zu vergleichen und "das kleinste Übel" zu finden.
Die Beurteilung des gesamten 1-Oktav-geglätteter Verlaufs setzt voraus, dass a) das Mikrofon geeicht wurde. Ab ca. 5 kHz sollte zumindest etwas Erfahrung mit verschiedenen Anordnungen von Mikrofon zu Hochtöner gesammelt worden sein. Maßnahmen: Der Frequenzgang kann mit den verschiedenen Zielkurven (s.o.) verglichen und eine Hauskurve ausgesucht werden.
Unabhängig vom vorigen Punkt kann der gesamten 1-Oktav-geglätteter Verlauf verwendet werden, um Tendenzen zu vergleichen - z.B. ob verschiedene Kanäle (Rechts Links, Surround) signifikante Unterschiede aufweisen. Das funktioniert auch ohne geeichtes Mikrofon. Ein Mikrofon mit Richtcharakteristik darf dabei natürlich keinen Lautsprecher bevorzugen. Wie oben beschrieben, haben die gemessenen Werte haben mit dem Frequenzgang des Lautsprechers nichts zu tun.

Die breiteren Anhebungen und Absenkungen im Frequenzgang kann man bestimmten Klangcharakteren zuordnen. Das kann zum Verständnis eines Hörtests beitragen. Wenn keine Neutralität angestrebt wird, kann es in die Korrekturmaßnahmen einfließen. Suchmaschinenanfragen "Klangcharakter vs. Frequenzgang" liefern interessante Erkenntnisse, von denen einige aus der persönlichen Sicht des Autors nachvollziehbare hier zusammengefasst sind:

Alle Frequenzen in Hz	20-40	40-200	200-500	500-2k	2k-6k	6k-12k	12k-20k
Wichtig für	Spürbare Vibrationen	100: Beginn der tiefsten menschlichen Stimmen 150: Wärme des Klangs, Körper der Stimmen	200: Fundament der menschlichen Stimme	empfindlicher Bereich des Gehörs. Für Gitarren und Stimmen	empfindlichster Bereich des Gehörs. Deutlichkeit, Nähe von Stimmen.	Brillianz, Offenheit. Becken, Streicher	für funkelnde brilliante transparente Höhen. Becken.
Klang bei Anhebung +10 dB	Je nach Hörerfahrung und Geschmack	40-60 dröhnend, 100: Bass matschig, "boomy", aber 60-150: anheben für Fülle im Bassbereich, fetten Sound, 125-250: "als ob eine Decke drüber liegt"	300: topfig... 600: trötig, hupig, hohl	500-2k "altes Küchenradio". 1k: nasal, dünn, 2k: dünn, harsch	2k-6k: "Megafon-Sound". 5k: scharf, zischend	7k: unangenehme "s" und "t" Laute, Websuche: "De-Esser"
Klang bei Absenkung -10 dB	Schade	150: Bass wirkt abgetrennt	250 Bass wirkt hohl, 450: Stimmen wirken hohl	1k: ca. 5 dB absenken zum "Entmulmen"	2k: Klarheit fehlt 3k: "Attack" fehlt, süßlich, romantisiert 4k: Finesse fehlt
Blauert			300-600: vorne	700-1800: hinten	2,2k-6k: vorne	8k-11k: oben	11k-17k: hinten

Die Empfindungen in den Zeilen 2–4 genügen keinem wissenschaftlichen Anspruch, sie sind sicher nicht systematisch reproduzierbar. Wenn einzelne Frequenzen angegeben sind, ist ein Bereich von 1 bis 2 Oktaven FWHM gemeint. Die letzte Zeile bezieht sich auf die sog. Blauertschen Bänder: Durch Anhebung bestimmter Frequenzbereiche kann man den Höreindruck erzeugen, der Schall käme von vorn, oben, hinten oder unten [Blauert 1974, Wikipedia].

Nebengedanken zur Glättung

Die Frage, welche Glättung die Aussagekräftigste wofür ist füllt viele Forenseiten. Grundsätzlich kann (bei Schallfeldmessungen - siehe oben) über mehrere Messungen gemittelt werden, oder die Mittelung erfolgt über den Frequenzgang, wobei es auch wieder mehrere Verfahren gibt. Vor der Lektüre sollte durch Umschalten (insbesondere zwischen 1/3- und 1/8-Oktav-Glättung) eine eigene Intuition erschaffen werden, was jeweils zu sehen ist. Als Basis sollten auch die Rohdaten angesehen werden. Sowohl der durchschnittliche Schalldruck als auch der maximale Schalldruck jedes kleinen Frequenzbereichs geht in die wahrgenommene Lautheit ein.

Für den Höreindruck sind die Trends in der Überlagerung von direkten und reflektierten Signalen am Mikrofon bzw. Ohr wichtig. Auch in den geglätteten Daten sollten die daraus resultierenden einzelnen Peaks nicht überinterpretiert werden: Ihre Lage ändert sich auch je nach Mikrofonstandort. Außerdem ändern Zuhörer ihre Sitzposition und haben ca. 14 cm Abstand zwischen den Trommelfellen. Wichtig ist, dass sich dadurch der Klang nicht zu sehr ändert. Es gibt zwei grundsätzliche Wege das zu realisieren:

durch einen hohen Direktschallanteil. Dafür gibt es in der Studiotechnik Nahfeldmonitore. Der Hörabstand ist meist unter 2 m. Je stärker der Raum gedämmt ist, desto unkritischer ist der Hörabstand. Hornlautsprecher ermöglichen ebenfalls größere Hörabstände.
durch Ergodizität, d.h. eine gute Durchmischung, so dass möglichst alle Frequenzen zu allen Zeiten aus den richtigen Richtungen reflektiert werden. Rund- oder dipolartig abstrahlende Lautsprecher sorgen sicherlich "für einen guten Anfang", wenn eine solche Schallverteilung bevorzugt ist.

Selten erwähnt wird die Kanalgleichheit. Sie hat mindestens die gleiche Priorität wie der Frequenzgang: Ein System bei dem Sänger nicht, oder schlimmer an einer völlig falschen Stelle geortet werden, kann nicht ernsthaft als "eingemessen" bezeichnet werden. Die Kanalgleichheit hat mit der Gleichheit der Frequenzgänge des rechten und linken Kanals zu tun, viele weitere Effekte gehen aber ebenso ein. Anfangs sind Hörtests sicher der bessere Weg zur Wertung.

Auswertung von Phase, Delay, Gruppenlaufzeit

Während der Frequenzgang zeigt, wie stark eine bestimmte Frequenz wiedergegeben wird, zeigen diese Kurven in verschiedenen Formen, wann sie wiedergegeben wird. Nicht alle Frequenzen kommen immer gleich schnell an: Ein Beispiel aus der Natur ist das Knacken von Eis auf einem zugefrorenem See: Aus einiger Entfernung ändert sich das "Knack"-Geräusch zu einer Art "Piu", weil die höheren Frequenzen von Eis schneller übertragen werden. Auch beim Einschlag eines Blitzes kommt der tieffrequente Donner oft später als der Knall des Einschlags an. Im Gegensatz zum brechenden Eis, dessen Verhalten sich physikalisch nachvollziehen lässt, spielen hier allerdings viele nicht genau bekannte Faktoren zusammen. Bei entfernten Explosionen ist der zeitliche Verlauf beispielsweise völlig anders.

Das Verhalten von Schall in Wohnräumen entspricht eher dem zweiten Beispiel. Nur Teilaspekte scheinen manchmal durch Konzepte wie Bassreflexkanäle erklärbar. Ohne Maßnahmen an der Raumakustik braucht man sich wohl nicht damit zu beschäftigen. Danach sicherlich im High End Bereich, ansonsten vielleicht. Ein Rezept zum Verständnis der Kurven steht bereits an anderer Stelle.

Auswertung der Impulsantwort

YouTube.com: 3. Room Acoustics Meter: Einführung in die Impulsantwort

Grob gesagt ist Impulsantwort, auch Impulse Response (IR), das, was man hört, wenn ein scharfer Knall abgespielt wird. Sie charakterisiert sowohl Echos, Reflexionen, Hall usw. im Hörraum als auch die Reaktion der Lautsprecherboxen samt zugehöriger Elektronik. Statt des Knalls spielen Hifi-Apps einen verträglicheren Logsweep ab und rekonstruieren daraus die Daten des Knalls.

Vor Auseinandersetzung mit der gemessenen Impulsantwort sollte intuitiv klar sein, worum es geht. Dazu kann man in verschiedenen Räumen die Hände klatschen und hören, wie der Hall abklingt. Der ideale Hörraum darf weder "völlig tot" noch hallig wie ein Badezimmer sein. Der Hall sollte sich auch gleichmäßig im Raum verteilen und nicht (z.B. zwischen gegenüberliegenden Wänden) oder hin- und hergeworfen werden. Mit etwas Übung ist das gut hörbar. Es kann helfen, den Kopf beim Klatschen in verschiedene Richtungen zu drehen.

Die gemessene Impulsantwort zeigt den zeitlichen Verlauf des Schalldrucks oder einer eng verwandten Größe. Auf der x-Achse steht immer die Zeit, bei Hifi-Apps wahlweise auch als Produkt mit der Schallgeschwindigkeit in Metern. Die Kurve lässt sich in drei Teile unterteilen:

Der Peak auf der linken Seite zeigt den Direktschall. Das ist der Schall, der ohne Umwege das Mikrofon erreicht. Anschaulich ist es der erste und intensivste Anteil des gedachten Knalls. Seine Form kommt vom Einschwingvorgang bestimmter Teile des Lautsprechers und wäre in einem schalltoten Raum ähnlich. Es muss sich nicht zwingend um einen einzelnen Peak handeln, mehrere Schwingungen nebeneinander sollten aber nicht überinterpretiert werden. Nicht jeder Spike in diesem Bereich liefert brauchbare Information, es gibt auch rechnerische Artefakte [Usher 2010].
Frühe Reflexionen sind oft relativ isolierte, originalgetreue Wiederholungen des Direktschalls. Sie können auch im Frequenzgang sichtbar sein und sind bereits dort beschrieben.
Später Nachhall. Die einzelnen Reflexionen gehen durch mehr und mehr Spiegelungen in einen ergodischen Zustand über: Anschaulich gesehen springt die lauteste Stelle nicht mehr im Raum hin und her, sondern hat sich verteilt. Außer der Lautstärke des Nachhalls ändert sich nichts mehr. Der Hörsinn empfindet letzteres als angenehmer. Deshalb werden Diffusoren zur Schallverteilung eingesetzt.

Während der Direktschall ein einzelnes Ereignis ist, das gut identifiziert werden kann, ist die Trennung zwischen den frühen Reflexionen und dem späten Nachhall weniger offensichtlich: Sie können überlappen oder es kann eine Lücke "transition time" zwischen beiden geben [Defrance 2009]. Die folgende Abbildung zeigt immer dieselben 4 Impulsantworten oder eine Auswahl davon in verschiedenen Darstellungen. Praktisches Ziel könnte sein, durch Dämmung, Anbringung von Diffusoren, Änderung der Hörplätze usw. die schlechte hellblaue/beige Impulsantwort in den Bereich der guten dunkelblau/roten zu bringen.

Impulsantwort	Zoom auf Anfangsbereich	Lineare Darstellung	zugehöriger Frequenzgang
Bilder zum Vergrössern anklicken

Spalte 1: Vergleich der Impulsantworten eins leerem quadratischen Raums und eines gedämmten Hörraums, jeweils linker und rechter Kanal. Spalte 2: Ausschnitt aus dem ersten Bild, die beiden prominentesten Peaks von a) mit Werten markiert. Spalte 3: Lineare Darstellung der selben Messung, zur Übersichtlichkeit nur die linken Kanäle (blau). Spalte 4: Zugehöriger Frequenzgang von a). Die roten Kurven sind berechnete Werte: Sie zeigen die Schallintensität bei Überlagerung zweiter um den jeweils angegebenen Betrag verzögerten Wellen.

Spalte 1: Wie oben (Zeitachse verlängert 500 ms), zusammen mit Schroeder Kurven und davon abgenommenen Werten für - EDT (Early Decay Time gem. ISO 3382), d.h. Dauer des Abfalls vom dB-Wert bei t=0 bis -10 dB, multipliziert mit 6 - T20, d.h. die Dauer des Abfalls von -5 dB auf -20 dB, multipliziert mit 4. Die Schroederkurve startet hier bei -10 ms, deshalb ist der Wert bei t=0 etwas unter 0 dB. Dadurch ändern sich die Ergebnisse nicht. Alle Nachhallzeiten beziehen sich auf einheitlich 60 dB Abfall, d.h. die abgelesenen Werte für 20 dB bzw. 15 dB sind bereits mit 3 bzw. 4 multipliziert. Spalte 2 und 3: gefilterte Impulsantworten von jeweils 2 ausgewählten Oktavbändern mit Schroederkurven. Spalte 2: ungedämmter Raum (hellblau), Spalte 3: gedämmt (dunkelblau). Erkennbar ist die starke Methodenabhängigkeit der T60 Werte: Im Bassbereich des ungedämmten Raumes sind die Schwankungen so stark, dass eine Festlegung des Nachhalls unabhängig von der Messmethode sinnlos erscheint. Der Anstieg bei ca. 300 ms ist psychoakustisch sicher völlig anders zu beurteilen als der Beginn der Kurve. Die Entscheidung ihn in die Bestimmung von T60 aufzunehmen ist damit subjektiv. Vergleicht der EDT Werte beider Spalten zeigt, dass auch hier Ausreißer auftreten können, die das Hörerlebnis wohl nicht widerspiegeln. Spalte 4: Die in Terz-Schritten gefilterten Impulsantworten mit Schroederkurven und T20 Werten. Wie für Spalte 2 erläutert, sollten den Werten für den Bassbereich nicht naiv vertraut werden.

Hellblau: Die Impulsantwort des leeren Raums ist erwartungsgemäß so schlecht, dass die Einzelheiten kaum interpretiert werden müssen. Trotzdem - Spalte 2: In der Vergrößerung stechen insbesondere der Einschwingvorgang in den ersten 3 ms und die Peaks danach heraus. Die ersten beiden Peaks wurde mit der Schall Laufzeit gekennzeichnet. Offenbar gibt es zwei Schall spiegelnde Flächen, die den Schall mit 2,84 bzw. 4,56 m Umweg von linken Lautsprecher zum Mikrofon reflektieren. Die akustische Behandlung könnte mit der Suche nach diesen Flächen per Schnur-Methode und ihrer Behandlung beginnen. Um den Einschwingvorgang am Anfang etwas zu verteilen, könnte an Diffusoren gedacht werden. Andererseits zeigt die untere Bildreihe, dass die Nachhallzeit viel zu lang ist, was mehr für Dämmung spricht. Vermutlich wäre jede Behandlung eine Verbesserung.

Bei den Längenangaben sind Toleranzen von 10 bis 20 cm normal, bei großen Lautsprechern entsprechend mehr, weil der genaue Ort der Schallquelle durch das Zusammenspiel mehrerer Chassis oft unklar ist. Über ähnliche Abweichungen zwischen Raumgröße und gemessenen Verzögerungen sollte man sich auch nicht zu sehr wunden. Es genügt wahrscheinlich zu wissen, dass die akustische Größe eines Raumes bis zu 20 % größer sein kann als seine architektonische. Insbesondere wenn die Wände aus Holz oder Gipskarton sind und mitschwingen (Websuche "Schall an Mediengrenzen" für mehr).

Für die Y Achse der Impulsantwort gibt es mehrere Möglichkeiten. Grundsätzlich kann im ersten Schritt zwischen linearer und logarithmischer Darstellung gewählt werden. Da der Schalldruck in der Impulsantwort eines Wohnraums über weite Strecken logarithmisch abfällt, bietet sich letztere quasi von selbst an. Der Abfall erscheint als Gerade und Abweichungen davon werden erkennbar. Die lineare Darstellung ist dafür näher an den gemessenen Rohdaten. Entsprechend besser sind technische Details wie das Zusammenspiel verschiedener Lautsprecherchassis sichtbar. Um Teile mit kleiner Amplitude anzusehen, kann die Kurve mit Zwei-Finger Gesten vergrößert werden.

YouTube.com: 4. Room Acoustics Meter: Geglättete Impulsantwort und Step Response

Bei beiden Darstellungen gibt es ein grundlegendes Problem: Die beim Mikrofon ankommende Energie für einen Zeitabschnitt ist je nach Darstellung eng verwandt der Fläche unter dem entsprechenden Stück Kurve. Sie ist im Idealfall auf einen einzigen schmalen hohen Peak konzentriert. In der realen Welt laufen aber dessen hochfrequente und niederfrequente Anteile früher oder später auseinander. Die hochfrequenten Anteile bleiben aber naturgemäß auf einen kurzen Zeitabschnitt beschränkt. Mithin werden sie durch hohe schmale Peaks dargestellt. Die niederfrequenten Anteile überdecken zwar eine vergleichbare Fläche, diese geht aber über einen viel weiteren Zeitabschnitt. Sie sind deshalb kaum zu sehen, obwohl sie für den Hörsinn viel wichtiger sind. Bei Forendiskussionen zur Raumakustik wird meist eine rohe oder leicht geglättete logarithmische Darstellung gepostet.

Auf der anderen Seite sind die Peaks ein nützlicher Indikator, um einzelne Reflexionen möglichst genau zu identifizieren. Sie können nicht einfach "weggeglättet" werden. Zum Verständnis des Systems sollte also zwischen den Darstellungen hin- und hergeschaltet werden. Die App bietet folgende Möglichkeiten:

Lineare Darstellungen
[RAW] zeigt die Rohdaten, wie in den Beispielen oben
[AVG] zeigt die geglätteten Rohdaten. Die scharfen Peaks durch hohe Frequenzanteile verschwinden, dadurch werden Reflexionen ohne hohe Frequenzanteile besser erkennbar. Die Bandbreite der Glättung ist mit dem Slider "Bandwidth" einstellbar. Diese Darstellung sollte nur verwendet werden, nachdem die ungeglätteten Daten angesehen wurden. Durch das "Ausschmieren" der Peaks könnten sonst unterschiedliche Reflexionen zusammenschmelzen. Die Norm EBU 3276 richte beispielsweise das Augenmerk auf Spikes in der ungeglättete Impulsantwort.
[STEP] zeigt die Schrittantwort, d.h. das Integral von [RAW], also anschaulich die bisher gesammelte Fläche unter der Kurve RAW wenn man diese von links nach rechts abtastet. Bei einem idealen System würde sie zum Zeitpunkt 0 von 0 auf 1 springen und dort bleiben. Bei einem realen System sind deutliche Schwingungen sichtbar, die den Hörsinn aber erstaunlich wenig irritieren. Vorteil der Darstellung ist, dass auch hier Reflexionen mit und ohne hohe Frequenzanteile ähnlich aussehen, wenn sie ähnliche Energiemengen übertragen. Ein Beispiel steht in der Dokumentation der ETC (siehe unten).
[ETC]: Die Energy Time Curve, auch Impulse Response Envelope ist hier dokumentiert. Sie zeigt die momentane vom Mikrofon gemessene Energie (genauer: die Hilbert Transformierte) des Schallfeldes. In Kombination mit anderen Darstellungen kann sie zur Erkennung unerwünschter Reflexionen beitragen.
Logarithmische Darstellungen
[RAW] wie bei "Lineare Darstellungen". Siehe Text weiter oben für den Unterschied linear / logarithmisch. Der begrenzte Platz kleiner Bildschirme kann besser genutzt werden, wenn der untere dB Wert begrenzt wird. Dazu muss in der zentralen Ansicht der App (Hauptmenü) geöffnet werden. Die Einstellung erfolgt unter SETUP/"Range for sound pressure [dB]".
[MAX] Zeigt die Maximalwerte von RAW (in 0.5 ms Intervallen). Dadurch wird verhindert, dass Ausschläge nach unten Bildschirm-Platz verbrauchen. Dadurch lassen sich auf kleinen Bildschirmen und vielen Kurven darstellen.
[ETC] wie bei "Lineare Darstellungen".
T60 Method Comparison
[RAW], [MAX], [ETC] arbeiten wie in "Logarithmische Darstellungen"
Schröder Kurve: zeigt die gesamte Energie, die noch im Schallfeld steckt. Sie macht nachvollziehbar, woher die berechneten Nachhallzeiten und deren Abweichungen bei verschiedenen Methoden kommen. Siehe Text weiter oben.
Die Nachhallzeit in Sekunden zeigt an, wie schnell der Hall in einem Raum unter die Hörschwelle (-60 dB) abklingt. Hifi-Apps verwendet die Schröderkurve zur Berechnung. Je nach Methode werden zwei Punkte dieser Kurve ausgesucht und mit einer Geraden verbunden. Die Nachhallzeit ist dann die Zeit, die diese Gerade braucht, um 60 dB "Höhenunterschied" zu verbinden. Sie hängt also davon ab, welche Punkte in der Kurve jeweils vergleichen werden. Für gute Lokalisation ist eher der Anfang der Kurve wichtig, für einen angenehmen Raumeindruck spätere Teile. Entsprechend gibt es mehrere Normen, die in der App ausgewählt werden können. Die App bietet zusätzlich an, den Start- und Endpunkt frei zu wählen. Grundlage ist entweder der dB-Wert, also die Y-Koordinate oder der Zeit-Wert, also die X-Koordinate. In allen Fällen kann sowohl die Schröderkurve als auch die verbindende Gerade eingeblendet werden. Auf diese Weise erhält man nicht nur den Wert für die Nachhallzeit, sondern ein umfassenderes Bild wo er herkommt.

Die Button-Zeile darunter [T=0] [FILTER]... öffnet verschiedene Einstellmöglichkeiten, die aus Platzgründen bei Start ausgeblendet sind. Ihre Dokumentation wird in der App gezeigt: Wenn [HINTS] aktiviert ist, erscheint zu dem jeweils letzten berührten Bedienelement eine Kurzanleitung. [FILTER] ist weiter unten beschrieben.

YouTube.com: 5. Room Acoustics Meter: Frequenz gefilterte Impulsantwort

Wasserfall

YouTube.com: 7. Room Acoustics Meter: Wasserfalldiagramm und Spektrogramm

Der "normale" Summenfrequenzgang zeigt, wie stark jede Frequenz wiedergegeben wird, wobei egal ist, wann sie ankommt. Im Wasserfalldiagramm ist wie beim Summenfrequenzgang die Amplitude gegen die Frequenz aufgetragen. Allerdings wird die ankommende Schallintensität in Zeitabschnitte zerhackt und so auf mehrere Kurven verteilt. Diese werden ab jetzt FR(t) genannt, was darstellen soll, dass es sich um zeitabhängige Frequenzgänge (Frequency Responses) handelt. Der erste FR(t) ist also beispielsweise der Frequenzgang für die ersten 5 ms, der nächste für die nächsten 5 ms usw. Dadurch wird besser erkennbar, ob einzelne Unregelmäßigkeiten im Summenfrequenzgang z.B. von kurzen, intensiven Reflexionen oder weniger intensiven aber dafür längeren Resonanzen kommen. Sowohl die Hörsamkeit (also ob überhaupt Maßnahmen dagegen nötig sind) als auch die Maßnahmen selber hängen davon ab.

Die Ausgabe entsteht, indem der Frequenzgang nicht aus der gesamten Impulsantwort berechnet wird, sondern jeweils aus dem Abschnitt, der für FR(t) zeitlich untersucht werden soll. Jeder FR(t) entsteht also aus einem bestimmten Abschnitt der Impulsantwort um die Zeit t herum.

Selbst ein ideales Wasserfalldiagramm in einem absolut reflexionsfreien Raum würde sich nicht auf FR(t=0) beschränken: Würde man im Beispiel die Breite der untersuchten Zeitabschnitte auch auf 5 ms (= 1/200 Hz) setzen, könnten Frequenzen unterhalb von 200 Hz schlichtweg nicht definiert werden, da keine volle Periode in diesen Zeitabschnitt passt. Dieses Heisenberg-Limit verhindert, dass es schnelle Bass Arien gibt. Es kann nicht durch geschickte Algebra überwunden werden.

Aus diesem Grunde muss immer ein Kompromiss aus Zeit- und Frequenzgenauigkeit gewählt werden. Dafür gibt es zwei etablierte Methoden [IRZU FFT WAVELETS]:

FFT
Im Overlay für die Einstellungen wird die Anzahl der Kurven zusammen mit der zeitlichen Position der ersten und letzten Kurve gezeigt. Klick auf [CHANGE] ermöglicht die Änderung. Dazu wird die Ansicht temporär gegen die Impulsantwort ausgetauscht. Man sieht jetzt die einzelnen Abschnitte der Impulsantwort, aus denen die FR(t) berechnet werden. Die Einstellungen für das Bild oben: Hier sind 20 stark überlappende Abschnitte gewählt, von denen der erste bei -10 ms, also 10 ms vor dem Haupt-Peak der Impulsantwort anfängt. Der letzte beginnt 500 ms später. Der Kompromiss zwischen Genauigkeit von Zeit oder Frequenz wird durch die Breite der einzelnen Abschnitte festgelegt. Hierfür dienen die beiden letzten Slider "FFT Rise" und "FFT Top+Fall". Die Summe ihrer Werte (hier also 15 ms + 204 ms) ergibt einen Anhaltspunkt für die Frequenzauflösung, die hier bei wenigen Hz liegen sollte. Die Abschnitte sind also sehr breit gewählt und überlappen auch entsprechend stark. Entsprechend schlecht ist auch die zeitliche Auflösung. Dafür ist die schmalbandige Mode bei 110 Hz im Bild oben gut erkennbar.
Wavelet
Diese Darstellung passt wesentlich besser zum Ausgabe-Modus [Spektrogramm] und ist hier nur für Vergleichszwecke mit den FFT-Daten implementiert. Anschaulich legt die Methode auf viele Stellen der Impulsantwort jeweils relativ kurze Wellenzüge mit wenigen Schwingungen (Wavelets). Die Impulsantwort wird also auch Stückweise abgetastet. Diese Abtastung wird aber mehrmals wiederholt, wobei die Frequenz der Wavelets geändert wird. Ihre Form bleibt dabei gleich, d.h. bei halbierter Frequenz verdoppelt sich ihre Länge. Dadurch werden für die gesamte Impulsantwort jetzt nur noch halb so viele Wavelets gebraucht. Das hat den Vorteil, dass bei hohen Frequenzen, wo eine hohe Zeitauflösung möglich ist, viele Abtastungen in entsprechend kurzen Zeitabschnitten erfolgen. Bei tiefen Frequenzen werden die Zeitabschnitte dagegen lang genug, um die Frequenzauflösung (pro Oktave) beizubehalten.
Beispiel: Das Wavelet hat eine Länge von 5 Wellenzügen. Setzt man seine Frequenz auf 40 Hz, deckt es einen Bereich von 0.125 Sekunden ab. Mit etwas Überlapp genügen also ungefähr 10 Wavelets um das 40-Hz Band der Schallverteilung in der ersten Sekunde zu untersuchen. Dabei ist theoretisch eine Genauigkeit von bis zu 1 / 0.125 s = 8 Hz, also grob 1/3 Oktave möglich. Für 80 Hz benötigt am 20 Wavelets, erhält so die doppelte Zeitauflösung mit Genauigkeit 16 Hz, also wieder 1/3 Oktave. Bei 800 Hz können 200 Wavelets, bei 8000 Hz 2000 Wavelets verwendet werden. Die Frequenzauflösung bleibt bei 1/3 Okt, die zeitliche Auflösung wird immer besser.
Bei der App reduzieren sich die Einstellungen also theoretisch auf die Genauigkeit in Oktaven und Beginn und Ende des abzutastenden Zeitbereichs. In der Praxis muss das Wasserfalldiagramm aber Kurven mit festem Zeitabstand liefern, deshalb bleiben Anzahl der Kurven und Auflösung einstellbar. Die Wavelets werden dann "entgegen ihrer natürlichen Auflösung" auf diese Kurve "gezwungen". Es bleibt der Vorteil, dass sehr kleine Zeitabschnitte des Hochtonbereichs aufgelöst werden. Bei der Spektrogramm-Darstellung entfällt dieser Zwang und die Wavelets können ihre Vorteile erheblich besser ausspielen.

Spektrogramm

Das Spektrogramm ähnelt inhaltlich dem Wasserfalldiagramm. Es benutzt statt verschiedener Kurven verschiedene Farben. Bei beiden Diagrammen ist eine Achse für die Frequenz. Beim Spektrogramm ist die andere Achse für die Zeit und die Farbe für die Intensität. Beim Wasserfalldiagramm ist die andere Achse für die Intensität und für verschiedene Zeiten werden verschiedene Kurven angezeigt. Mit diesen Unterschieden im Hinterkopf entspricht die Dokumentation der des Wasserfalldiagramms.

T60

Im Abschnitt Auswertung der Impulsantwort wurde erläutert, wie Hifi-Apps die Nachhallzeit T60 messen und verschiedene gefilterte Impulsantworten mit zugehörigen T60 dargestellt. Die Berechnungen hier sind identisch, gehen aber einen Schritt weiter: Die Nachhallzeit wird mit Terz- oder Oktav-Abstand für viele Frequenzen berechnet und als Funktion der Frequenz dargestellt. Dadurch wird ein direkter Vergleich mit gängigen Normen möglich. Diese können ausgewählt und eingeblendet werden. Zur Berechnung der Normwerte muss das Raumvolumen festgelegt werden.

Die berechneten Nachhallzeiten im Bassbereich darf nicht blind vertraut werden. Wie im Abschnitt "Auswertung der Impulsantwort" gezeigt, unterliegt die gefilterte Impulsantwort dort erheblichen Schwankungen verschiedenster Periodendauern. Diese entstehen aus einer Mischung von chaotischer Raumakustik (unterhalb der Schroederfrequenz) die stark von der Mikrofonposition u.Ä. abhängen und Filtereffekten. Letztlich kann ein einzelner T60 Wert niemals das hochkomplexe Verhalten eines Hörraums in diesem Frequenzbereich vollständig beschreiben. Nur wenn sein Verhalten aber Vergleichsmessungen und verschiedenen Auswertungen stabil ist, kann er als Anhaltspunkt dienen. In [Zehner Ringversuch] werden Messungen mit verschiedenen 13 Akustik-Softwarepaketen, bedient von Toningenieuren mit meist weit über 10 Jahren Berufserfahrung, vergleichen.

Es ist viel einfacher, hohe Frequenzen zu dämmen als tiefe. Tiefe Frequenzen spielen aber eine wichtige Rolle für die Wortverständlichkeit. Entsprechend ist die Nachhallzeit im unteren Frequenzbereich möglichst gut unter Kontrolle zu halten. Bei der Erstellung der DIN 18041 wurden für den unteren Frequenzbereich Kompromisse zwischen akustischer Qualität und Machbarkeit geschlossen [Fuchs 2019]. Im Zweifel ist es also besser, wenn die gemessenen Werte weiter unten im Bereich der Norm liegen.

Ist die Nachhallzeit im Tieftonbereich zu lang, kann im Spektrogramm oder Wasserfalldiagramm nach der Ursache geforscht werden. Im jeweiligen Frequenzband sollte eine Raummode zu finden sein. Die Beseitigung bei einem bestehenden Gebäude ist schwierig. Einige Ansätze finden sich hier.

Room Acoustics

YouTube.com: 8. Room Acoustics Meter: Schalldruckkarte

Diese Darstellung kann als parametrisierte Schalldruckkarte verstanden werden. Schalldruckkarten zeigen, wie laut es an den einzelnen Hörplätzen ist. Bei privaten Räumen spielt das aber keine große Rolle, die Lautstärke ist überall mehr oder weniger gleich. Problematisch sind dafür Resonanzen und Reflexionen, die an jedem Platz ein unterschiedliches Hörbild erzeugen können. Der Schalldruck jeweils für eine bestimmte Frequenz ist also hier viel entscheidender. Genau da setzt die Darstellung an: Die Schalldruckkarte ist durch einen Regler ergänzt, mit dem die Frequenz durchgestimmt werden kann:

Rohdaten	44 Hz (λ = 7,8 m)	140 Hz (λ = 2,5 m)	170 Hz (λ = 2,0 m)
Bilder zum Vergrößern anklicken

Spalte 1: Rohdaten aus den Frequenzgängen (1/3 Okt geglättet). 1: Umschalter "Alle Frequenzen" vs. "Raummoden": für das Verhalten des Sliders zur Frequenzeinstellung daneben 2: Setup zum Umschalten zwischen Darstellung der Rohdaten und als Heatmap etc. 3: Auswahl der Kanäle. Spalte 2, 3, 4: Heatmap bei verschiedenen Frequenzen. Der schmale schwarz - weiß wechselnde Streifen am rechten Bildrand stellt die Wellenlänge dar.

Für das Beispiel wurde an 28 Plätzen gemessen. die Grafik zeigt, den Grundriss des Raumes, die roten Stellen sind für die jeweilige Frequenz laut, die grünen leise. Bei 44 Hz und 140 Hz bauen sich deutliche Raumresonanzen auf, einmal quer und einmal längs. Die 44 Hz Resonanz verhält sich nicht "lehrbuchhaft": auf der rechten Seite ist sie kaum sichtbar. Der Raum hat dort zwei dünne Glastüren, die offenbar akustisch günstig sind. In den nächsten Schritten sollte untersucht werden, welche anderen Lautsprecher Aufstellungen oder Ansteuerungen das Bild verbessern. Klar erkennbar ist, dass der grün / blaue Bereich kaum durch mehr Leistung verbessert werden kann: Für die erforderliche Erhöhung des Schalldrucks um ca. 10 dB müsste die Leistung verzehnfacht werden, womit der Bass in anderen Raum- und Frequenzbereichen (und außerhalb des Raumes) unerträglich würde.

Details zur Messung

Die Messung sollte sich in einem Raster in Ohrhöhe über die gesamte Grundfläche des Raumes erstrecken. (Später bei der Auswertung zeigt das Diagramm so den Grundriss des Raumes.) Die App bestimmt dabei die Mikrofonpositionen automatisch anhand der Schall Laufzeiten. So werden die horizontalen Moden mit ihren jeweiligen Maxima sichtbar. Je deutlicher das Maximum an einer bestimmten Stelle hervortritt, desto wirkungsvoller ist Dämmung an genau dieser Stelle. Man erhält also konkrete Vergleichswerte, was Dämmung an einer bestimmten Stelle bewirken kann und ist weniger auf Intuition und Vermutungen angewiesen.

Als Maschenbreite hat sich 1 m bewährt. Schwankungen in kleinerem Maßstab sollten, wie oben beschrieben als Trends verstanden werden. Man kann sich die Mühe sie einzeln zu vermessen also sparen.

Die Messung erfolgt über den rechten und linken Kanal getrennt. Wenn Subwoofer eingesetzt werden, sollten sie angesteuert werden "wie immer". Auch bei Stereo Aufnahmen ohne gesonderten Bass (LFE) Kanal kann der Bassbereich allerdings (teilweise) monophon abgemischt sein. Dadurch können Verstärkungen und Auslöschungen zwischen beiden Lautsprechern entstehen, die durch weitere Messungen, bei denen mehrere Lautsprecher gleichzeitig angesteuert werden, erfasst würden. Nach meinen persönlichen Erfahrungen endet man damit allerdings schnell im "Fluch der vielen Parameter", wenn man keine fest Vorgehensweise befolgt. Ein Vorschlag hierzu findet sich in der Dokumentation zur App "Subwoofer Optimizer".

Details zur Auswertung

Oberhalb des Diagramms befindet sich ein Slider zur Auswahl der Frequenz. Der Umschalter "Alle Frequenzen" vs. "Raummoden" links daneben steuert das Verhalten des Sliders. "Alle Frequenzen" ermöglicht die freie Auswahl der Frequenz, "Raummoden" bietet einige "besonders verdächtige" Frequenzen mit großen Pegelunterschieden je nach Raumposition gezielt an.

Falls mehrere Kanäle (R, L...) oder mehrere Lautsprecheraufstellungen gemessen wurden, wird im unteren Bereich eine entsprechende Auswahlmöglichkeit eingeblendet:

All speakers (max. SPL of ...) zeigt einen ersten Überblick. Raummoden sind erkennbar, egal durch welchen Lautsprecher in welcher Position sie angeregt werden. Die App verwendet für jeden Mikrofonplatz alle Messungen (rechter und linker Kanal, ggf. mehrere Lautsprecheraufstellungen) und zeigt den maximal gemessenen Schalldruck an. (Die Messungen sind automatisch gegeneinander eingepegelt.)
All positions of spkr. ... funktioniert wie der erste Punkt, beschränkt sich aber auf den jeweiligen Kanal (nur rechter und nur linker Kanal). So kann ermittelt werden, ob bestimmte Moden durch einen einzelnen Lautsprecher angeregt werden.
Single pos. of spkr. ... beschränkt sich schließlich auf eine Aufstellung eines bestimmten Lautsprechers. So kann ermittelt werden, ob bestimmte Moden durch einen einzelnen Lautsprecher in einer bestimmten Aufstellung angeregt werden.

Die Impulsantwort - technischer Background

Frequenzgang und Impulsantwort sind zueinander Fourier transformiert. In den Beispielen oben wurden sowohl im Frequenz- als auch im zeitlichen Bereich Filter eingesetzt. Die Fourier- und Hilbert-Transformierte dieser Filter erzeugt Artefakte, die nicht mit den physikalischen Eigenschaften des untersuchten Systems vermischt werden dürfen: Filter im Frequenzbereich sind im zeitlichen Bereich als eine Art Einschwingvorgang zu sehen und umgekehrt. Das wird als Filterklirren bezeichnet und tritt auch bei linearen Systemen auf, hat also technisch gesehen einen anderen Ursprung als das "normale Klirren" durch Nichtlinearitäten.

Die Beispiele wurden in der App generiert, indem das gemessene Mikrofon-Signal durch den Logsweep ersetzt wurde. Es wurde damit ein ideales System simuliert, das den Logsweep exakt wiedergibt. Die Filterung der Impulsantwort erfolgt in der Ansicht [IMP RESP] durch Aktivieren von [FILTER]. In einigen Fällen wurde der Logsweep zusätzlich per Wave-Editor bearbeitet (siehe Tabellen).

Die folgende Tabelle zeigt Artefakte, die durch verschiedene Sampleraten und die Begrenzung des Frequenzgangs bei 20 kHz entstehen:

Impulsantwort	Zoom auf Anfangsbereich	Lineare Darstellung	zugehöriger Frequenzgang
Bilder zum Vergrößern anklicken

Spalte 1: Die Filterung der Impulsantwort erfolgt in der Ansicht [IMP RESP] durch Aktivieren von [FILTER]. Spalte 2: Impulsantwort für Input = Logsweep. Ausschnitte mit vergrößerter Zeitachse und verschiedenen Sampleraten. Spalte 3: Analoges Bild bei niedrigerer Frequenz unter Verwendung eines Filters in der App. Spalte 4: Logarithmische Darstellung derselben gefilterten Daten mit Nachhallzeit.

Die Impulsantwort zeigt in der normalen Ansicht kaum erkennbare, aber nach Zoom der Zeitachse deutliche Ausschläge mit ca. 0.05 ms Periodendauer, also grob 20 kHz. Diese hängen nicht von der Samplerate ab. Es ist nur zu erkennen, dass das Bild bei 192 kHz klarer wird. Die ungeglättete Hilbert-Transformierte (ETC für Energy Time Curve) bildet die Einhüllende.

Zum Vergleich wurden mehrere Filter mit verschiedener Steilheit bei 50 Hz gesetzt. Hier zeigt sich ein analoges Bild in der entsprechenden Zeitskala. Das sichtbare Artefakt ist also höchstwahrscheinlich auf den bei 20 kHz begrenzten Frequenzgang zurückzuführen. Ein ideales Filter, das an der Kreisfrequenz $\omega_g$ schlagartig abregeln würde, hätte die Impulsantwort $\sin(\omega_g t)/t$ und die Null-Durchgänge lägen etwas weiter außen bei 10 ms (Websuche: si-Filter, Küpfmüller–Tiefpass). Die hier eingesetzten Filter haben eine endliche Bandbreite und klingen deshalb schneller ab. Einer Roloff-Bandbreite von 1/3 Oktave lässt die Impulsantwort nach 5 bis 10 Perioden auf ein nicht mehr störendes Maß abklingen. Um diese zusätzliche 1/3 Oktave abzudecken, müssten die Messdaten bis 25 kHz gehen.

Fazit: Schwingungen im Bereich der Roloff-Frequenz sind Artefakten und kein Indiz für Defekte oder Ungenauigkeiten im verwendeten Equipment oder Folgen wunderlicher "abgestuft reflektierenden" Gegenstände. Falls sie bei der Untersuchung von Reflexionen auftreten sollte man sie entsprechend einordnen und sich nicht stören lassen. Zu Beseitigung wäre ein Roloff deutlich über den 20 kHz Bereich hinaus nötig. Da übliche Messungen dort keine Daten liefern, ginge das nur mit rechnerischen Kunstgriffen.

Das vierte Bild zeigt dieselben Daten logarithmisch (in dB) und den zugehörigen T60-Wert. Auch wenn die verwendete Impulsantwort eine Nachhallzeit von nahezu Null hat, ist die berechnete Nachhallzeit nach der Filterung nicht Null. T20 (d.h. T60 ermittelt aus einem Abfall von 20 dB) hat im Bild bei 1 Oktave Bandbreite und 50 Hz Eckfrequenz den Wert 150 ms. Bei einer Bandbreite von 1/6 Oktave steigt der Wert auf 327 ms. In der Praxis kann bei zu eng gesetzten Filtern das Filterklirren in die Größenordnung des Nutzsignals kommen [Goertz 2020]. Das darf bei der Untersuchung enger Frequenzbänder nicht vergessen werden.

Verschiedene Lautsprecher und Räume

	Beschreibung	Frequency und Implse Response - Bild zum Vergrössern anklicken	Hifi-Apps Ergebnis und Kommentar
PC R5x5	Kleine PC Lautsprecher auf einem Tisch in einem nahezu ungedämmten quadratischen Raum (5m x 5m).		2019-08-29_INT.PCSPKR.WZ5X5 (Deutsch)
PC OFFICE	Kleine PC Lautsprecher im Büro.		2019-08-13_TAB_PC_SPKR_CABLE_CONNECTED LIST_2019-08-13_TAB_PC_SPKR_BT_CONNECTED
GAUS + ABSORBER	Modularer Eigenbau mit Plasma Hochtönern (Magnat MP 02) - Dämmung mit aktustischen Vorhägen.		LIST_2019-08-19_INT.GAUS.VORH.OFFEN LIST_2019-08-19_INT.GAUS.VORH.ZU LIST_2019-08-19_AUDIX.GAUS.VORH.OFFEN LIST_2019-08-19_AUDIX.GAUS.VORH.ZU.
ML + ABSORBER	Dipol Lautsprecher (Martin Logan ESL 9)		2019-09-22_ML_INT_XXX
QU50 LIV	Standlautsprecher (Quadral Chromnium Style 50) in 5m x 7m grossem durchschnittlich möbliertem Raum		LIST_2019-06-11_AUDIX.WZ.STR-GTN LIST_2019-06-11_INT.WZ.STR-GTN.
QU30 BA	Kein worst case Szenario: Quadral Chromnium Style 30 in einem Badezimmer.		LIST_2019-10-17_INT_QUADRAL_BAD
QU30 R5x5	Künstliche Provokation von Bodenreflexionen (rechter Lautsprecher zum Boden geneigt)		LIST_2019-10-17_AUDIX_W5_FB. LIST_2019-10-17_INTW5_FLOORBOUNCE.
MARTION	Hornlautsprecher MARTION Bullfrog aktiv		LIST_2019-10-30_MARTION_BULLFROG

Literatur

[Blauert 1974, Wikipedia] Wikipedia Artikel "Blauertsche Bänder": https://de.wikipedia.org/wiki/Blauertsche_B%C3%A4nder

[Defrance 2009] G. Defrance, L. Daudet and J-D. Polack: Using Matching Pursuit for estimating mixing time within Room ImpulseResponses. DOI:10.3813/AAA.918239 https://www.institut-langevin.espci.fr/IMG/pdf/defrance2009.pdf

[Fuchs 2019] Helmut Fuchs, Vortrag TU-Berlin 2019.

[Goertz 2020] Anselm Goertz: Seminat "Studioakustik und Monitorlautsprecher" 2020 TU-Berlin.

[IRZU FFT WAVELETS] IRZU, Research - Category: FFT & WAVELETS https://irzu.org/category/research/fft-wavelets/

[Møller 1974] Møller, Henning: Relevant loudspeaker tests in studios inHi-Fi dealers' demo rooms in the home etc. using 1/3 octave, pink-weighted, random noise. 47th Audio Engineering Society Convention, 1974-02-26/29, Copenhagen (Denmark), https://www.bksv.com/media/doc/17-197.pdf

[Toole 2015] Toole, Floyd E: The Measurement and Calibration of Sound Reproducing Systems, in: Journal of the Audio Engineering Society 63(7/8):512-541, August 2015, http://www.aes.org/e-lib/download.cfm/17839.pdf?ID=17839

[Usher 2010] John Usher: "An improved method to determine the onset timings of reflections in an acoustic impulse response". The Journal of the Acoustical Society of America 127, EL172 (2010); https://doi.org/10.1121/1.3361042 https://asa.scitation.org/doi/10.1121/1.3361042

[Zehner Ringversuch] Markus Zehner: Ringversuch Nachhallzeit http://www.zehner.ch/lab/ringversuch4.html

[Protheroe 2013] Daniel Protheroe, Bernard Guillemin: "3D impulse response measurements of spaces using aninexpensive microphone array". Toronto, Canada International Symposium on Room Acoustics 2013 http://www.iris.co.nz/media/14459/ISRA2013.pdf

Frequenzgang, Impulsantwort, Phase usw. verstehen