top of page

Psychoakustik & Hörphysiologie

Das auditorische System

Das menschliche Ohr ist ein feinfühliger und empfindlicher Druckempfänger und kann in die Bereiche Außenohr, Mittelohr und Innenohr eingeteilt werden. Der Schall gelangt durch das Außenohr, also die Ohrmuschel und den äußeren Gehörgang zum Trommelfell, das das Außenohr vom Mittelohr trennt und aus Schutzgründen durch den äußeren Gehörgang in das innere des Schädels verlagert ist. Das Trommelfell ist eine dünne Membran aus faserigem Gewebe, die durch den Schalldruck in Schwingung versetzt wird. Im Mittelohr überträgt ein Hebelsystem aus den drei Gehörknöchelchen Hammer, Amboss und Steigbügel die Schwingung an das ovale Fenster und passt die Kraft des Schalldrucks an die Empfindlichkeit des Innenohrs an. Hier können der Hammer- und Steigbügelmuskel den Schalldruck ab ca. 70 bis 80 dB(SPL) um 6 bis 10 dB dämpfen. Um einen Druckausgleich zu ermöglichen, verbindet die Eustachische Röhre das Mittelohr mit der Mundhöhle. Im Innenohr befindet sich neben den Bodengängen (Gleichgewichtsorgan) die Gehörschnecke, ein schneckenförmiger Hohlraum im Felsbein, der aus drei mit Flüssigkeit gefüllten Kammern besteht: Vorhoftreppe, Schneckengang und Paukentreppe. Zwischen Schneckengang und Paukentreppe befindet sich die Basilarmembran, die das Corti-Organ trägt. Die darin befindlichen Haarzellen werden bei unterschiedlichen Frequenzen an unterschiedlichen Stellen besonders stark angeregt und in Resonanz versetzt. Das Ohr zerlegt hier sozusagen die komplexe Schwingung in unterschiedliche Einzelfrequenzen und überträgt diese Informationen über spezifische Hörnervfasern an das Gehirn.

 

Musik und Klang löst beim Menschen Emotionen aus, weckt Erinnerungen, regt uns an oder wirkt beruhigend zugunsten unseres allgemeinen Wohlbefindens. Was genau im Gehirn bei der klanglichen Rezeption passiert, wird schon lange wissenschaftlich untersucht. Nachdem der Hörnerv einen Schalleindruck zunächst an den Hirnstamm weitergeleitet hat, gelangt er von dort in den auditorischen Cortex. Doch er ist nicht der einzige Bereich, der bei der Schallwahrnehmung eine Rolle spielt: Die Involvierung eines der beiden Sprachzentren (Broca-Areal), motorischer und visueller Areale, des limbischen System zur Emotionsverarbeitung und des Belohnungssystems zeigt: Klang und Musik verbindet unsere Gehirnareale. Es kommt zur Ausschüttung von Endorphinen, also körpereigenen Glückshormonen, und des Neurotransmitters Dopamin, der im Gehirn von großer Bedeutung für das Belohnungssystem ist, sowie zu einer Abnahme des Stresshormons Cortisol. Gemeinsames Musizieren erhöht zudem die Ausschüttung des Bindungshormons Oxytocin. Neben diesen positiven chemischen Effekten haben Klang und Musik dank der Neuroplastizität auch strukturellen Einfluss auf unser Gehirn, denn auditive Reize sorgen für eine Neuverschaltung von Nervenzellen, sodass Hirnareale besser miteinander vernetzt sind, und regen die Ausprägung des Corpus Callosums, also der Verbindung zwischen den Hirnhälften, an.

 

Richtungshören

Damit sich der Mensch in seiner Umgebung zurechtfinden kann, kann er Schallquellen sehr genau orten. Das Richtungshören ist ein komplexer Vorgang, der sich aus der Analyse dreier Parameter zusammensetzt: interaurale Zeitdifferenzen, interaurale Schalldruckdifferenzen und die Klangfarbe.

Interaurale Zeitdifferenzen beschreiben zeitliche Unterschiede, wann ein Signal zuerst auf das eine Ohr und dann auf das andere trifft. Dafür vergleicht das Gehirn die Phase zwischen dem linken und dem rechten Ohr sowie die Hüllkurven der Schwingungen, also den Lautstärkenverlauf. Dieser Mechanismus alleine würde die Gefahr einer Fehlortung bergen, da man ein und derselben Zeitdifferenz immer zwei mögliche Winkel zuordnen kann (z.B. -45° und -135°). Eine vertikale Positionsortung ist nicht möglich – man kann also nicht unterscheiden, ob eine Schallquelle von oben oder von unten auf die Ohren treffen. Das Gehirn kann also nur einen zweideutigen horizontalen Winkel errechnen.

 

Interaurale Schalldruckdifferenzen werden vom Gehirn erkannt und können Aufschluss darüber geben, auf welches Ohr das Signal zuerst getroffen ist, weil dort ein erhöhter Schalldruck vorkommt. Bei Schallwellen von einer Frequenz ab 1,6 kHz werden Abschattungen relevant, die der Kopf erzeugt: Kommt ein Schallsignal von links, kann sich der Schall ab dieser Frequenz nicht mehr vollständig um den Kopf herumbeugen, sodass bei diesem seitlichen Einfall der Schalldruckunterschied deutlich wahrgenommen werden kann. Genauso wie bei der oben beschriebenen Analyse der interauralen Zeitdifferenzen ist über diese Methode nur eine links/recht-Unterscheidung möglich und es können keine sicheren Informationen über eine Schallherkunft von oben/unten bzw. vorne/hinten abgeleitet werden.

 

Der Klangfarben-Abgleich ist der wichtigste Mechanismus für die Ortung einer Schallquelle. Hier geht es -  anders als zuvor beschrieben - nicht um einen interauralen Vergleich der Schalleindrücke, sondern vielmehr um einen Abgleich der (monaural) erfassten Klangfarbe mit einem gelernten, im Gehirn abgespeicherten Korrelationsmuster. Durch diesen komplexen Vorgang ist auch eine Unterscheidung bezüglich oben/unten sowie vorne/hinten möglich. Die Form des menschlichen Kopfes, vor allem die der Ohrmuscheln, bewirkt Abschattungseffekte, Reflexionen und Resonanzen am Schädel und Außenoh und beeinflusst damit die Klangfarbe eines Schallsignals auf spezifische Art und Weise, je nachdem aus welcher Richtung der Schall eintrifft und das Trommelfell erreicht. Manche Frequenzen werden abgesenkt und andere verstärkt. Diese Filterwirkung des Kopfes wird durch die Head-Related Transfer Function (HRTF) beschrieben. Die spezifischen Klangfärbungen nehmen wir nicht bewusst wahr, sondern entnehmen ihnen relevante Richtungsinformationen. Dass diesem vergleichenden Vorgang ein Lernprozess vorausgehen muss, ist der Grund dafür, warum Kinder über ein schlechteres Richtungshören verfügen als Erwachsene. Nach dem Assoziationsmodell von Theile untergliedert sich der Analyseprozess der Schallrichtung anhand der Klangfarbe in zwei Stufen, die richtungsbestimmende Stufe (in der durch Musterabgleich der Einfallswinkel bestimmt wird) und der gestaltbildenden Stufe (in der nach der Inversion der HRTF die eigentliche Klangfarbe ermittelt wird).

 

Entfernungshören

 

Faktoren, die das Einschätzen der Entfernung einer Schallquelle ermöglichen, sind die Lautstärke, Klangfarbe (entfernungsbedingter Abfall von Frequenzen, Einfluss der Luftabsorption, …), das Pre-Delay (also der zeitliche Abstand zwischen Direktsignal und erster Reflexion), der Hall-Anteil und nicht zuletzt die Erfahrung, mit der alle Eindrücke abgeglichen werden.

 

Maskierungseffekt

Der Maskierungseffekt sorgt für akustische Verdeckung. Es gibt die spektrale Maskierung und die zeitliche Maskierung.

Bei der spektralen Maskierung können wir einen Ton nicht hören, wenn zeitgleich ein lauterer Ton im gleichen Frequenzbereich erklingt.

 

Hintergrund: Die Ruhehörschwelle ist derjenige Schalldruckpegel, bei dem das menschliche Gehör Geräusche gerade noch wahrnehmen kann. Dies ist frequenzabhängig: Für tiefe und sehr hohe Frequenzen liegt die Ruhehörschwelle hoch, während sie für mittlere Frequenzen relativ tief ist. Eine Ruhehörschwellenkurve zeigt also an, ab welchem Schalldruck eine bestimmte Frequenz für uns hörbar wird, wenn ansonsten Ruhe herrscht.

 

Wenn mehrere Schallereignisse aufeinandertreffen, setzt ein vorhandenes Ereignis die Empfindlichkeit für neu auftretende Schallereignisse herab. Es ergibt sich eine neue Hörschwelle, die abhängig ist von der Lautstärke und dem Frequenzspektrum des bestehenden, maskierenden Schallereignisses: Die Mithörschwelle. Liegt ein Schallsignal unterhalb dieser Mithörschwelle des Maskierers, so ist er aufgrund totaler Maskierung nicht hörbar. Zu einer partiellen Maskierung kommt es dann, wenn ein Schallsignal auf oder nur wenig oberhalb der Mithörschwelle liegt. Bei tiefen Frequenzen ist der Maskierungseffekt im Allgemeinen stärker als bei hohen Frequenzen.

 

Bei der zeitlichen Maskierung erklingt ein lauterer Ton nicht zeitgleich, sondern mit zeitlichem Versatz, entweder vorher oder nachher. Beim Premasking wird ein Ton maskiert, weil kurz nachher (maximal 20 ms) ein Ton erklingt, der einen höheren Schalldruckpegel hat. Grund hierfür ist, dass ein Schallsignal von höherer Amplitude vom Gehirn schneller verarbeitet wird als ein leises Signal. Beim Postmasking wird ein Ton maskiert, weil kurz vorher ein lauterer Ton erklungen ist. Dieser Effekt tritt bis zu 200 ms nach Ende des maskierenden Schallereignisses auf. Die zeitliche Maskierung ist wie die spektrale Maskierung frequenzabhängig.

bottom of page