Ugrás a tartalomhoz

Általános pszichológia 1-3. – 1. Észlelés és figyelem

Csépe Valéria, Győri Miklós, Ragó Anett

Osiris Kiadó

11. fejezet - 9. FEJEZET– Egyetlen hang észlelése – a szubjektív hang

11. fejezet - 9. FEJEZET– Egyetlen hang észlelése – a szubjektív hang

A hangok szubjektív észlelésének tanulmányozásával a pszichoakusztika tudománya foglalkozik. Pap János (2002) szerint a hangok észlelése kapcsán két alapvető „posztulá- tumot” kell elfogadnunk:

  1. Mindenki azt hall, amit hall. Valójában nincs módunk arra, hogy közvetlenül tudomást szerezzünk arról, hogy mások hogyan észlelik a környezet hangjait, nem tudhatjuk meg, hogy milyen élményt vált ki bennük egy hang meghallása. Vannak viszont közvetett módszerek, és lényegében a pszichoakusztika tudománya azzal foglalkozik, hogy minél pontosabb és jobb eszközöket és módszereket fejlesszen ki annak érdekében, hogy közelebb kerüljünk mások akusztikai élményeinek megismeréséhez.

  2. A szubjektív hang paraméterei kölcsönhatásban vannak egymással. Mint arról az előző fejezetben már szó volt, a hangok többféle paraméterrel (pl. hangosság, hangmagasság) rendelkeznek. Ebben a fejezetben azt fogjuk bemutatni, hogy miként lehetséges az, hogy a hangokat nem különálló fizikai jellemzőik révén, hanem egységes egészként észleljük, és hogy az egyes ingerdimenziók megváltozása magával vonja a többi észleletének megváltozását. Egy hétköznapi példa erre, amikor operaénekeseket hallgatunk, és egyikük énekét jóval hangosabbnak észleljük, mint a másikét. Ha ez fizikailag is így van, észlelőrendszerünk rendben követi a hangosságeltérést. Próbáljuk meg viszont azt a helyzetet értelmezni, amelyben mindketten azonos hangossággal, azaz műszeresen kimérve azonos decibelértékű, mondjuk 80 dB intenzitással énekelnek, és mégis, egyikük hangját hangosabbnak halljuk. Ez úgy következhet be, hogy az egyik énekes nagyobb erőfeszítéssel, a gégefedő fokozottabb lenyomásával éri el a hangosságnövekedést. Ennek következtében hangjában a magas részhangok aránya megnő, így a magas hangok összetételének megváltozása miatt hangosabbnak halljuk az ő énekét, miközben a fizikai hangosság azonos. Ezzel ráadásul még az is együtt járhat, hogy a szöveg érthetetlenné válik, hiszen a magánhangzók frekvencia-összetevői feljebb, egymáshoz közelebb csúsznak, és a magán hangzó-kategóriák megfelelő észlelése lehetetlenné válik. Minderről később, a beszédhangok észlelésével foglalkozó 11. fejezetben bőven lesz szó.

A pszichoakusztikai ismeretek azonban nem csak arra jók, hogy többet tudjunk arról, hogyan is működik az emberi észlelés. A mérnöki és számítástechnikai tudományok egyre több területen használják ki ezeket az ismereteket, és a hangok fizikai jellemzőinek vizsgálata helyett egyre inkább arra figyelnek, hogy valójában mit is hallanak az emberek (lásd az mp3 formátumról szóló szövegdobozt). Ennek a fejezetnek tehát a hangok szubjektív észlelése lesz a témája. Miután az eddigiekben megtanultuk, hogy milyen információt dolgoz fel a hallórendszer, és ehhez milyen anatómiai és élettani eszköztár áll a rendelkezésére, most arra leszünk kíváncsiak, hogy vajon mit hallanak valójában az emberek. Látni fogjuk, hogy a hangok és az azokat feldolgozó mechanizmusok jellemzői önmagukban nem határozzák meg azt, hogy mit is észlelünk. Azt is mondhatjuk, hogy a hallórendszer szerkezete és működése csak egyfajta megszorítást jelent: szükséges, de nem elégséges feltétele a hallási élménynek.

A fejezetben két nagy témával foglalkozunk: a hangosság észlelésével és a hangmagasság észlelésével. Ezt kiegészíti még a hallórendszer frekvenciaszelektivitásának és a hangszín észlelésének a tanulmányozása.

A hangosság észlelése

Az emberi fül érzékenysége csodálatra méltó: az általunk észlelhető hangok tartománya 0-130 dB közötti, ami 1 : 1012 intenzitásaránynak felel meg. A hangosság észlelése kapcsán az első kérdés az lesz, hogy hogyan képes feldolgozni a hallórendszer egy ilyen óriási hangerőtartományt. Ugyanakkor tudjuk azt is, hogy egy hang észlelt hangossága szubjektív élmény. Definíció szerint a hangosság a hallási észlelésnek az a jellemzője, amelynek alapján a hangokat hangosságuk mentén egy skálán sorba tudjuk rendezni a halk hangoktól a hangos hangokig. Ebből fakad a második kérdés: mi határozza meg valójában a hangosság észlelését? Ha az utca emberét megkérdeznénk arról, hogy mitől lesz egy hang hangosabb egy másiknál, akkor természetesen azt válaszolná, hogy attól, hogy az nagyobb hangerővel rendelkezik. Sőt valószínűleg azt is meg tudná mondani, hogy hogyan tudja elérni azt, hogy a rádióból szóló zene hangosabb legyen: egyszerűen felcsavarja a hangerőgombot.

Látni fogjuk azonban, hogy egy hang hangosságát nem csak az intenzitása vagy hangereje befolyásolja. Mint az operaénekes-példából kitűnhetett, a hang frekvenciája legalább olyan fontos szerepet játszik a hangosság élményének kialakulásában, mint az, hogy milyen hangerővel, fizikai értelemben véve, milyen hangnyomással rendelkezik.

A hangosság észlelésének tartománya

Az abszolút küszöb

A hallható hangok tartományának alsó határát úgy határozhatjuk meg, hogy megmérjük azt a legkisebb intenzitást, ami ahhoz szükséges, hogy egy adott frekvenciájú hangot éppen meghalljunk. Ezt az éppen detektálható intenzitást nevezzük a hang abszolút küszöbének. Egy ilyen mérést nagyon csendes környezetben kell elvégezni, és érdemes arra is odafigyelni, hogy fülhallgatón vagy hangszórón keresztül adjuk-e a hangokat, ugyanis a kettő között jelentős különbségek lehetnek (akár 2dB eltérés is, lásd Moore 1997).

Ha sok személy sok különböző frekvencián mutatott abszolút küszöbét megmérjük, és ezeket ábrázoljuk, akkor a 9.1. ábrán látható görbét, az úgynevezett hallhatósági függvényt kapjuk.

9.1. ábra. Hallhatósági függvény

A hallhatósági függvény tehát az egyes frekvenciák függvényében ábrázolja a hallási küszöböket. Fontos kiemelnünk, hogy a görbe egyénileg eltérő lehet, hiszen nem egy fizikai összefüggést, hanem egy szubjektív élményt jelenít meg, nevezetesen azt, hogy a kísérleti személy egy adott szituációban hallott-e egy hangot vagy sem. Természetesen, mivel a hallhatósági függvény sok ember átlagolt válaszaiból készült, ezért nagyjából mindenkinél hasonló lesz. Ugyanakkor az is teljesen normális, ha valakinél ±20 dB-nyi eltérés tapasztalható valamelyik frekvencia esetén.

Ahogy az ábrán látható, a hallhatósági függvény egy U alakú összefüggést ábrázol a frekvencia és az intenzitás között: az alacsony és a magas frekvenciák esetében a hallási küszöb magas, a középső frekvenciák esetén viszont alacsony. A görbéről az is leolvasható, hogy leginkább az 1-4 kHz-es (1 kHz = 1000 Hz) tartományra vagyunk érzékenyek. Ez a tartomány kitüntetett jelentőségű a hallási észlelésben: a beszédhangok és a zenei hangok frekvenciájának jelentős része is ebbe a tartományba esik. A hallhatósági függvény az életkorral változik: a magas hangokra mutatott érzékenység csökken. Kisgyerekek képesek akár a 20 kHz-es hangokat is detektálni, egy átlagos felnőtt azonban 15 kHz felett már nem hall hangokat, és időskorban ez az érték akár a beszédhangok tartományát is elérheti (lásd A hangosság észlelésének problémái, 279. sk.).

A pszichofizika korábbi tárgyalása során nemcsak az abszolút küszöbről, hanem a különbségi küszöbről is tanultunk. Mint tudjuk, a különbségi küszöb azt fejezi ki, hogy mennyivel kell megváltoztatnunk az inger intenzitását ahhoz, hogy ez változást okozzon az inger észlelésében. A hangerő kapcsán két eljárás is létezik a különbségi küszöb mérésére: az egyik esetében közvetlen nagyságbecslés révén állapítjuk meg a hangok hangosságát, a másikban viszont a hangossági szinteket mérjük. A továbbiakban ezt a két eljárást és a segítségükkel kapott eredményeket tekintjük át.

A hangerő közvetlen nagyságbecslése

A hangok észlelt hangosságának megállapítására az egyik leggyakrabban alkalmazott módszer a közvetlen nagyságbecslés. A módszer Stevens (1957) nevéhez fűződik. A hangosság nagyságbecslésére két különböző eljárást is alkalmaznak. Az egyikben különböző hangosságú hangokat adnak a kísérleti személyeknek, és arra kérik őket, hogy rendeljenek számokat ezekhez a hangokhoz aszerint, hogy milyen hangosnak hallják őket. Vagyis, ha például egy 80 dB-es hangot 10-zel jelöltek, akkor csak az a lényeges, hogy egy ennél hangosabb hang 10-nél nagyobb értéket, egy halkabb hang pedig 10-nél kisebbet kapjon. A másik típusú feladatban, ami egy produkciós feladat, a személyeknek az a dolguk, hogy egy hang hangerejét úgy állítsák be, hogy az megfeleljen egy előre meghatározott másik hang hangosságának, illetve egy annál bizonyos mennyiséggel hangosabb szintnek (kétszer, négyszer stb. hangosabb vagy halkabb legyen).

Bármelyik módszert használjuk is, egy olyan általános összefüggést kapunk a hang intenzitása és az észlelt hangosság között, amely szerint a hangosság a hangerővel együtt, de annál lassabban növekszik. pontosabban, ahogyan azt stevens is leírta, a hangok észlelt hangossága és fizikai intenzitása között hatványösszefüggés van. Ezt az összefüggést az alábbi képletben foglalhatjuk össze:

Φ = k Ψ0,67,

ahol $ az inger észlelt hangossága, W az inger intenzitása, k pedig egy olyan állandó (konstans, innen a k), amely a személytől és a használt mértékegységtől is függ. Vagyis a hatványösszefüggés szerint egy adott hang hangossága arányos a hang intenzitásának 0,67. hatványára emelésével.

Stevens bevezetett egy mérőszámot is a hangosság mérésére, mégpedig a s o n t. A definíció szerint 1 son egy 1000 Hz-es és 40 dB-es hang hangosságát jelöli, és értékét úgy választották meg, hogy az 1 son különbség körülbelül 10 dB-nyi intenzitásbeli különbségnek, vagyis a hangerő megduplázódásának feleljen meg. Eszerint tehát egy 2 son hangosságú, 1000 Hz-es hang kétszer olyan hangos, mint az 1 sonos hang, és hangereje 50 dB.

A hangok hangosságának és intenzitásának hatványösszefüggését Ste- vens eredeti vizsgálata óta sokan alátámasztották. Több kritika is felmerült az eredményekkel kapcsolatban. Ezek elsősorban arra vonatkoztak, hogy a mérés során több torzító hatás is felléphetett.

Poulton (1979) szerint az alábbi tényezők befolyásolhatják az eredményeket:

  • a használt ingerek tartománya,

  • a bemutatott ingerek sorrendje,

  • a kísérleti személynek adott instrukció,

  • a megengedett válaszok típusa,

  • a válaszok szimmetrikussága,

  • egyéb faktorok, amelyek a személy motivációjával, tapasztalatával, figyelmével stb. vannak összefüggésben.

Általános tapasztalata a vizsgálatoknak az is, hogy rendkívül nagy egyéni variabilitás tapasztalható az eredményekben: egy-egy személy eredményeit figyelembe véve nem feltétlenül kapjuk meg a Stevens-féle „ideális” hatványösszefüggést, azt valójában csak nagyon sok személy átlaga adja ki. Mindezek az eredmények megkérdőjelezik a hatványfüggvény megbízhatóságát.

A hangossági szintek

A különbségi küszöbök megállapításának másik módja a hangossági szintek mérése. Ez a módszer a nagyságbecslési módszerrel szemben sokkal megbízhatóbb eredményeket hozott, olyannyira, hogy ma már szigorú követelményeknek megfelelő ISO- (International

Organization for Standardization – Nemzetközi Szabványügyi Szervezet) szabályozás is létezik ezzel kapcsolatban (ISO 226: 2003).

A hangossági szintek megállapításához azt kérjük a kísérleti személytől, hogy állítsa be egy 1000 Hz-es hang hangosságát úgy, hogy az ugyanolyan hangos legyen, mint a tesztinger. A hangokat felváltva adjuk, és minden esetben az a személy feladata, hogy az 1000 Hz-es hang hangerejét változtatva a teszthanghoz hasonlóvá tegye. Azt a hangerőszintet, amelyen az 1000 Hz-es hang a teszthanggal megegyezően észlelt hangosságú, a teszthang hangossági szintjének nevezzük, és egy speciális mértékegységben, a phonban mérjük. Definíció szerint egy 1000 Hz-es hang hangossági szintje megfelel a dB SPL-ben mért hangerő szintjének. Ezek szerint egy 10 dB SPL hangerejű 1000 Hz-es frekvenciájú hang 10 phon hangossági szintnek felel meg. Minden más frekvenciájú hang, amely szubjektív hangosságát tekintve megegyezik a 10 dB SPL hangerőszintű 1000 Hz-es hanggal, szintén 10 phonos lesz, függetlenül attól, hogy pontosan hány dB hangerővel szólal meg. Ha ezt az eljárást megismételjük sok eltérő frekvenciájú hanggal, akkor egy egyenlő hangosságú szintvonalat kapunk. Természetesen sok különböző hangossági szintet állapíthatunk meg, minden esetben úgy, hogy az 1000 Hz-es hanghoz viszonyítjuk a többi hang hangosságát (lásd 9.2. ábra).

9.2. ábra. Egyenlõ hangosságú szintvonalak

Az egyenlő hangosságú szintvonalat egyszerűen úgy értelmezhetjük, hogy az azon fekvő hangokat azonos hangosságúnak észleljük. Ha azonban szemügyre vesszük a 9.2. ábrát, amely a frekvencia függvényében tünteti fel a hangerőértékeket, láthatjuk, hogy az azonos hangosságú hangok valójában egy görbén helyezkednek el. próbáljuk az ábrán megkeresni a 10 phonnak megfelelő szintvonalat. Ha most ezt a vonalat végigkövetjük a különböző frekvenciákra, akkor azt tapasztaljuk, hogy szinte minden frekvencia esetén eltérő hangerőérték mellett kapjuk meg az azonos hangosságot. Tegyünk egy próbát, hogy értjük-e a phonskála működését: keressük meg a 9.2. ábrán a 20 phonos szintvonalat. Most próbáljuk megállapítani, hogy egy 100, 1000 és 10 000 Hz-es hangnak milyen hangerővel kell szólnia ahhoz, hogy egyformán 20 phon hangosságúnak halljuk őket? Az 1000 Hz-es hangot könnyű kitalálni: definíció szerint ez 20 dB-nél lesz 20 phon. A 100 Hz-es hang körülbelül 35 dB-nél metszi a 20 phonos szintvonalat, a 10 000 Hz-es pedig 30 dB-nél. Ha valakinek nem ez az érték jött ki, annak érdemes még egyszer átolvasnia a fentieket.

Észrevehetjük, hogy az egyenlő hangosságú szintvonalak nagyon hasonló alakot mutatnak, mint a hallhatósági függvény. Valójában a 0 phon az abszolút küszöbnek megfelelő hangossági szintet jelöli. Vagyis az egyenlő hangosságú szintvonalakra szintén jellemző, hogy a középső frekvenciatartományoknál a legjobb az érzékenység, és a nagyon mély és nagyon magas hangokra csökken az érzékenység. Ráadásul, ahogyan az a 9.2. ábrán is látszik, a különböző hangossági szintek nagyon hasonló lefutást mutatnak, de nagyon magas hangszintek esetén (110-120 phon környékén) a görbe kezd ellaposodni, és elveszíti U-alakját. Ebből arra következtethetünk, hogy magas hangerőszinteken más mechanizmusok valósítják meg a hangosság percepcióját, mivel itt úgy tűnik, hogy a hangok észlelt hangosságát kevésbé befolyásolja a hang frekvenciája, mint alacsony hangerőszintek esetén. A hangosságot kódoló mechanizmusokról a következő részben többet fogunk mondani.

Az egyenlő hangosságú szintvonalak létezésének van egy olyan következménye, amivel a hétköznapokban is gyakran találkozunk. A modern hifiberendezéseket (sőt ma már akár a televíziókat és az icipici mp3-lejátszókat is) ellátják egy equalizernek (hangszín-ki- egyenlítőnek) nevezett eszközzel. Az equalizer feladata, hogy minden egyes frekvenciasávot külön-külön tudjunk hangosítani. Az egyenlő hangosságú szintvonalakból ugyanis az következik, hogy ha minden frekvenciát ugyanolyan intenzitással szólaltatunk meg, akkor bizonyos frekvenciatartományok hangosabbak lesznek, mint mások. Ezt a fenti ábrán például úgy tudnánk szemléltetni, hogy egy a vízszintes tengellyel párhuzamos egyenest húzunk egy adott intenzitásszinten, például 80 dB-nél. Ez jelölné a hanglejátszó eszköz által kibocsátott hangerőszintet. Ha most megnézzük, hogy ez a vonal hol metszi az egyes frekvenciáknál az azonos hangosságú görbéket, vagyis milyen hangosnak halljuk azokat, akkor azt tapasztaljuk, hogy az 1000 Hz-es hangoknál ez 80 phon hangosságot eredményez, a 100 Hz-es hangoknál kb. 75 phon lesz, a 4000 Hz-es hangoknál viszont kb. 90 phon. A mély és nagyon magas hangok tehát sokkal halkabbnak fognak tűnni, mint a közepes frekvenciájúak. Mi viszont azt szeretnénk, hogy minden frekvenciatartományt hasonló hangosságúnak halljunk, és ezért a mély és magas hangokon hangosítani, a közepes frekvenciájúaknál viszont halkítani kell.

Az equalizerek használatának van még egy olyan aspektusa, amely nagyon jól illusztrálja az egyenlő hangosságú szintvonalak működését. Ez pedig a „dübörgő basszus” jelensége. Ha egy megfelelően beállított equalizernél, ahol tehát a mély (basszus) hangok a többi frekvenciánál nagyobb hangerőt kapnak, és egy viszonylag nagy általános hangerőt állítunk be, akkor az addig azonos hangossággal szóló tartományok helyett a mély tartomány sokkal hangosabbá válik. Ennek a magyarázata természetesen az, hogy a nagyobb általános hangerő egy magasabb hangossági szintre tolja el a görbéket, ahol viszont sokkal kevésbé érvényesül az U alakú összefüggés, vagyis a mély hangok sokkal kevésbé hallatszanak halknak. Ha viszont a mély hangok egy további hangosítást kapnak, akkor természetesen sokkal hangosabbnak fognak hallatszani, vagyis „dübörögnek”.

A hangosság kódolása

A következőkben azt fogjuk áttekinteni, hogy hogyan kódolja a hallórendszer a hangerőt. A 8. fejezetben láttuk, hogy hogyan valósítják meg az alaphártya szőrsejtjei a hanginger idegi impulzusokká történő átalakítását. Emlékezzünk vissza, hogy egy adott frekvenciájú hanginger az alaphártya meghatározott pontján hoz létre maximális elhajlást, és ennek következtében az ezen a ponton található szőrsejtek jönnek ingerületbe. Ezen szőrsejtek aktivitása hozza létre azt az idegi impulzust, amelyet az agy le tud fordítani észleletté. Ezzel a mechanizmussal azonban csak azt magyaráztuk meg, hogy a különböző frekvenciájú hangokat hogyan kódolja az alaphártya. De mi a helyzet a hangerővel? Milyen módon képesek a szőrsejtek a hangerővel kapcsolatos információt kódolni? A legkézenfekvőbb elképzelés ezzel kapcsolatban az, hogy a hangerőt a hallóideg kisüléseinek száma kódolja. Ez úgy képzelhető el, hogy halkabb hangok esetén az adott frekvenciát kódoló neuronok csak kismértékben tüzelnek, míg hangosabb hangok esetén magasabb tüzelési arányt mutatnak. Az idegrendszer magasabb szintű folyamatai pedig ezeket a tüzelési arányokat alakítják vissza a hangosság élményévé. Ezzel az elképzeléssel az a probléma, hogy az empirikus adatok nem igazolják. A hallóidegrostok válaszjellemzőit részletesen megvizsgálva Palmer és Evans (1979) azt találta, hogy az idegrostoknak csak nagyon kis része, mintegy 10 százaléka képes széles dinamikai tartományt kódolni, de ez a tartomány is csak mintegy 60 dB-t jelent. Ugyanakkor, mint tudjuk, legalább 130 dB-nyi hangerőtartományt kellene az idegrostoknak feldolgozni, mivel a hallásküszöb és a fájdalomküszöb között körülbelül ennyi a különbség. Mindez azt jelenti, hogy a hangerő kódolásában a kisülések számán kívül valamilyen más mechanizmus is szerepet játszik.

A nagy intenzitású hangok kódolásában részt vevő „kiegészítő” mechanizmus lehet a növekvő intenzitású hangok hatására bekövetkező aktivációsmintázat-terjedés. Megfigyelték, hogy a növekvő intenzitás hatására nemcsak azok az idegrostok tüzelnek, amelyeknek a jellemző frekvenciáját tartalmazza a megszólaló hang, hanem azok is, amelyek a hanghoz közeli jellemző frekvenciával rendelkeznek. Ennek oka egyszerűen megérthető, ha visszagondolunk arra, hogy hogyan is működik az alaphártya. Tudjuk, hogy egy adott frekvenciájú hang hatására az alaphártya meghatározott része mutat maximális mértékű elhajlást, és azt is tudjuk, hogy minél nagyobb intenzitású a hang, annál nagyobb ez az elhajlás. A nagyobb elhajlás hatására azonban nemcsak a hang frekvenciáját kódoló területhez kapcsolódó idegrostok jönnek aktivációba, hanem a szomszédos területek is (a magasabb csúcs nagyobb felülettel jár együtt, pont úgy, mintha egy gumiszalag közepét felhúznánk). Ezt az aktivációsmintázat-terjedést szemlélteti a 9.3. ábra.

9.3. ábra. Idealizált idegi aktivációs mintázat nagy intenzitás esetén (folytonos vonal).Az intenzitás növelésének hatására (szaggatott vonal) az idegi aktivitás nagysága nem változik, de több neuron kezd el tüzelni

Az ábráról leolvasható, hogy nagy intenzitású hangok esetén az aktivációs mintázat közepén található neuronok esetében az intenzitás növekedésének hatására már nem nő tovább a kisüléseik száma, vagyis telítődtek, idegen szóval szaturálódtak. Ha növeljük a hang intenzitását, akkor a szaturálódott neuronok ezt természetesen már nem képesek kódolni, ugyanakkor a nagyobb intenzitás hatására további neuronok aktiválódnak, mivel az alaphártya nagyobb része mozdul el. így ha összehasonlítjuk a két intenzitásszint által kiváltott aktivációs mintázatot, akkor láthatjuk, hogy a kisülések száma nem változik, azonban a tüzelő neuronok száma nagyobb lesz. Eszerint a nagy intenzitás kódolásában felhasználható ezeknek a további neuronoknak az aktivációs mintázata.

Az aktivációs mintázat terjedésének a hangosság kódolásában játszott szerepét olyan vizsgálatokkal bizonyították, amelyben háttérzaj jelenlétében kellett a kísérleti személyeknek hangosságmegkülönböztetési (diszkriminációs) feladatokat végezniük. A háttérzajnak maszkoló (elfedő) hatása van: zaj jelenlétében nehezebben hallhatók a hangok. Ezenkívül tudjuk, hogy a zaj olyan komplex hang, amely nagyon sok frekvencián tartalmaz hangenergiát. Különböző eszközökkel meg tudjuk szűrni a zajt, azaz csak bizonyos tartományokat tartunk meg, a többit pedig eltávolítjuk (lásd bővebben a látással kapcsolatban a színkeverésről mondottakat). Alul áteresztő szűrésnek nevezzük azt, amikor a tartomány alsó részeit tartjuk meg, és a felsőket távolítjuk el, felül áteresztő szűrésnek, amikor a felső tartományt tartjuk meg, és az alsót távolítjuk el, és sávszűrésnek nevezzük, ha mind az alsó, mind a felső tartományokból eltávolítunk bizonyos részeket, és a kettő közöttit tartjuk meg (9.4. ábra). A zaj szűrése azért fontos, mert a zaj mindig csak azokat a hangokat fedi el, amelyeknek frekvenciája beleesik a zaj által tartalmazott frekvenciatartományba. Vagyis elképzelhető, hogy egy szűrt zaj nem képes elfedni egy hangot, ha a kettő frekvenciája nem esik egybe. A szűrésről és zajelfedésről a későbbiekben (280. skk.) részletesebben is fogunk beszélni.

Ilyen különböző módokon megszűrt zajok használatával Moore és Raab (1974) azt találta, hogy a különböző hangerejű hangok megkülönböztetését csak a felül áteresztő szűrővel szűrt háttérzajok rontották le. Mit jelent ez? A felül áteresztő szűrés a zajból csak a felső frekvenciákat tartja meg, és emiatt feltételezhetjük, hogy a zaj csak a magas frekvenciájú hangokat fedi el. Eszerint a zaj azoknak a neuronoknak a válaszait gátolja, amelyek a magasabb frekvenciákat kódolják. Leegyszerűsítve ezt úgy kell elképzelnünk, mintha az „aktivációterjedés” ábrán a magas jellemző frekvenciájú neuronokat egyszerűen levágnánk. Ennek hatása természetesen az, hogy a gátolt neuronok nem képesek a fent említett pluszaktivitást kifejteni, és így nem képesek hozzájárulni a hangosság kódolásához. Ezzel alátámasztható, hogy a nagy intenzitású hangok kódolásában valóban fontos szerepet játszik az aktivációs mintázat terjedése, vagyis a hang frekvenciájánál magasabb jellemző frekvenciájú neuronok tüzelése.

Az utóbbi években felmerült egy az eddigiekben bemutatottaktól lényegesen eltérő elképzelés a hangosság kódolásával kapcsolatban. Ahogyan az előző fejezetben láttuk, a hallóidegrostok válaszjellemzőinek pontos vizsgálata fényt derített arra, hogy három eltérő típust tudunk elkülöníteni a spontán aktivitás, a hangerőküszöb és a telítődési pont alapján (lásd a 8.3. táblázatot). A három különböző típusú idegrost feltételezhetően eltérő hangerőtartományokat kódol, és ez teszi lehetővé, hogy a 130 dB-es dinamikai tartományt olyan rostok kódolják, amelyek egyenként csak egy maximálisan 60 dB-es tartomány átfogására képesek. Ezt a lépcsőzetes hangerő-kódolási mechanizmust úgy kell elképzelnünk, hogy az alacsony, közepes és magas intenzitástartományokat eltérő neuroncsoportok kódolják, és aszerint észleljük hangosnak vagy halknak a hangokat, hogy melyik csoport aktív. Fontos észben tartanunk, hogy az eltérő típusú idegrostok ugyanahhoz az alaphártyai szőrsejthez kapcsolódhatnak, vagyis ugyanazt a frekvenciát képesek kódolni, de eltérő hangerőszinteken.

A hangerő kódolásának ezen mechanizmusa ugyanakkor felvet egy komoly problémát: a mechanizmust nagyon kisszámú idegrost is képes megvalósítani, egyes számítások szerint (pl. Viemeister 1988) akár 100 idegrost is elég lehet erre a feladatra. Ha viszont 100 idegrost elég a mechanizmus megvalósítására, akkor vajon mit csinál a maradék 30 000? Illetve, ha valójában 30 000 neuron áll rendelkezésre, akkor miért nem jobb a hangerő-diszkriminációs képességünk? A lépcsőzetes hangerőkódolás elmélete tehát egy teljesen új kérdést vetett fel a hangerő kódolása kapcsán: most már nem az a legnagyobb probléma, hogy hogyan képes a hallórendszer a 120 dB-es dinamikai tartományt átfogni, hanem az, hogy miért nem jobb a felbontóképességünk? Ennek a problémának a megoldása talán az lehet, hogy az intenzitás diszkriminációját nem a hallóidegrostok által szállított információ korlátozza, hanem az, ahogyan ezt az információt a hallási feldolgozás magasabb szintű folyamatai felhasználják (Carlyon-Moore 1984).

A hangosság észlelésének problémái

Magyarországon az ismert statisztikai adatok szerint az emberek mintegy 10 százaléka szenved valamilyen, a hangosság észlelését befolyásoló halláskárosodásban (KSH 2003). A halláskárosodás különböző mértékű lehet, és az enyhe fokú frekvenciaspecifikus halláscsökkenéstől a teljes süketségig terjedhet. Mivel a mindennapi hangok segítenek abban, hogy kapcsolatban maradjunk a környezetünkkel, a hallás csökkenése vagy elvesztése nemcsak más emberek hangjától, és így a velük folytatott kommunikációtól foszt meg bennünket, hanem az élet biztonságot nyújtó háttérzajaitól is.

A halláskárosodásnak két típusát különböztetjük meg: a vezetéses és az érzékszervi-idegi halláskárosodást. A vezetéses halláskárosodást a külső vagy középfül megbetegedései okozzák, és általánosságban az jellemző rá, hogy az érzékenység a teljes hangtartományra és nem csak bizonyos frekvenciákra vonatkozik. Ahogyan a neve is mutatja, ez a fajta halláskárosodás amiatt jön létre, hogy a külső és a középfül valamilyen okból kifolyólag nem képes vezetni a hangot a külvilágból a belső fülbe, ezáltal a hangok tompulnak. Ve- zetéses halláskárosodást többnyire három probléma okoz: a hallójáratban felhalmozódó fülzsír, a középfül gyulladása (otitis media) és az otoszklerózis nevű betegség, amely a hallócsontocskák fokozatos mozgásképtelenségét okozza. Ezek a problémák többnyire kezelhetők gyógyszeres vagy súlyosabb esetben sebészeti beavatkozással, illetve egyszerű hallókészülékek alkalmazásával.

A halláskárosodás másik fajtája az érzékszervi-idegi károsodás. Ez szintén gyűjtőfogalom, és minden olyan problémát vagy betegséget magában foglal, ami a csigát, vagy hallóideget károsítja. Az ilyen típusú halláskárosodások leggyakoribb fajtája az időskori halláscsökkenés (presbyacusis). Az időskori halláscsökkenés a fejlett ipari társadalmakban az emberek nagy részét érintő probléma, és jellemzően frekvenciaspecifikus, azaz csak a magas frekvenciatartományokra való érzékenység elvesztését jelenti. progresszív probléma, vagyis az érintettek fokozatosan egyre nagyobb tartományokat nem képesek meghallani, és mindez viszonylag korán, már 30 éves korban elkezdődik. Egy felmérés szerint (Davis-Silverman 1960) a 30 évesek nagy része a halláscsökkenés miatt nem képes meghallani a 15 kHz-nél magasabb frekvenciájú hangokat (emlékezzünk vissza, hogy az ember által feldolgozható hangok felső határa 20 kHz), ami 50 éves korra 12 kHz-re, 70 éves korra pedig 6 kHz-re csökkenhet. Az ilyen nagyfokú halláskárosodás már komolyan veszélyezteti a beszédhangok megértését is.

Az időskori halláscsökkenés okával kapcsolatban két elmélet is létezik. Az egyik szerint a halláscsökkenést a csiga érrendszerét érintő keringési problémák okozzák, amelyek következtében romlik a csiga vérellátása, ez pedig a csiga szöveteinek (így az alaphártyának) a pusztulását okozza. Egy másik elmélet azon alapul, hogy mivel az időskori halláscsökkenés elsősorban a fejlett ipari társadalmakra jellemző, a problémát a hosszú időn át tartó folyamatos környezeti zaj (ami a nagyvárosi élet elkerülhetetlen velejárója) kedvezőtlen hatása okozza. Ezt az elképzelést alátámasztja az, hogy a zajszennyezéstől mentes kultúrákban élő idősek nem mutatják ezt a specifikus halláscsökkenést.

Egy másik gyakran előforduló érzékszervi-idegi károsodás a különböző zajhatások miatt kialakuló halláscsökkenés. Itt elsősorban a nagy zaj által kiváltott halláscsökkenésre kell gondolnunk, amelyet akár hirtelen, akár tartós zajok okozhatnak. A hirtelen nagy zajhatásra példa egy robbanás vagy egy fegyver eldördülése, ami gyakran okoz átmeneti, majd később maradandó halláscsökkenést, például a vadászoknál. A hosszan tartó magas zajszint a többinél gyakrabban előforduló oka a halláscsökkenésnek. Ezek közül kettőt érdemes kiemelni: az egyik a munkahelyi zajártalom, amely nagyon komoly munka-egészségügyi és egyben ergonómiai kérdés. Kimutatható, hogy a nagyon zajos munkahely (pl. szerelőüzemek) nemcsak a munkások hallásának károsodását okozhatja, hanem egy ilyen helyen fokozott a balesetveszély is. Ennek megfelelően ma már a legtöbb zajos munkahelyen fokozottan gondoskodnak a dolgozók zajvédelméről. A másik halláskárosodást okozó tartós zajszint a hangos zene. Bármennyire meglepő, a fiatalok körében igen gyakori az enyhe fokú halláskárosodás, amelynek fő okaként a túl hangos zenehallgatást, a könnyűzenei koncerteket, illetve a walkmanek és mp3 lejátszók túl hangos hallgatását nevezik meg. Egy vizsgálatban Han- son és Fearn (1975) azt találta, hogy a rockkoncerteket gyakran látogató és az azokat nem látogató egyetemisták között mintegy 2 dB-nyi, konzisztensen jelentkező hallásküszöb-különbség volt kimutatható minden vizsgált frekvenciatartományban.