Ugrás a tartalomhoz

Általános pszichológia 1-3. – 1. Észlelés és figyelem

Csépe Valéria, Győri Miklós, Ragó Anett

Osiris Kiadó

A hangmagasság észlelése

A hangmagasság észlelése

A hangok azonosítása és ezáltal az akusztikus világ megismerése a hangmagasságon alapul, ezért a hangok jellemzői közül ezt tekinthetjük a leglényegesebbnek. Ez azt is jelenti, hogy a hangmagasság feldolgozása a legbonyolultabb a hang jellemzői közül. A bonyodalmak ott kezdődnek, hogy nehéz pontosan meghatározni, mi is a hangmagasság, mivel ez is, hasonlóan a hangossághoz, szubjektív élményt jelöl. Ugyanakkor, miként a hangosság szubjektív észlelését a hangerő fizikai változásaihoz tudjuk kapcsolni, a hangmagasság esetében is van egy olyan fizikai jellemző, amelynek megváltozása a hangmagasság észlelésében is eltéréshez vezet, ez pedig a frekvencia. A frekvencia és a hangmagasság közötti kapcsolat korántsem olyan egyszerű, mint a hangerő és a hangmagasság közötti: azonos frekvencia esetén is lehet eltérő az észlelt hangmagasság, és eltérő frekvencia is észlelhető azonos hangmagasságként. Ráadásul nem mindegy, hogy tiszta vagy komplex hangok hangmagasságáról van-e szó. A tiszta hangok esetében viszonylag egyszerű a frekvencia és a hangmagasság közötti viszony, a komplex hangok esetében viszont meglehetősen bonyolult. Annak ellenére, hogy a komplex hangok teljesen egyértelmű hangmagasságélménnyel járnak együtt (lásd a zongora C és D hangja), nem világos, hogy a hangot alkotó sok frekvencia-összetevő közül melyik szolgál a hangmagasság alapjául.

Azt mondhatjuk tehát, hogy nincs egy az egyhez megfelelés a frekvencia és a hangerő között. A hangmagasság mindezek alapján úgy definiálható, mint a hallásnak az a jellegzetessége, amelynek alapján a hangok a mélyektől a magasakig sorba állíthatók. Ha például egy zongorán sorban leütjük az egymás melletti billentyűket, akkor egy olyan hangsort hallunk, amelyben az egymást követő hangok egyre magasabb hangmagassággal rendelkeznek. Általában pontosan meg tudjuk mondani, hogy két hang közül melyik rendelkezik nagyobb hangmagassággal. Ez azt is jelenti, hogy a hangmagasság egy egydimenziós skála (csakúgy, mint a hangosság): a hangok egyetlen skála mentén sorba rendezhetők a mélyektől a magasakig.

A hangmagasság skálázása

A hangmagasság skálázásával kapcsolatban a legtöbbször a hangok frekvenciáját veszik figyelembe, amit, ahogy már láttuk, Hz-ben mérünk. A frekvencia azonban csak a tiszta hangok magasságát jelölheti, mivel a komplex hangoknál (vagy akár a zajoknál) egyszerre több frekvencia-összetevő is jelen van. A fejezet további részében ezért elsősorban azzal fogunk foglalkozni, hogy a komplex hangok hangmagasságát mi határozza meg.

Több próbálkozás is történt szubjektív hangmagasságskálák létrehozására. Az egyik ilyen az úgynevezett melskála. Egy 1000 Hz-es tiszta hang értéke definíció szerint 1000 mel, egy ennél kétszer magasabb hangé 2000 mel, és a feleolyan magasé 500 mel. A hangok melskálán történő besorolása egy olyan szubjektív skálázási eljáráson alapul, amelynek során a kísérleti személyektől a különböző hangmagasságú hangok összehasonlítását kérik. Azt kell tehát meghatározni, hogy pontosan milyen magas is az a hang, ami kétszer olyan magas, mint amit az előbb hallottam. A melskála, talán éppen amiatt, hogy nem képes egyértelmű viszonyokat megragadni, nem igazán terjedt el a pszichoakusztikai szakirodalomban.

Egy másik skála már jóval sikeresebbnek mondható, és ez a zenei hangmagasságskála. A zenei hangmagasságskála a zenei hangok sorba állítását teszi lehetővé. A zenei hangok a zenedarabok létrehozására felhasznált, hangszereken lejátszott vagy esetleg elénekelt hangokra vonatkoznak. A zenei hangokat olyan nevekkel illetjük, mint C, D, E vagy dó, ré, mi stb. A zenei skála nagyon jól használható a zenei hangok megragadására, de kizárólag ezekre, hiszen a zenei hangok csak bizonyos meghatározott frekvenciákkal rendelkeznek, egy viszonylag szűk frekvenciatartományon belül (kb. 20-4000 Hz). Például az A4 hang (az úgynevezett „egyvonalas” A hang) 440 Hz-es frekvenciájú, a skálában ezt követő H4 viszont 494 Hz, de nincs olyan hang, amely 450 Hz-es lenne. A zenei skálákról a zenei észlelésről szóló 12. fejezetben még részletesen fogunk beszélni.

A továbbiakban áttekintjük, hogy milyen tényezők befolyásolják a tiszta hangok hangmagasságának észlelését, majd megnézzük, hogy milyen idegrendszeri alapjai vannak a hangmagasság észlelésének, végül pedig arra keressük a választ, hogy mi határozza meg a komplex hangok magasságának észlelését.

A hangmagasság-észlelés elméletei

Az alaphártya működése kapcsán már beszéltünk néhány olyan elméletről, amelyek a hangmagasság észlelését és az alaphártya működését kívánták összekapcsolni. Ezek voltak a frekvenciaelmélet, a helyelmélet és az alaphártya működésének ma is teljes mértékben elfogadott elképzelése, az utazóhullám-elmélet. Áttekintettük a hallórendszer frekvencia- szelektív működését magyarázó egyik elképzelést, amely szerint a hallórendszer olyan különböző középfrekvenciával rendelkező szűrők készleteként képzelhető el, amelyek egymást részben átfedve átfogják az egész frekvenciaészlelési tartományt, és különböző frekvenciákat dolgoznak fel (hallási szűrők).

Az alábbiakban lényegében ezeket az elméleteket ismételjük át, hiszen ezek mindegyike alapvetően a hangmagasság észlelését magyarázza, és fontos tisztában lennünk azzal, hogy ezek nemcsak az alaphártya működésével és a hangok frekvenciájának feldolgozásával, de a hangmagasság élményének kialakulásával is foglalkoznak.

A hangmagasság észlelésével kapcsolatban alapvetően két nagy elmélet létezik: a helyelmélet és az idői elmélet (frekvenciaelmélet). A helyelmélet mai változata szerint a hanginger a belső fülben egyfajta spektrális elemzésen (vagyis frekvencia-összetevőkre való lebontáson) megy keresztül oly módon, hogy a hangot alkotó frekvenciák az alaphártya különböző részeit hozzák mozgásba, ennek révén pedig különböző jellemző frekvenciával rendelkező neuronok jönnek aktivációba. A helyelmélet gyenge pontja, hogy a komplex hangok észlelését nehezen tudja magyarázni. A komplex hangok ugyanis, mivel több frekvenciát tartalmaznak, az alaphártya több pontján is maximális kitérést hoznak létre, ezek közül viszont nem feltétlenül a legnagyobb csúccsal rendelkező vezet a hangmagasság meghatározásához. A későbbiekben még visszatérünk arra, hogy a komplex hangok esetén végül is melyik frekvencia-összetevő vezet a hangmagasság élményéhez, és hogy ennek észlelését hogyan segíti elő az alaphártya.

Az idői elmélet a helyelmélettel szemben a hang magasságát a hang által kiváltott neu- rális aktivitás idői mintázatához kapcsolja. Az idői elmélet egyik korai változata volt a frekvenciaelmélet, amely szerint az alaphártya a hang frekvenciájának megfelelően jön rezgésbe, és ez a hallóidegben hasonló mintázatú kisüléseket hoz létre (vagyis egy 1000 hz-es hang hatására másodpercenként 1000-szer rezeg az alaphártya, és ugyanennyiszer sül ki a hallóideg).

Az idői elméletek egy modernebb változata a hallóideg aktivitásának fázisszinkronizá- cióján alapul. A fázisszinkronizáció azt jelenti, hogy a hallóideg a hang frekvenciájával, vagyis periódusával szinkronban sül ki. Az előző fejezetben szó volt arról (lásd 241. o.), hogy a hanghullám fázisa azt fejezi ki, hogy egy adott ponthoz képest egy teljes hullámperiódus mekkora része telt el.

A hallóideg fázisszinkronizált aktivitása úgy valósul meg, hogy a neuronok tüzelése valamilyen módon időben kapcsolódik a hang bizonyos fázisához, és így gyakorlatilag a periódusokkal együtt tüzel. Ha belegondolunk, akkor ez pontosan azt írja le, mint amit a frekvenciaelmélet: a hallóideg a hang frekvenciájának (periódusváltozásának) megfelelő kisülési mintázatot produkál. A különbség az, hogy a fázisszinkronizáció lehetővé teszi, hogy a kisülések ne minden egyes periódusnál, hanem csak minden másodiknál vagy harmadiknál jelenjenek meg, és így sokkal nagyobb frekvenciák kódolása valósítható meg, mint ahogy azt a frekvenciaelmélet feltételezte.

A tiszta hangok hangmagassága

A tiszta hangok esetében a hangmagasságot a hang frekvenciája határozza meg. Ezért itt nem is annyira az a kérdés, hogy mi az alapja a hangmagasság észlelésének, hanem inkább az, hogy mennyire lineáris az összefüggés frekvencia és hangmagasság között.

A tiszta hangok hangmagasság-észlelése kapcsán is fontos kérdés, hogy mennyire tudjuk megkülönböztetni őket egymástól, vagyis milyen a különbségi küszöbük. A leggyakrabban alkalmazott módszerben két egymást követő, eltérő frekvenciájú hangról kell eldönteni, hogy melyik volt magasabb (ez tehát egy klasszikus konstans ingerek módszere paradigma, lásd pszichofizika). A hangok sorrendjét változtatják, és a legkisebb észrevehető különbséget (vagyis a különbségi küszöböt) annál a frekvenciaeltérésnél „húzzák meg”, ahol a vizsgált személy legalább 75 százalékban helyesen válaszol.

A vizsgálatok általános eredménye az, hogy a frekvencia függvényében nő a különbségi küszöb, vagyis minél nagyobb frekvenciájú egy hang, annál nagyobb változásra van szükség ahhoz, hogy eltérő hangmagasságú hangot észleljenek a személyek. Így az 1000 Hz-es hangok esetében körülbelül 2-3 Hz-es változást hallunk meg (azaz például egy 1 Hz-es növekedést nem), 8000 Hz körül ez az érték viszont már 50 Hz körüli. Mindez emlékeztethet bennünket a Weber-törvényre: minél nagyobb az inger kiinduló értéke, annál nagyobb inger kell ahhoz, hogy észleljük a változást.

A különbségi küszöb ilyen módon történő alakulása magyarázható az alaphártya frek- venciaszelektív működésével, valamint a hallásiszűrő-elmélettel. Ahogy fentebb már láttuk, kimutatható, hogy az alacsony frekvenciákat feldolgozó hallási szűrők kisebb sávszélességgel rendelkeznek, mint a magas frekvenciákat feldolgozó szűrők. Ebből következően a mély hangokra érzékenyebbek vagyunk, és így a mély hangokat sokkal jobban tudjuk diszkriminálni, mint a magasakat. Úgy tűnik tehát, hogy a hangmagasság különbségi küszöbének változása a hallórendszer alapvető tulajdonságából származik, nevezetesen abból, hogy a magas frekvenciájú hangoknál az alaphártya felbontóképessége rosszabb, mint az alacsony frekvenciájú hangoknál.

A tiszta hangok esetében is van a hangmagasság észlelésében néhány olyan jelenség, amely miatt összetett és nem mindig egyértelmű a frekvencia és a hangmagasság közötti kapcsolat. Az egyik ilyen a hangerő hatása: a hangerő növekedésével megváltozik a hangmagasság élménye. Ez az összefüggés meglehetősen komplex: megfigyelték, hogy 2 kHz alatt a nagyobb hangerejű hangot mélyebbnek észleljük, 4 kHz felett viszont a nagyobb hangerő nagyobb hangmagassághoz vezet. A hangmagasság tehát a hangerő függvényében csúszkál. Moore (1997) szerint egyelőre nincs általánosan elfogadott magyarázat a hangmagasság csúszkálására, ezt a hangmagasság észlelésének egyik elmélete sem magyarázza kielégítően.

A hangmagasság észlelését a hang időtartama is befolyásolja. Ahhoz, hogy egy hang egyáltalán hangmagasságélményt váltson ki, bizonyos hosszúságúnak kell lennie. Bármilyen furcsának tűnik is, a nagyon rövid hangokat nem egy adott hangmagasságú hangnak, hanem csak egy kattanásnak halljuk. Többnyire már 10-15 milliszekundum hanghossz elég ahhoz, hogy észlelni tudjuk a hang magasságát, bár ez nagyban függ a hang frekvenciájától. A magas (nagyobb frekvenciájú) hangokat ugyanis mindig rövidebb idő alatt tudjuk azonosítani. Ennek az lehet az oka, hogy a nagyobb frekvenciájú hangoknál rövi- debb idő alatt is elegendő számú rezgési periódus alakul ki. Minél nagyobb frekvenciájú egy hang, a rezgési periódusok száma annál nagyobb.

A komplex hangok hangmagassága

Alaphang és felharmonikusok

Ahogyan a bevezetőben említettük, a komplex hangok hangmagasságának észlelését elég nehéz magyarázni. Mindennapi tapasztalatunk persze az, hogy a komplex hangok nagyon is jól meghatározható hangmagassággal rendelkeznek: elég csak a zongorára gondolnunk, ahol az egymás után leütött billentyűk egy egészen nyilvánvaló zenei skálát adnak ki, és pontosan meg tudjuk mondani, hogy melyik hang volt magasabb, és melyik mélyebb. Vagyis teljesen természetes számunkra, hogy a zongora hangjai egyértelmű hangmagasságélményt okoznak. Ugyanakkor, ha bevetjük újonnan megszerzett pszichoakusztikai ismereteinket, és belegondolunk abba, hogy mi is okozhatja a zongora hangjainak egyértelmű hangmagasságát, akkor rögtön elbizonytalanodunk. Tudjuk ugyanis, hogy a zongora hangja komplex hang, azaz több frekvencián tartalmaz akusztikus energiát. Azt is tudjuk, hogy a tiszta hangok esetében többé-kevésbé a hang frekvenciája vezetett a hangmagasság élményéhez. Nyilvánvalóan ezt a két ismeretet kellene ötvöznünk a zongora

Feldolgozott hangok

hangmagasságának megmagyarázása érdekében, de rögtön rá kell jönnünk, hogy ezt nem tudjuk megtenni. Nem tudjuk, hogy melyik az a frekvencia a sok közül, amelyet ki kellene választanunk, és amely a hangmagasság élményéhez vezetne.

A komplex hangok akusztikai jellemzőinek leírásakor (lásd 8. fejezet) láthattuk, hogy az azokat alkotó frekvenciákat alapvetően két összetevőre, az alaphangra és a felharmonikusokra bonthatjuk. Az alaphang a legalacsonyabban megszólaló frekvencia, a felharmonikusok pedig ennek egész számú többszörösei. Mivel az alaphang ilyen kitüntetett szerepet játszik (nemcsak hogy a legalacsonyabb frekvencia, de a többi frekvenciát is hozzá viszonyítjuk), logikus lenne feltételezni, hogy valamilyen módon ez járul hozzá a komplex hangok magasságának észleléséhez. Sajnos azonban van egy olyan jelenség, amely megcáfolja ezt az elképzelést, ez pedig a hiányzó alaphang jelensége. A hiányzó alaphang vagy alapfrekvencia jelensége azt jelenti, hogy a komplex hangból kivágott vagy zajjal elfedett alaphang esetében nem változik meg a hang észlelt hangmagassága. Ez arra utal, hogy a komplex hangok hangmagasságát valamilyen sokkal bonyolultabb észlelési mechanizmus révén állapítjuk meg.

A maradványhang

Az, hogy a komplex hangok magasságát valamilyen akusztikai paraméter változásához kapcsoljuk, két szempontból is problémás. Egyrészt, a komplex hangok, eltérően a tiszta hangoktól, az alaphártyának nemcsak egy bizonyos pontján okoznak maximális elmozdulást, hanem egyszerre több különböző helyen is. Ráadásul nem feltétlenül a legnagyobb elmozduláshoz kapcsolódó frekvencia lesz az, amely a hangmagasság élményét okozza.

Másrészt, a hiányzó alaphang jelensége arra utal, hogy nem feltétlenül az alaphang az, ami a hangmagasság élményét okozza, mivel a hangmagasság akkor sem változik, ha az alaphangot kiszűrjük a hangból. Ahogyan arról már szó esett, a komplex hangok egy alaphangot és annak egész számú többszöröseiből álló frekvenciákat tartalmaznak. Például létrehozható egy olyan hang, amely 200-tól 2000 Hz-ig tartalmaz 400, 600, 800... stb. frekvenciájú összetevőket. Ennek a hangnak a magassága megegyezik egy 200 Hz-es tiszta hang magasság á v a l , mivel a komplex hang alapfrekvenciája is 200 Hz. Ha azonban eltávolítjuk a 200 Hz-es frekvenciát (vagyis az alaphangot), akkor a hang magassága továbbra is meg fog egyezni a 200 Hz-es tiszta hang magasságával, illetve az eredeti, az alaphangot még tartalmazó hangéval. Ami változik, az a hang minősége, vagyis az eredeti és az alaphang nélküli hangokat ösz- szehasonlítva fogunk közöttük eltérést tapasztalni, de mindkettő hangmagasságát ugyanakkorának fogjuk észlelni.

Valójában az alaphangon kívül még egy sor frekvenciatartomány kiszűrhető, és ez továbbra sem okozza a hangmagasság megváltozását. Ha módszeresen végigpróbáljuk, hogy mely frekvenciák elvétele vezet a hangmagasság megváltozásához, akkor azt tapasztalhatjuk, hogy szinte az összes alacsony frekvencia kiszűrhető, egészen az 1-1,5 kHz-es tartományig, és a hang még mindig megtartja a magasságát, bár a minősége lényegesen eltérő lesz.

Schouten (1940) a magas felharmonikusok (az előző példában az 1 kHz feletti frekvenciák a többi frekvencia nélkül) esetében észlelt mély hangmagasságot reziduálisnak vagy maradványhangnak nevezte. Rámutatott, hogy a maradványhang megkülönböztethető a fizikailag is jelen lévő alaphangtól, ami arra utal, hogy a maradványhang észlelése nem az alaphártya aktivitásától függ. A zajelfedést használó kísérletekben szintén bebizonyították, hogy a maradványhang akkor is hallható, ha egyébként az annak megfelelő frekvenciatartományokat zajjal maszkolják. Mivel tudjuk, hogy a maszkolás lehetetlenné teszi az elfedett hang észlelését, ez arra enged következtetni, hogy a maradványhang nem egy adott fizikai hangnak felel meg. A maradványhangot virtuális hangmagasságnak is szoktuk nevezni. Ez az elnevezés különösen kifejező, mivel utal arra, hogy a hangmagasságot az összetevők sajátosságaitól függően az észlelőrendszer hozza létre.

A komplex hangok magasságának észlelését magyarázó elméletek

A maradványhang észlelése furcsának tűnhet, de valójában a hétköznapokban minden komplex hang esetében ezt halljuk, és ez az ami alapján a hangok magasságát megállapítjuk. A maradványhang észlelését magyarázó elméletek két típusba sorolhatók. Az úgynevezett mintázatfelismerő modellek szerint a komplex hangok magasságát az egyedi felharmonikusok magasságából származtatjuk valamilyen módon. A másik típus, az idői modellek szerint viszont a hallóideg kisülési mintázata vezet a hangmagasság észleléséhez.

A mintázatfelismerő modellek

A mintázatfelismerő modellek szerint a komplex hangok magasságának észlelése két lépésben történik. Elsőként a bejövő akusztikai információ frekvenciaelemzését végezzük el, vagyis a hang egyedi frekvenciatartományainak meghatározását. A második lépésben egy mintázatfelismerő rendszer az egyedi frekvenciatartományok alapján meghatározza a hang magasságát. Az első lépés nem kíván különösebb magyarázatot, hiszen tudjuk, hogy az alaphártya alapvető feladata az, hogy a hangokat frekvencia-összetevőikre bontsa le, és azt is jól tudjuk, hogy miként képes ezt az alaphártya megtenni (lásd az alaphártya működésének elméleteit). A második azonban némi kiegészítésre szorul, hiszen egyelőre csak annyit mondtunk ezzel kapcsolatban, hogy valószínűleg létezik egy olyan rendszer, amely a mintázatfelismerést megvalósítja, és valamilyen módon a frekvenciamintázatok alapján kinyeri a hang magasságát.

Goldstein (1973) elképzelése szerint például a következőképpen működhet a mintázatfelismerő rendszer. A rendszer a komplex hangot alkotó frekvenciákon dolgozik, ezeket egy hely- vagy időmechanizmus nyeri ki az alaphártya szintjén az ingerből. A felismerő lényegében azt csinálja, hogy megpróbálja a kinyert harmonikusoknak legjobban megfelelő alaphangot rekonstruálni, vagyis ez valamilyen matematikai művelet eredménye lenne. Tudjuk, hogy a felharmonikusok az alaphang egész számú többszörösei. így ha például az elemzett hang egy 1836, 2040 és 2244 Hz-es harmonikust tartalmaz, akkor a rendszer megpróbálja megtalálni azt a frekvenciaértéket, amely mindhárom harmonikus egész számú osztója. Kis számolással kideríthetjük, hogy ez az érték a 204 Hz, és ennek a 9., 10. és 11. harmonikusa lenne a fenti három frekvencia. Természetesen, mint azt fentebb láttuk, a hallórendszer frekvenciákra való érzékenysége nem ennyire nagy, ezért „kerekítések” elképzelhetők. A fenti példa esetében valószínűleg az 1840, 2040 és 2240 Hz-es harmonikusok is a 204 Hz-es hangmagasság érzetét okoznák. Ráadásul kétértelmű szituációk is adódhatnak, például olyan esetben, amikor a harmonikusok egynél több alaphang eltérő egész számú szorzataiként jönnek létre. Valóban vannak olyan kísérleti eredmények, amelyek szerint egy adott felharmonikus kombináció eltérő hangmagasságélményt váltott ki a különböző kísérleti személyekből. Az esetek nagy részében azonban a mechanizmus jól működhet. (Érdekes lehet elgondolkodni azon, hogy vajon ezek a személyek közötti eltérések milyen szubjektív élménybeli eltéréseket okoznak. Gondoljunk csak bele abba, hogy ha már ezen a nagyon alacsony szinten, egyetlen komplex hang feldolgozásakor is eltérések vannak az emberek között abban, hogy milyen hangmagasságot észlelnek, milyen óriási különbségek lehetnek akkor, amikor egy több hangszeren lejátszott és több száz hangból álló zenei darabot hallgatnak!)

A mintázatfelismerő modellek szerint létezik egy fontos korlátja a hangmagasság észlelésének. Nevezetesen, a maradványhang csak akkor nyerhető ki egy komplex hangból, ha az tartalmaz olyan frekvenciakomponenseket, amelyek „kihallhatók” a teljes hangból. A vizsgálatok szerint azok a komponensek hallhatók ki, amelyek kb. 5 kHz alattiak, és csak akkor hallhatók ki, ha nincs belőlük túlságosan sok. Körülbelül 20 harmonikus felett ugyanis csak egy meghatározhatatlan hangmagasságú zaj hallható.

Az idői modellek

A komplex hangok hangmagasság-észlelésének idői modelljei egészen más megközelítést alkalmaznak. Schouten (1940) szerint az alaphártya tüzelési mintázataiból érdemes kiindulni. Tudjuk, hogy a komplex hangok harmonikusai az alaphártya különböző helyein dolgozódnak fel, és eltérő kisülési mintázatot váltanak ki a szőrsejtekben. Ezek a kisülési mintázatok az egyes harmonikusoknak, nem pedig az egész hangnak feleltethetők meg. Ha visszaemlékszünk, a hangmagasság feldolgozásának idői elmélete szerint a hangok frekvenciája egy a frekvencia periodikus változásának megfelelő kisülési mintázatot vált ki a hallóidegben (például minden fázis kezdetekor van egy kisülés-fázisszinkronizáció). Vagyis az alaphártya meghatározott helyein található szőrsejtek egy ilyen periodikus kisülést mutatnak, akkor is, ha csak egy egyszerű, egyetlen frekvenciából álló hang rezeg- teti meg az alaphártyát, és akkor is, ha egy több frekvenciából álló komplex hang. A komplex hangok feldolgozása esetén az alaphártya különböző helyein aktiválódó és különböző fázisszinkronizált aktivitást mutató idegsejtek kisülési mintázatai interakcióba léphetnek egymással, és átfedhetik egymást. Vagyis bizonyos időpillanatokban az idegsejtek egyszerre aktiválódnak (9.10. ábra). Az izgalmas dolog mindebben az, hogy úgy tűnik, ezek az átfedések leképezik az eredeti komplex hang periodicitását, vagyis az átfedések az alaphanggal, pontosabban a maradványhanggal szinkronban jönnek létre. Ez azt jelenti, hogy függetlenül attól, hogy jelen van-e az alaphang vagy sem, találunk egy olyan aktivitásmintázatot, amely a maradványhanggal van szinkronban. Ily módon az idői modellek is képesek megmagyarázni a hiányzó alaphang észlelését.

Fontos kiemelnünk a fenti két elmélet között egy lényegi különbséget, ami abból fakad, hogy a hallási feldolgozás mely szintjére helyezik a hangmagasság élményének kialakulását. Mint láttuk, a mintázatfelismerő modellek különböző bonyolult számításokat tételeznek fel a maradványhang megállapítása során. A számítások vagy komputációk alapvetően központi idegrendszeri, azaz centrális folyamatok lennének, amelyek a hallórendszer alacsonyabb szintjei által már feldolgozott információt használnák fel. Ezzel szemben az idői modellek a hallórendszer alacsony szintjén, valójában az alaphártya és a szőrsejtek szintjén működő periferiális folyamatokat tételeznek fel, és azt tartják, hogy a hangmagasság élménye már ezen az alacsony szinten kialakul.

Kísérleti bizonyítékok a két elmélet mellett

A két modell kapcsán nagyon sok kísérleti eredmény született, amelyeknek alapvető konklúziója az, hogy mindkét elmélet mellett hozhatók fel bizonyító és cáfoló adatok. A kísérleti eredmények egyik csoportja azt mutatja, hogy akkor is egyértelmű hangmagasság észlelhető, ha a felharmonikusok nem hallhatók ki a hangból (például mert túl sok van belőlük, vagy túl magasak). A mintázatfelismerő elméletek szerint ez nem lehetséges, mivel a maradványhang a kinyert harmonikusok alapján számítható csak ki, és ha nem tudjuk kinyerni a harmonikusokat, akkor nem jön létre hangmagasságélmény. Moore és Rosen (1979) ezt egy olyan kísérlettel bizonyította, ahol olyan komplex hangokból álló hangsorokat játszottak le a kísérleti személyeknek, amelyek egyfajta dallamot alkottak. A hangokat úgy állították elő, hogy az alacsony frekvenciatartományokat kiszűrték, vagyis csak olyan magas frekvenciák maradtak meg, amelyeket önmagukban nem lehet kihallani. Ezenkívül alacsony frekvenciájú sávszűrt zajjal fedték el az alsó frekvenciákat. Mindezen módosítások ellenére a kísérleti személyek képesek voltak a dallamokat felismerni, ami arra utal, hogy azok létrehoztak valamilyen hangmagasságélményt (természetesen ezek a nagymértékben eltorzított hangok egészen más hangmagasságélményhez vezetnek, mint amit például egy zongorán lejátszott dallam okoz, de ennek ellenére valami dallamélmény- szerűség kialakulhat).

Az eredmények egy másik csoportja viszont éppen a periferiális elméleteket cáfolja. Houtsma és Goldstein (1972) például arra a következtetésre jutott, hogy a maradványhang akkor is hallható, ha a harmonikusok között nem jöhet létre interakció az alaphártyán. Kísérletükben két felharmonikusból álló hangokat (pl. a 4. és 5. harmonikus) játszottak le a kísérleti személyeknek, akiknek a maradványhang magasságát kellett megállapítaniuk. Pontosabban, egy viszonylag bonyolult feladatot kaptak a zeneileg képzett alanyok: az volt a dolguk, hogy két egymást követő, két felharmonikusból álló hang zenei skálán való távolságát állapítsák meg. Ehhez természetesen az egyébként hiányzó alaphangot kellett felhasználniuk. Ráadásul még egy „csavart” alkalmaztak: a hangot alkotó két felharmonikust külön-külön adták a két fülbe. Ezt dichotikus helyzetnek nevezzük. Azt találták, hogy a feladat megoldása, vagyis a hiányzó alaphanggal rendelkező hangok zenei távolságának megállapítása még úgy is megfelelő volt, hogy a felharmonikusok más-más fülben voltak hallhatók. A dichotikus hallgatási helyzettel a kutatók ki tudták zárni annak lehetőségét, hogy a két felharmonikus az alaphártyán interakcióba lépjen, és ez okozza a hangmagasság élményét. A hangmagasság észlelése ebben a szituációban csak úgy képzelhető el, hogy a két fülből származó információ a feldolgozás valamely későbbi szintjén egyszerre kerül feldolgozásra, és ez a centrális feldolgozás vezet a hangmagasság élményéhez.

9.10. ábra. Az alaphártya idegsejtjeinek kisülési mintázata egy komplex hang feldolgozásakor. A bal oldali értékek azokra a frekvenciákra vonatkoznak, amelyek maximális idegi aktivitást eredményeznek az alaphártya adott pontjain

Houtgast (1976) még ennél is tovább ment ahhoz, hogy bizonyítsa, a hangmagasság centrális folyamatoktól függ. Kimutatta, hogy akár egyetlen felharmonikussal rendelkező hang esetében is hallható egy ettől eltérő maradványhang. Olyan kísérleti helyzetet hozott létre, amelyben a személyeknek azt kellett eldönteniük, hogy két egymást követő komplex hang esetén a másodikként hallott magasabb vagy mélyebb-e, mint az első. Az első hang mindig hat felharmonikust tartalmazott, és egyértelmű hangmagassággal rendelkezett, a második hang viszont először három, majd kettő, végül pedig csak egy harmonikust tartalmazott. Az egy harmonikust tartalmazó hang esetében nagyon nehéz volt meghallani az ahhoz elvileg kapcsolódó mélyebb maradványhangot, egészen addig, amíg nem játszottak le a hanggal együtt háttérzajt is. Zaj jelenlétében ugyanis az egyetlen harmonikussal rendelkező hang is egyértelmű hangmagasságélményt okozott. Az ilyen módon kialakuló hangmagasságélményhez két dolog szükséges: egyrészt a személy egy meghatározott hangmagasság-tartományra kell hogy figyeljen, és ebben a tartományban kell elvárnia az adott hangot (az elvárást a kísérleti helyzet maga alakítja ki). Másrészt szükséges, hogy a háttérzaj a beérkező hanginger feldolgozását zavarja, és ezáltal többértelművé tegye. Ha ezek a feltételek fennállnak, akkor lehetséges, hogy egyetlen felharmonikus is létrehozzon egy ettől mélyebb hangmagasságélményt.

Ezek az eredmények azt bizonyítják, hogy a hangmagasság élménye a feldolgozás nagyon magas szintjén alakul ki, és többek között a személy figyelme vagy elvárásai is képesek befolyásolni. Vagyis, noha nyilvánvalóan a hang akusztikai jellemzőiben kell keresnünk a hangmagasság észlelésének alapjait, maga az élmény azonban nagyon erőteljesen pszichológiai tényezők által befolyásolható jelenség.

Összefoglalva, a komplex hangok magasságának észlelésével kapcsolatban az alábbiak derültek ki:

  1. A hangmagasság olyan helyzetekben is észlelhető, amikor a harmonikusok túl magasak ahhoz, hogy kihallhatók legyenek. Ez az eredmény cáfolja a mintázatfelismerő elméleteket.

  2. A hangmagasság észlelése nem kizárólag az alaphártya működésén alapul, mivel olyan esetben is észleljük, amikor nem lehetséges a harmonikusok interakciója (pl. dicho- tikus hallgatási helyzet). Ez az eredmény cáfolja az idői elméleteket.

Mivel úgy látszik, hogy mind az idői, mind a mintázatfelismerő modellek jól magyaráznak bizonyos jelenségeket, más jelenségeket viszont nem, feltételezhetjük, hogy mindkettőnek igaza van, és a kettő egyesítéséből származó modell a hangmagasság-észlelési jelenségek szélesebb körét tudná magyarázni. Nézzünk meg egy ilyen elméletet, amely Moore (1997) nevéhez fűződik.

Moore egyesített elmélete

A 9.11. ábra szemlélteti a modell működését. A modell egy soklépcsős feldolgozási folyamatot képzel el a hangmagasság-észlelés hátterében. Az első lépés a bejövő komplex hangnak egy átfedő sávszűrőket tartalmazó készlet (a hallási szűrők) segítségével történő feldolgozása. Ennek révén kinyerhetők a hang frekvenciatartományai, vagyis a harmonikusok, mivel az egyes szűrők csak a nekik megfelelő sávszélességű frekvenciákat engedik át. Ez lényegében megfelel az alaphártya működésének: a hang az alaphártya különböző helyein okoz elmozdulást, és ezáltal aktiválja az ott található szőrsejteket. Láthattuk, hogy a hallási szűrők ezeknek a szőrsejteknek a frekvenciaszelektív működését modellezik. A szűrők kimenete egy olyan mintázat, mint ami az ábrán látható, és a feldolgozási folyamat további lépcsői már ezen a kimeneten dolgoznak, vagyis az egyes harmonikusok külön-kü- lön dolgozódnak fel.

9.11. ábra. A komplex hangok hangmagasság-észlelésének sematikus modellje (Moore 1997 nyomán)

A következő lépés a szűrők kimenetének idegi impulzussokká történő átalakítása. Ezt a lépést a fázisszinkronizációs elmélet írja le legjobban. A transzdukciós folyamat során eszerint egy olyan kisülési mintázat jön létre, amely egy idői leképezését adja az adott frekvenciának. Fontos, hogy mindez már ugyanúgy működik, mint az egyszerű hangok esetében: a hang frekvenciáját egy az adott hangnak megfelelő jellemző frekvenciával bíró idegrost dolgozza fel. Vagyis a modell szerint a komplex hangok feldolgozásának egyik kritikus lépése a hangok különböző frekvencia-összetevőkre való lebontása (amit az alaphártya helyelmélete magyaráz meg), mivel, ha ez megtörtént, akkor a későbbi feldolgozás már haladhat úgy, mintha tiszta hangokról lenne szó (csak éppen sok idegrost „dolgozik” egyszerre).

A feldolgozás következő szintjén egy olyan mechanizmus található, amely a különböző jellemző frekvenciával rendelkező idegrostok kisülési mintázatait elemzi külön-külön. Ez az információ azután továbbítódik egy újabb szintre, ahol a különálló kisülési mintázatok összehasonlítása történik meg. Az összehasonlítás során a mechanizmus közös idői mintázatokat keres, vagyis olyan pontokat, ahol több idegrostból származó kisülési információ egybeesik és átfedi egymást. Emlékezzünk vissza, hogy ez az átfedés, illetve interakció képezte az alapját az idői elméleteknek, de azok ezt a mechanizmust az alaphártyához kapcsolták. A Moore-féle modell ezzel szemben egy centrális mechanizmust tételez fel az átfedés kinyerésére, mivel csak egy ilyen mechanizmus tudja megvalósítani azt, hogy akár két külön fülből érkező kisülési mintázatot is figyelembe vegyen. Ahogyan az idői elméleteknél, itt is a közös, átfedő idői mintázat az, ami a maradványhangot meghatározza, vagyis ez a mechanizmus számítja ki lényegében a komplex hang magasságát.

Végül a feldolgozás utolsó lépésében egy döntési mechanizmus választja ki a hang végleges magasságát, mégpedig úgy, hogy nemcsak az alulról felfelé irányuló tüzelési mintázatokból származó információt veszi figyelembe, hanem különböző felülről lefelé ható folyamatok (figyelem, emlékezet) és a kontextus is befolyással vannak rá.

Látható, hogy a modell a hangmagasság észlelésének mind idői, mind helyelméletét figyelembe veszi, és egyesíti magában a komplex hangok hangmagasság-észlelésének idői és mintázatfelismerő modelljeit. Ráadásul magában foglalja mindazt az ismeretet, amit az alaphártya frekvenciaszelektív működéséről, a jellemző frekvenciákról és a hallóidegrostok tüzelési mintázatairól tudunk. Ilyen értelemben a hallási észlelés egyik legkomplexebb elméletét nyújtja.

A fentiekben áttekintettük a hallási észlelés egyik legfontosabb témáját, azaz azt, hogy hogyan dolgozza fel a hallórendszer a hangok magasságát, legyenek azok tiszta vagy komplex hangok. Láthattuk, hogy annak ellenére, hogy a hangoknak a magasságuk a legalapvetőbb jellemzőjük, ennek észlelése teljes mértékben szubjektív élmény, és nincs egy az egyben megfelelés egy hang frekvenciája és hangmagassága között.