Ugrás a tartalomhoz

Általános pszichológia 1-3. – 1. Észlelés és figyelem

Csépe Valéria, Győri Miklós, Ragó Anett

Osiris Kiadó

Hallási mintázatok és objektumok észlelése

Hallási mintázatok és objektumok észlelése

Az eddigiekben a hallási élménynek már számos jellemzőjét bemutattuk: áttekintettük, hogyan történik a hangforrás helyének megállapítása, vagyis a lokalizáció, és még előbb azt is, hogy a hanginger egyéb jellemzőit, mint a hangerőt és a hangmagasságot, miként kódolja az idegrendszer. A mindennapi életben azonban nem különálló akusztikai jellemzőket észlelünk, hanem egységes, egész dolgokat. Noha a hangok magasságát és hangosságát dolgozzuk fel, ezek nem önmagukban léteznek, hanem mindig tárgyakhoz kapcsoljuk őket. A hallási észlelés végső állomásai nem ezek, hanem egy hallási tárgy: madárcsicsergés, a vonat zakatolása, a cselló szólama egy vonósnégyesben vagy egy szeretett személy hangja. Ezek azok, amiket eltárolunk az emlékezetünkben, és amik, ha újra találkozunk velük, ismerősek lehetnek.

A hallási tárgyak azonosításának legfontosabb problémája, hogy a legtöbb esetben nagyon sok hang szól egyszerre, és nekünk ezekből kell kiválasztanunk azt, amelyik számunkra valamilyen okból fontos. Természetesen addig, amíg nem választjuk szét az egyes hangokat, felismerni sem tudjuk őket. Az alábbiakban ezért nagyrészt arról lesz szó, hogy az egyszerre beérkező hangokat hogyan csoportosítjuk egységes hallási objektumokba, és hogy ezekből hogyan tudjuk létrehozni a külvilág reprezentációját.

A hallási színtérelemzés

Képzeljük el, hogy egy könnyűzenei koncerten veszünk részt egy koncertteremben: villódznak a fények, dübörög a zene az óriási hangszórókból, legalább négy hangszer szól egyszerre, és a többiek körülöttünk együtt énekelnek az énekessel. Ekkor barátunk fülünkbe kiabálva felhívja a figyelmünket arra, hogy mennyire fantasztikus volt az a gitárszóló, amit a gitáros a refrén előtt játszott.

Valószínűleg mindenki képes az itt leírt feladatok megvalósítására: tudjuk követni az egész zenekar játékát, mégpedig a közönség zaja ellenére, tudjuk követni az egyik hangszer hangját a többi ellenére, sőt bizonyos mértékig még beszélgetni is tudunk, háttérbe szorítva az összes többi hangot. Ráadásul mindez nem is igazán okoz nehézséget, hanem valójában egy nagyon is élvezetes tevékenységnek találjuk.

Alább arra fogunk rámutatni, hogy a fentiek látszólagos egyszerűsége ellenére mennyire nehéz feladata van a hallórendszernek akkor, amikor ezeket az észlelési folyamatokat meg akarja valósítani.

Ennek illusztrálására vessünk egy pillantást a 10.12. ábrára, amely egy zeneszám spektrogramját ábrázolja. A spektrogram a hangok ábrázolásának egy olyan módja, amely az idő függvényében tünteti fel a hangok frekvenciáját. A 8. fejezetben láthattunk már két másik ábrázolást is: az oszcillogramon az idő függvényében tüntettük fel a hangnyomás változását (lásd 8.3. ábra), a spektrálison pedig a frekvencia függvényében az amplitúdót (ezt hívtuk spektrális ábrázolásnak, lásd 8.7. ábra). A spektrogram mintegy ennek a kettőnek az ötvözete: az idő függvényében ábrázolja az egyes frekvenciatartományokban található hangenergia mennyiségét, amelyet a söté- tebb és világosabb foltok fejeznek ki. Minél sötétebb a folt, annál több energiát tartalmaz egy adott tartomány. Vagyis a spektrogram a hang mindhárom fizikai tulajdonságát képes egyszerre ábrázolni: a hangerőt, a frekvenciát és az idői lefutást. A spektrogramon történő ábrázolást gyakran alkalmazzák a beszédhangok megjelenítésére, ezért a beszédészlelés kapcsán még visszatérünk rá.

10.12. ábra. Egy zenei részlet spektrogramja

A spektrogram azért is fontos, mert tulajdonképpen azt modellezi, ahogyan az alaphártya leképezi a hangokat. A spektrogram létrehozására egy olyan eljárást alkalmaznak, amelyben egy átfedő sávszűrőket tartalmazó készlet képezi le az egyes frekvenciatartományokat, csakúgy, mint ahogy azt az alaphártyáról feltételezzük (lásd 283. sk.).

Az y tengely, ahol a frekvenciát ábrázoljuk, megfeleltethető a függőleges irányba fordított alaphártyának, a sötét és világos foltok pedig annak, hogy aktív-e az alaphártya adott területe vagy sem. Az időt ábrázoló x tengely úgy képzelhető el, mintha az alaphártya aktivitását minden időpillanatban egymás mellé helyeznénk.

A 10.12. ábrán bemutatott spektrogram tartalmaz minden olyan információt, amely a hallórendszer számára rendelkezésre áll: a hang frekvenciatartományait, az egyes tartományok hangerejét és mindennek időben történő változását. Azt is feltételezhetjük, hogy a hallórendszer magasabb szintjei az információt ehhez nagyon hasonló formában kapják meg. Mindez azt jelenti, hogy egy ilyen inputot kell a hallórendszernek elemeznie oly módon, hogy kinyerje belőle a hangok jellemzőit, és külön-külön objektumokba csoportosítsa az egyszerre hallható akusztikus információt. Jelen esetben a spektrogram által megragadott külvilági esemény egy dal rövid részlete, amelyben egyszerre szól egy dob, egy basszusgitár, egy zongora és egy énekhang. A spektrogramot nézve azonban az egyes hangszerek hangjának szétválasztása lehetetlen feladatnak tűnik. Mégis, hallórendszerünk képes arra, hogy kizárólag a spektrogramban található információk alapján szétválassza ezt a négy hangszert, majd pedig kövesse az általuk lejátszott dallamot is.

Ez az egyszerű példa jól szemlélteti, hogy hogyan működik a hallási észlelés. Az akusztikus világ különálló hangforrásokat tartalmaz, amelyek különböző fizikai jellemzőkkel rendelkező hangokat bocsátanak ki. Az észlelés során az a feladatunk, hogy a külvilág pontos leképezését alakítsuk ki, vagyis a hangforrások mentális reprezentációjának hűen kell tükröznie azok különállóságát. Ha négy hangszer szólt egyszerre, akkor négy hangszer mentális reprezentációját kell kialakítanunk. A probléma az, hogy az egy időben hallatszódó hangok egyszerre érkeznek a fülbe, és egyszerre történik meg az idegi impulzusokká való átalakításuk is. Ez azt jelenti, hogy a külvilágban elkülönülő források a transzdukció során összekeverednek, és nem őrzik meg elkülönültségüket. Az észlelés magasabb rendű folyamatainak ezért az a feladatuk, hogy mintegy „rendet tegyenek”: eldöntsék, hogy melyik akusztikai információ (frekvencia, intenzitás, lokalizáció) melyik hangforráshoz tartozik, vagyis szétválasszák azokat. Ezt a szétválasztási műveletet nevezzük Bregman (1990) nyomán hallási színtérelemzésnek.

A színtérelemzés problémájával egyébként nemcsak a hallásnál találkozhatunk, hanem a látásnál is. A vizuális információ esetében persze lényegesen egyszerűbb a feladat, mert a külvilág leképezése során megmaradnak a tárgyak közötti téri viszonyok. Ennek ellenére az a tény, hogy a háromdimenziós világ a retinán két dimenzióban képeződik le, jelentősen megnehezíti az észlelés arra irányuló feladatát, hogy a külvilág pontos mását hozza létre. Nézzük meg a 10.13. ábrát, amely egyszerű építőkockák rajza.

10.13. ábra. A vizuális színtérelemzés illusztrációja

Első ránézésre világos számunkra, hogy az ábrán A-val és 5-vel jelölt részek egyetlen tárgyhoz tartoznak, amelyet azonban eltakar egy másik elem. Annak ellenére így gondoljuk ezt, hogy az A és B elem között nincs folytonosság, és elvileg nyugodtan tekinthetnénk őket két különálló síkbeli négyszögnek, ahelyett hogy egyetlen térbeli, mélységgel rendelkező téglatestnek látjuk. A retinális információ mindkét interpretációt lehetővé teszi, annak ellenére, hogy a valóságban csak a második helyes. Feltételezhetjük, hogy a látás esetében működnek olyan feldolgozási folyamatok, amelyek a kétértelmű érzékszervi információból a helyes mentális reprezentációt alakítják ki. Amire ezzel a példával rá szeretnénk mutatni, az az, hogy a külvilág megfelelő leképezése érdekében a látás esetében is az első lépés annak megállapítása, hogy mely jellemzők tartoznak össze, és melyek nem. Ez olyan, mintha az összetartozó részeket egyszerűen azonos színűre festenénk, és azt mondanánk, hogy azok az elemek tartoznak össze, amelyek azonos színűek. Feltételezhetjük, hogy a hallás esetében is valami ilyesmit kell csinálnunk: az összetartozó, egy forrásból származó részeket (mondjuk a koncert hallgatásakor a gitár hangját) csoportosítanunk kell, és el kell választanunk a többi, ezzel egy időben hallható hangtól.

A csoportosítás és elválasztás folyamata emlékeztethet bennünket a látás kapcsán tanult figura-háttér elkülönítésre. Tudjuk, hogy a figura a vizuális információ azon része, amelyre a figyelmünk irányul, és háttérként szolgál az összes többi olyan jellemző, ami nem része a figurának. Tudjuk azt is, hogy a figura-háttér elkülönítést az úgynevezett Gestalt-elvek vezérlik: például a közelség, zártság, hasonlóság és jó folytatás. Abból a tényből kiindulva, hogy a hallási észlelés esetében ugyanaz a feladatunk, mint a látásnál, nevezetesen, hogy elkülönült tárgyak reprezentációját hozzuk létre, feltételezhetjük, hogy hasonló csoportosítási elvek segítik a reprezentáció létrejöttét. Arról, hogy a Gestalt-elvek hogyan működnek a hallásnál, a fejezet későbbi részében még részletesen fogunk beszélni.

A továbbiakban azt tekintjük át, hogy milyen jellemzőkkel rendelkeznek a csoportosítási folyamat eredményeként létrejövő hallási tárgyak vagy más néven a hallási láncok.

A hallási láncok

A hallási tárgyak helyett a továbbiakban a hallási lánc kifejezést fogjuk használni a hallási észlelés alapegységének megjelölésére. A „tárgy” szó ugyanis nagyon erősen kötődik a vizuális észleléshez, és ezért félrevezető lehet a hallás tanulmányozásakor. Milyen különbségek fedezhetők fel a vizuális tárgyak és a hallási láncok között? A látás esetében a tárgyak a külvilág azon objektumai, amelyekről a visszavert fény eljut a szemünkbe, és olyan tulajdonságokkal rendelkeznek, mint alak, méret, szín stb. Ezzel szemben a hallás során csak olyan dolgokról szerezhetünk tudomást, amelyekkel valami történik, és emiatt hangot bocsátanak ki. A szél átfúj a fák levelein, és megzörgeti őket, egy harkály kopogtat a fa törzsén, egy mentő szirénázik a távolban. Ezek mind egyedi, különálló és aktív történések (a hallás passzív visszaverődéseket is képes feldolgozni – ennek segítségével tájékozódik például a denevér; ezeket azonban nagyon ritkán használjuk, így nem foglalkozunk külön velük). A hallási lánc kifejezés ezekre a történésekre, más néven hallási eseményekre vonatkozik. A tárggyal szemben a lánc szó jobban megragadja a hallási események azon tulajdonságát, hogy ezek legtöbb esetben időben elnyúló, idői kiterjedéssel rendelkező történések.

Felmerülhet a kérdés, hogy miért nem hívjuk a hallási láncokat egyszerűen hangoknak.

Ennek két oka is van. Egyrészt egy esemény (pl. egy dallam) több hangot is magában foglalhat, és emiatt érdemes elkülönítenünk az esemény alkotórészeit (a hangokat) magától az eseménytől (a hallási lánctól). Ráadásul egy hallási lánc egyéb események hierarchikus szerveződését is tartalmazhatja: láncnak hívhatjuk az egyik hangszer által játszott dallamot, de az összes, egyszerre szóló hangszer is lehet egy lánc, ha például az egyéb környezeti zajoktól különítjük el. A másik oka a lánc kifejezés használatának, hogy a hang egyszerre fejezi ki a fizikai történést és ennek mentális reprezentációját. Ezért a továbbiakban a hallási láncot fogjuk használni a mentális reprezentációkra, míg a fizikai történésre a hangot vagy hallási eseményt.

A hallási láncok tehát a hallási észlelés alapegységéül szolgálnak, és így a tárgyak hallásbeli megfelelői. Azokhoz hasonlóan bizonyos összetartozó tulajdonságok csoportját reprezentálják. Vagyis mindaz a jellemző, amit a hallórendszer feldolgoz (hangerő, hangmagasság, hangszín, lokalizáció), végül a hallási láncokhoz rendelődik hozzá. Vagyis, ahogy már említettük, a hangmagasság vagy hangosság nem állhat önmagában, hanem mindig valamilyen dologhoz kapcsolódik. Ahogyan a vizuális világban a szín csak egy adott tárgy tulajdonságaként jelenik meg, és nem önmagában (kivételt a prizmával összetevőire bontott fény színei jelenthetnek), úgy a hangmagasság is csak egy hallási lánc jellemzőjeként szerepelhet, és nem önmagában.

A probléma ott kezdődik, ha egyidejűleg több hang is szól. Ekkor elvileg sok különböző lánc jön létre, amelyek mindegyike megfelel a külvilágban egy-egy hangforrásnak. A problémát az okozza, hogy a sok hangforrás akusztikai jellemzői összekeverednek, mivel ezek egyszerre érik el a fület, és egyszerre kerülnek feldolgozásra. Ahogy azt fentebb láttuk, a hallási színtérelemzésnek pontosan az lesz a feladata, hogy a hallási láncokhoz hozzárendelje a nekik megfelelő akusztikai tulajdonságokat.

A hallási láncok alkotják tehát észlelésünk középpontját, amelyekhez a perceptuális jellemzőket hozzákapcsoljuk. Az objektumok elkülönítése azonban csak egy köztes lépés a külvilág reprezentációjában és megértésében: az elkülönítéssel annyit teszünk, hogy kijelöljük, mely fizikai jellemzők mely dolgokhoz kapcsolódnak. Azt is mondhatjuk, hogy a hallási színtérelemzés egy szükséges, de nem elégséges lépés a hallási láncok létrejöttében, mivel ezt még nagyon sok feldolgozási lépcső követi addig, amíg felismerjük és kategorizáljuk a körülöttünk lévő világ dolgait. Ha ez nem történik meg, akkor nem zongora- meg énekhangot hallunk, hanem különböző hangosságú és hangmagasságú hangok kavalkádját, amelyek mindenféle jelentés és értelem nélkül kavarognak körülöttünk. Sajnos azonban nagyon keveset tudunk még azokról a folyamatokról, amelyek végül értelemmel és jelentéssel ruházzák fel a hallott világot. Emiatt az alábbiakban elsősorban a hallási láncokat létrehozó csoportosítási folyamatokkal foglalkozunk.

A továbbiakban arról lesz szó, hogy hogyan valósítja meg a hallórendszer az egyidejűleg beérkező hallási információ láncokra bontását. Mielőtt erre rátérnénk, tisztáznunk kell, hogy milyen módon szerveződhet a hallási információ. Kétféle szerveződés képzelhető el ugyanis: a szekvenciális vagy horizontális szerveződés és a spektrális vagy vertikális szerveződés. Ezt a két szerveződést legjobban egy kotta illusztrálja: a kottában egymást követő hangok, amelyek a zene dallamát adják meg, szekvenciálisan, vagyis sorozatosan, egymás után szerveződnek. Az egymás feletti hangok, amelyek egyszerre szólalnak meg, és egy harmóniát vagy több hangszert jelölnek, vertikálisan vagy spektrálisan szerveződnek. Ha visszatérünk a fejezet elején említett koncertpéldánkra, akkor azt mondhatjuk, hogy az egyszerre megszólaló hangszerek közül egynek a kiválasztása a spektrális szerveződést példázza, az egy hangszeren játszott dallam követése pedig a szekvenciális szerveződésre példa.

12.2. táblázat -

ALBERT BREGMAN

Albert Bregman 1936-ban született Torontóban, Kanadában. Itt járt egyetemre és szerzett diplomát pszichológiából 1959-ben. PhD-fokozatát a Yale-en szerezte kísérleti pszichológiából 1963 -ban. Ezt követően a Harvar- don tanított és kutatott, majd 1965-ben visszatért Kanadába, Montrealba, a McGill Egyetemre, ahol jelenleg is mint professzor emeritus dolgozik.

Bregman kutatásaiban elsősorban a hallási színtér elemzésének problémájával foglalkozik, amelyet több mint ötven tudományos publikációban tárgyal. Az 1990-ben megjelent Auditory Scene Analysis című könyve foglalja össze addigi kutatásainak eredményét, és a könyv azóta is a hallási színtérelemzés alapművének számít. Lényegében Bregman kutatásai hívták fel elsőként a figyelmet arra, hogy a hallási észlelés tanulmányozása nem a hangosság- és hangmagasság-észlelés megértésével ér véget, hanem valójában ott kezdődik.


A hallási láncok szekvenciális szerveződése

Az idő és a frekvencia szerepe a hallási láncok kialakulásában

Azt a folyamatot, amelynek során az észlelőrendszer az egyes láncokat egymástól elválasztja, hallási láncra bontásnak nevezzük (Bregman 1990).

A láncra bontás jelenségét laboratóriumi körülmények között az alábbi, azóta klasszikussá vált kísérlettel vizsgálták (Bregman-Campbell 1971). A kísérleti személyeknek egy tiszta hangokból álló hangsort játszottak le, amely 3 mély és 3 magas hangot tartalmazott. A hangokat úgy mutatták be, hogy váltogatták a mély és magas hangokat, például 1-4-2-5-3-6 sorrendben (az 1, 2, 3 a mély, a 4, 5, 6 a magas hangokat jelöli). A hangok közötti idői távolságot változtatták, és azt az eredményt kapták, hogy ennek függvényében megváltozott a hangsor észlelése. Ha a hangokat nagy idői távolsággal, vagyis lassan játszották le, akkor a személyek az eredeti sorrendben hallották a hangokat, vagyis a mély és magas hangok váltakozását észlelték. Ha azonban egyre kisebbre állították az idői távolságot, vagyis egyre gyorsabban játszották le a hangokat, akkor ez az észlelet megváltozott: már nem váltakozó mély és magas hangokat hallottak a személyek, hanem egy csak mély hangokat tartalmazó dallamot és egy ezzel párhuzamosan hallható, csak magas hangokat tartalmazó dallamot. Vagyis az eredeti 1-4-2-5-3-6 sorrend helyett az 1-2-3 és 4-5-6 észleléséről számoltak be (10.14. ábra). A két párhuzamosan hallható hallási lánc kialakulása valójában illúzió: két láncot hallunk, holott csak egy hangforrás szólt. Ezt a jelenséget ezért illuzórikus láncra bontásnak nevezzük, elkülönítve ezzel a láncra bontásnak attól az általános jelenségétől, amellyel a hallási tárgyakat elkülönítjük.

10.14. ábra. Az illuzórikus láncra bontás jelensége. A pontok az egyes hangokat jelölik, a folytonos vonal illusztrálja a hangsor eredeti észleletét, a szaggatott vonal pedig a láncra bontás révén létrejövő, két párhuzamosan hallható hangsor észleletét

Az illuzórikus láncra bontásnál tehát úgy tűnik, hogy a hallórendszer a tempótól függően az eltérő jellemzők alapján csoportosítja a hangokat: eredetileg a csoportosítás a hangok időbeli elrendeződése mentén történt meg, de később a nagyon gyors tempónál a hangok a hangmagasságuk szerint csoportosultak. Hogyan szemlélteti ez a kísérlet a hallási láncok kialakulását? Azt mondhatjuk, hogy a mély és a magas hangok eredetileg egyetlen hallási lánchoz tartoztak, egyetlen eseményként fogták fel őket a kísérleti személyek. A gyorsítás hatására azonban a hangok két különálló láncra bomlottak fel: az egyik láncba a mély, a másikba pedig a magas hangok kerültek. Vagyis ugyanazt a fizikai ingert a bemutatás jellegzetességétől függően hol így, hol úgy „értelmezték” a kísérlet résztvevői, azaz a kétféle ingeridőzítés két eltérő észleletet eredményezett.

Az illuzórikus láncra bomlásnál a láncok kialakulását két tényező befolyásolta: egyrészt a hangok frekvenciája, másrészt pedig a közöttük lévő idői távolság. A hasonló elrendezést használó további vizsgálatokban kimutatták, hogy ez a két tényező egyszerre határozza meg, hogy az egymást követő hangok egy láncba tartoznak-e (egybeolvadás), vagy szétválnak két külön láncra (szétválás). A szétváláshoz ugyanis nem elég, ha megfelelő gyorsasággal játsszuk le a hangokat, az is szükséges, hogy közöttük elég nagy frekvenciabeli eltérés legyen. Egyfajta kompromisszum valósul meg a frekvencia és idő között: minél nagyobb a frekvenciabeli távolság, annál kevésbé kell gyorsan lejátszani a hangokat a szétváláshoz, és minél kisebb a frekvenciabeli távolság, annál gyorsabban kell lejátszani őket.

A láncra bomlás ebben a nagyon egyszerű szituációban valójában még ennél is bonyolultabb. Bizonyos határok között ugyanis a hallgató dönthet arról, hogy egyetlen láncot vagy több láncot akar-e hallani: ugyanaz a hangsor ugyanolyan jellemzők mentén észlelhető így is, úgy is. Ez voltaképpen hasonlít a kétértelmű ábrákra: bár az ingerfeltételek ugyanazok, hol fiatal hölgyet, hol idős nénit láthatunk, és az észlelet tudatosan változtatható. Ez arra utal, hogy a láncra bontás esetén is magas szintű észlelési folyamatok működnek.

Vannak ugyanakkor bizonyos határok, amelyek korlátozzák ezt a választási lehetőséget. Azt a határt, ami felett a hangokat már nem lehet egy hallási áramlatba szerveződőnek hallani, idői koherenciahatárnak (IKH), azt a határt pedig, ami alatt nem lehet az egymást követő hangokat külön áramlatban hallani, hasadási határnak (HH) nevezzük. Ezt a két határt szemlélteti a 10.15. ábra. Látható, hogy a két határt az idő és a frekvencia együttesen határozza meg, vagyis a kettő komplex interakciója befolyásolja a hallási láncok létrejöttét.

10.15. ábra. Az idõi koherenciahatár (IKH) és a hasadási határ (HH)

A két határt a következőképpen kell értelmeznünk: az idői koherenciahatár azt a határt jelzi, ahonnan kezdve a hallórendszer mindenképpen a hangsor két láncra bontására kényszerül, vagyis, akármennyire is szeretnénk, nem vagyunk képesek egy láncba tartozónak hallani a hangokat. Ahogyan a 10.15. ábrán látható, az idői koherenciahatár úgy alakul, hogy kb. 100 milliszekundumos hangok közötti idői távolság felett meredeken nő a frekvencia értéke. Ez azt jelenti, hogy nagy idői távolság esetén nagy frekvenciakülönbség szükséges ahhoz, hogy a hangsort két láncra bontva halljuk.

A hasadási határ viszont azt a korlátot jelzi, ami alatt már nem tudjuk a hangsort két láncra bomlónak hallani, vagyis a hangok mindenképpen egy láncba tartozónak hallatszanak. Szintén a 10.15. ábrán látható, hogy ez a határ kevésbé változik meg: a hangok közötti idői távolságtól többé-kevésbé függetlenül, nagyjából hasonló frekvenciaeltérés esetén van az a határ, ami a hangsort mindenképpen egy láncban tartja.

A továbbiakban arra keressük a választ, hogy miért jön létre egyáltalán két láncra bomlás ebben a kísérletben? Azt mondtuk, hogy a fenti kísérletben a két párhuzamosan hallható hallási lánc kialakulása valójában egy illúzió. Ugyanakkor tudjuk, hogy az illúziók mindig valamilyen észlelési mechanizmus működéséből származnak, pontosabban abból, hogy a mechanizmus az adott körülmények között nem működik megfelelően. Az tehát a kérdés, hogy az illuzórikus láncra bomlás esetében milyen mechanizmusok működhetnek.

Kétféle magyarázat is létezhet, élettani és pszichológiai. Az egyik élettani magyarázat szerint a hallórendszer periferiális mechanizmusai felelősek a láncra bomlásért. Eszerint a szétválás csak akkor jöhet létre, ha a hangok között elég nagy frekvenciabeli eltérés van ahhoz, hogy eltérő kritikus sávokkal rendelkező szőrsejteket hozzanak aktivációba az alaphártyán. Ha két hang egymáshoz közeli frekvenciával rendelkezik, akkor feltételezhetően ugyanazt a szőrsejtet aktiválja, ez pedig nem teszi lehetővé a két külön lánc létrejöttét. Ez az elmélet tehát a hasadási határ létrejöttét magyarázza jól. Egy másik élettani magyarázat azon alapul, hogy léteznek az agyban olyan idegsejtek, amelyek nem bizonyos frekvenciákra, hanem ezek megváltozására érzékenyek. Az elmélet szerint a láncra bomlás azért következik be, mert ezek a „változásdetektorok” nem képesek követni a gyors és nagymértékű frekvenciaváltozásokat, és így a kisebb, egy láncon belüli változásokkal tudnak csak foglalkozni. Ez az elképzelés az idői koherenciahatárra ad inkább magyarázatot. Mindkét élettani elméletre jellemző, hogy az illuzórikus láncra bomlást az észlelőrendszer egyfajta hibás működésének tartja: azért jön létre, mert a hallórendszer nem rendelkezik elég nagy frekvenciaérzékenységgel, vagy nem képes elég gyorsan követni a változásokat.

A Bregman nevéhez fűződő pszichológiai elmélet ezzel szemben az illuzórikus láncra bomlást az észlelőrendszer sikeres működésének tartja. Az elmélet szerint a hallórendszer ebben a helyzetben is egy hallási színtérelemzést végez el, vagyis megpróbál következtetni arra, hogy a hangok milyen forrásból származnak. Ehhez a perceptuális szerveződés Gestalt-elveit használja, például a hasonlóság vagy közelség elvét, amelyek szerint az egymáshoz hasonló vagy közel lévő hangok feltételezhetően egy forráshoz tartoznak. Ezek az elvek ugyanakkor egy olyan általánosabb elv részeinek tekinthetők, amely azt írja le, hogy milyen jellemzőkkel rendelkeznek a hallási láncok általában. Például a hallási láncokra jellemző, hogy folyamatosak, és bizonyos állandósággal rendelkeznek, vagyis nem változnak meg egyik pillanatról a másikra. Így, amíg a fenti kísérletben a hangok lassan követik egymást, addig a közelség elve érvényesül, vagyis az egymás melletti hangokat egy láncba csoportosítjuk, annak ellenére, hogy viszonylag nagy frekvenciabeli változások vannak a láncon belül. Ez a változás ugyanis még belefér az általános elvbe, hiszen lassan történik. Gyorsabb tempó esetén azonban az idői közelséggel szemben egyre inkább a frekvenciabeli hasonlóság válik dominánssá, ugyanis egyre kevésbé lesz valószínű az, hogy az egymás melletti hangok egyetlen forrásból származnak, mivel túl nagy és túl gyors változásokat tartalmaznak. Vagyis azt mondhatjuk, hogy a hangok csoportosítása a Gestalt-elvek alapján történik ugyan, de ezeket a hallási színtérelemzés általános elveinek megfelelően használjuk fel.

A láncra bomlás egyik magyarázata tehát az észlelés hibájának, a másik viszont az észlelés sikerének tartja azt. Van-e mód arra, hogy ezt a két eltérő magyarázatot összeegyeztessük? Bregman szerint igen. A két magyarázat ugyanis eltérő szintet képvisel, az egyik élettani, a másik pedig pszichológiai. Ezért elképzelhető, hogy a láncra bomlás élettani szinten hibának minősül ugyan, de pszichológiai szinten sikernek számít, hiszen az észlelést szolgálja – mindkettő lehet igaz, csak éppen eltérő nézőpontból. Bregman szerint ez olyan, mint a mamutcsapda: fizikai szempontból az a tény, hogy a csapda teteje beszakad a mamut alatt, hibának számít, de ez a hiba egy másik szinten sikerhez vezet, nevezetesen az állat elejtéséhez és a vadászok jóllakásához.

Összefoglalva, az illuzórikus láncra bomlás jelensége jól modellezi az általános hallási láncok kialakulásának folyamatát, és segítségével ellenőrizhetők az ezekkel kapcsolatos elméleti feltételezések.

Figura-háttér hatás a láncra bomlásban

Ha létrejönnek a hallási láncok, akkor az az érdekes dolog történik, hogy a két lánc közül csak az egyikre tudunk figyelni, a másik mintegy a háttérben marad. Ez szintén ismerős jelenség: a látás esetében a figura-háttér hatásnál találkoztunk már azzal, hogy egyszerre csak egy tárgyra figyelünk, és minden más a háttérben marad. A láncra bomlásnál is megvalósítható az, hogy hol az egyik, hol a másik láncra figyeljünk. A nem figyelt lánc kevésbé jól hallható, és kevésbé vesszük észre, ha valamilyen változás történik benne. Ez azt mutatja, hogy a hallási láncok a vizuális tárgyakhoz nagyon hasonlóan viselkednek, nemcsak hogy elkülönülnek egymástól, de valamelyik rögtön megragadja a figyelmünket (vagy tudatosan ráirányítjuk), és ekkor a másik kevésbé pontosan észlelhető.

Annak bizonyítására, hogy valóban csak egyetlen láncra figyelünk egyszerre, Bregman és Rudnicky (1975) az alábbi kísérletet végezte el. A kísérleti személyek feladata az volt, hogy két eltérő hangmagasságú hang, A és B sorrendjét megállapítsák. A hangok különböző sorrendben követhették egymást. Ez a feladat önmagában nagyon könnyű, még viszonylag nagy tempó esetén is. Ha azonban ezeket a hangokat két másik elterelő hanggal (ezeket jelöljük E-vel) mutatták be, E-A-B-E vagy E-B-A-E sorrendben, akkor az A-B hangpár sorrendjének megállapítása nagyon nehézzé vált (10.16. ábra). A hangpár ugyanis elveszítette egyediségét, és egy nagyobb mintázat részévé vált, ekkor azonban már gyors bemutatás mellett nagyon nehéz volt a sorrendjük megállapítása.

10.16. ábra. A Bregman–Rudnicky-kísérlet (1975) ingeranyagának illusztrációja

Vegyük észre, hogy ebben az esetben az E-A-B-E hangsor egyetlen láncot alkot, ugyanis nincs olyan jelzés, ami arra utalna, hogy két különálló hangforrásból származnának. Feltételezhetjük ugyanakkor, hogy ha sikerülne valami olyan bizonyítékot szolgáltatni az észlelőrendszer számára, ami alapján szétválasztaná az E hangokat és az A-B hangpárt, akkor – mivel az A-B újból egyedül alkotna egy hallási láncot – ismét könnyű lenne a sorrendjüket meghatározni. A kutatók valóban ezt az eredményt kapták. További hangok, úgynevezett „foglyulejtők” (F) hozzáadásával a 10.16. ábrán látható hangsort hoztak létre, és most már ebben az F-F-F-E-A-B-E-F-F sorozatban kellett az A-B sorrendjét megállapítani. Ahogy az ábrán látható, az F hangok hangmagassága közelebb volt az E, mint az A-B hangok magasságához. Emiatt a F hangokból létrejövő lánc azonos láncba csoportosította az E hangokat, vagyis valóban mintegy foglyul ejtette azokat. Az A-B pár viszont frekvenciabeli eltérése miatt egy ezektől eltérő láncot alkotott. Vagyis két lánc: egy F-F-F-E-E-F-F és egy ezzel párhuzamosan hallható A-B jött létre. A hipotézisnek megfelelően ennek a csoportosításnak valóban az lett az eredménye, hogy az A-B sorrend megállapítása pontosabbá vált, mivel most már csak ez a két hang alkotta a figyelt hallási láncot. A kísérlet eredménye tehát úgy értelmezhető, hogy egyszerre csak egy lánc az, amelyre figyelünk, és csak a figyelt lánc tulajdonságait dolgozzuk fel. A kísérletben bizonyítást nyert az is, hogy a láncok ugyanúgy viselkednek a hallási környezettől – vagyis a háttértől – elválasztva, mint amikor önmagukban szerepelnek, mindenféle zavaró ingerek nélkül. Vagyis úgy tűnik, hogy az észlelőrendszer jó munkát végez a láncokra bontási folyamatban, hiszen ennek eredményeképpen egy hasonló jellemzőkkel rendelkező lánchoz jutunk, mint amikor a lánc önmagában állt, és nem kellett elválasztanunk azt a többi akusztikai eseménytől.

Az eddigiekben a hallási láncok szekvenciális szerveződésében két akusztikus jellemző szerepét hangsúlyoztuk: a hangok közötti idői távolságot és a frekvenciájuk különbségét. De mi a helyzet a többi jellemzővel? Menynyire fontosak ezek, és fel lehet-e őket használni a hangforrások azonosításában és így a hallási láncok létrehozásában?

Egyéb tényezők szerepe a hallási láncok kialakulásában

A hallási láncok szekvenciális szerveződésének célja, hogy az egy hangforráshoz tartozó hangsorokat csoportosítsa. Láttuk, hogy a csoportosítást a hasonlóság és közelség szerveződési elvei alapján végezzük el, és elsősorban a hangok közötti idői és frekvenciabeli távolságot vesszük figyelembe. Ugyanakkor azt, hogy több hang egy hangforráshoz tartozik-e, egyéb jellemzők is alátámaszthatják. Így például feltételezhető, hogy az azonos téri irányú, hangosságú vagy hangszínű hangok ugyanabból a forrásból származnak, vagyis egyetlen akusztikus esemény részei. Nézzük meg, hogy ezek a jellemzők hogyan befolyásolják a láncra bomlást.

  1. Lokalizáció. Ha hangforrások szétválasztásáról beszélünk, akkor azt gondolhatnánk, hogy ennek leghatékonyabb módja, hogy a hangokat a téri irányuk, vagyis a lokalizációjuk alapján választjuk el egymástól. Azok a hangok tartoznának egy láncba, amelyek azonos helyről származnak. Valóban vannak bizonyítékok arra, hogy a hallási láncra bontásban felhasználjuk a téri információt, de úgy tűnik, hogy nem ez a legerősebb kulcs. Ez azt jelenti, hogy ha a téri lokalizáció valami miatt konfliktusba kerül egy másik típusú információval (például a hangok frekvenciájával), akkor nem a lokalizáció alapján fogjuk a hangokat csoportosítani. Ezt igazolta Diana Deutsch skálaillúziója (Deutsch 1975). A kísérlet során két zenei skálát, egy emelkedőt és egy ereszkedőt játszottak le a kísérleti személyeknek. A skálák hangjait fülhallgatón keresztül játszották le úgy, hogy a két fülbe eltérő, de egyszerre megszólaló hangok érkeztek (10.17. ábra).

10.17. ábra. A skálaillúziót létrehozó ingerminta. Az a) részben fülenként, a b) részben pedig a skálába tartozás szerint vannak feltüntetve a hangok. A c) rész mutatja, hogy a kísérleti személyek hogyan észlelték valójában a hangokat. Kék hangjegyek: bal fülbe érkező hangok; piros hangjegyek: jobb fülbe érkező hangok

Ahogyan az ábra a) részén látható, az emelkedő és ereszkedő skálákat úgy mutatták be, hogy a skála hangjai váltakoztak a két fül között. Amikor a jobb fülben az emelkedő skála egyik hangja szólt, akkor eközben a bal fülben az ereszkedő skála egyik hangja, majd pedig váltottak, és a jobb fülbe érkező következő hang már az ereszkedő skálához tartozott. (Szánjunk egy kis időt ennek az ingermintának a megértésére; a http://www.brl. ntt.co.jp/IllusionForum/basics/auditory/onkai-e.html oldalon meg is hallgathatjuk.) A két szimultán hangzó és a két fül között váltakozó hangsort kétféleképpen lehet csoportosítani: aszerint, hogy melyik fülbe érkeztek, és aszerint, hogy melyik skálába tartoztak. Az ábra a) része mutatja a fülek szerinti csoportosítást, a b) rész pedig a skálába tartozás szerinti csoportosítást. Kérdés, hogy a valóságban hogyan csoportosítjuk a hangsorokat.

A kísérleti személyek valójában mindkettőtől eltérően észlelték a hangokat, és a legtöbben az ábra c) részén látható észleletről számoltak be. Vagyis két, egyszerre hallatszódó skálát észleltek; az egyik fülben egy ereszke- dőt, a másikban pedig egy emelkedőt, de mindezt úgy, hogy amikor a két hangsor találkozott (lásd a vonást az ábrán), akkor azok nem keresztezték egymást, hanem mindkettő mintegy visszafordult. Mindez azt jelenti, hogy a személyek frekvencia szerint, és nem téri helyzet szerint csoportosították a hangokat. Ez annál is meglepőbb, mert az egyes hangok nagyon erős téri minőséggel rendelkeztek: mindegyik egy adott fülhallgatóból érkezett, és ez teljesen egyértelműen meghatározta, hogy jobbról vagy balról származik-e a hang. Ennek ellenére a hallási láncok kialakulásában a frekvenciabeli hasonlóság és jó folytatás képes volt elnyomni a téri helyzetből fakadó hasonlóságot.

  1. Hangosság. A lokalizációhoz hasonlóan a hangosságot is ki tudjuk használni annak érdekében, hogy csoportosítsuk a feltételezhetően egy hangforrásból származó hangokat. Egyes vizsgálatok szerint 3-4 dB-es különbség elég ahhoz, hogy a hangokat külön hallási láncra bontsuk. Ugyanakkor a hangossággal kapcsolatban is azt kell elmondanunk, mint a lokalizációnál: ez a frekvenciánál gyengébb észlelési kulcs, vagyis ha esetleg a hangosság és a frekvencia ellentmond egymásnak, akkor a frekvencia alapján történő csoportosítás kerül ki győztesen. Feltételezhető, hogy a hallási láncok kialakulásában a hangosság nem annyira az egy objektumhoz való tartozásra utal, hanem inkább a hangok kezdetét és végét jelzi. Az előző fejezetben a hangszín tárgyalásakor láthattuk, hogy az egyes tárgyak hangjai közötti különbségért nemcsak a spektrális tartalom felelős, hanem a hangok burkológörbéje is, ami pontosan a hangerő váltakozását jelenti. A komplex hallási tárgyaknak tehát alapvető, azaz inherens tulajdonsága, hogy bizonyos mértékű hangerőváltozást mutatnak, így ezt a jellemzőt nem a legszerencsésebb a tárgyak elkülönítésére felhasználni. Azt mondhatjuk, hogy ha jelen van hangosságbeli eltérés is a hangok között, akkor ez erősítheti a láncra bomlást, önmagában azonban nem túl erős csoportosító jellemző.

  2. Hangszín. A lokalizációtól és a hangosságtól eltérően a hangszín nagyon is fontos jellemző a szekvenciális csoportosításban. Ahogy a 9. fejezetben láttuk, a hangok felismerését a hangszín teszi lehetővé, ez az a jellemző, ami elkülöníti egymástól az azonos hangmagasságon és hangosságon megszólaló hangszerek hangját. Feltételezhető tehát, hogy lényeges a szerepe a hangok csoportosításában.

Warren és munkatársai (1969) kísérlete arra mutatott rá, hogy a különböző hangszínnel rendelkező hangok sorrendjét nagyon nehéz megállapítani. Említettük már, hogy a hangok sorrendjét akkor tudjuk pontosan megállapítani, ha egy láncba tartoznak. Ezért, ha külön láncba csoportosítjuk őket, akkor nehezebb lesz a sorrend megállapítása, mivel a láncok közötti sorrendet sokkal nehezebb megállapítani, mint a láncon belülit. Warrenék négy különböző hangot használtak: egy sziszegő, egy berregő, egy tiszta és egy beszédhangot. Mindegyik hang 200 milliszekundum hosszú volt, és szünet nélkül követték egymást újra és újra, ugyanolyan sorrendben lejátszva. A viszonylag hosszú bemutatási idő ellenére a kísérleti személyek képtelenek voltak a hangok sorrendjét megállapítani. Ez az eredmény értelmezhető úgy, hogy a nagyon különböző hangszínek miatt az észlelőrendszer minden hangot külön hallási láncba csoportosított, és ez megnehezítette a sorrendjük megállapítását.

Egy másik kísérletben Van Noorden (1975, idézi Bregman 1990) arra volt kíváncsi, hogy azok a komplex hangok, amelyekből kivették az alaphangot, vajon melyik jellemzőjük alapján csoportosulnak: a hiányzó alaphang ellenére is létrejövő hangmagasság vagy a spektrális tartalom, vagyis a hangszín alapján. Azt az eredményt kapta, hogy ha a hangok magassága ugyanolyan volt, de eltérő harmonikusokat tartalmaztak (az eltérő harmonikusok természetesen vezethetnek ugyanolyan hangmagassághoz!), akkor a más hangszínű hangok egy külön hallási láncot alkottak. Ha ellenben a magasságuk különbözött, de a harmonikusok hasonlóak voltak, akkor egy láncba kerültek. Vagyis úgy tűnik, hogy a hangszín a hangmagasságnál is erősebb csoportosító tényező, mivel az azonos hangszínű hangok az eltérő hangmagasság ellenére nem váltak szét külön láncokra.

A hangszínnek ugyanakkor, bár láthatóan a szekvenciális csoportosítást is vezérli, sokkal lényegesebb a szerepe a hallási láncok spektrális csoportosításában, vagyis abban, hogy az egyszerre hallható hangokat (például egy koncert egyetlen pillanatában egyszerre megszólaló hangszerek hangját) szétválasszuk. A következőkben ezt a spektrális szerveződést fogjuk áttekinteni.

A hallási láncok spektrális szerveződése

A hallási láncok spektrális szerveződése esetén tehát az a kérdés, hogy hogyan bontjuk részekre az egy időben szóló hangokat. Ha újra megnézzük a zenei részlet spektrogramon történő ábrázolását (10.12. ábra), akkor látható, hogy minden időpillanatban több frekvenciatartomány is tartalmaz hangenergiát. Tudjuk, hogy a komplex hangok alaphangból és felharmonikusokból állnak. Ha több komplex hang egyszerre szól, akkor egy adott időpillanatban nagyon sok harmonikus (és több alaphang is) található egyszerre a hangingerben, és ezek átfedésben vannak egymással. A hallási színtérelemzés feladata ebben a helyzetben az, hogy ezeket az átfedésben lévő, összekeveredett harmonikusokat szétválogassa, vagyis megállapítsa azt, hogy melyek járnak együtt, melyek származnak egy forrásból. Ez azzal a következménnyel jár, hogy ha több komplex hang is szól egyszerre, akkor ahhoz, hogy ezek hangszínélménye létrejöjjön, előbb szét kell válogatnunk, hogy mely frekvenciakomponensek mely hangokhoz tartoznak. A 10.18. ábrán látható, hogy hogyan képzelhető el a harmonikusok összekeveredése.

A továbbiakban áttekintünk néhány olyan elvet és szabályt, amelyet felhasználunk a hallási láncok spektrális szervezésére.

10.18. ábra. A különböző alaphanggal rendelkező komplex hangok felharmonikusainak átfedése

Az idő és a frekvencia szerepe a spektrális szerveződésben

Bregman és Pinker (1978) a következő kísérletet végezték el a spektrális tartalom csoportosításának szabályszerűségeit feltárandó. A kísérleti személyeknek három különböző frekvenciájú tiszta hangot mutattak be, a 10.19. ábrán látható módon. A hangokat sokszor ismételték. Ez az ingerminta kétféle észlelethez vezethet: egyrészt hallhatunk egy tiszta hangot (A), amelyet egy két frekvenciakomponensből (B és C) álló komplex hang követ. Ebben az esetben spektrális csoportosítást alkalmaznánk, mivel az egy időben szóló B és C hangokat egy láncba csoportosítanánk. A másik észlelet ezzel szemben a szekvenciális csoportosításon alapulna: ekkor az A és B hangot észlelnénk egy láncba tartozónak, és ezzel párhuzamosan hallanánk a C hangot egy külön lánc részeként. Vegyük észre, hogy ekkor nem hallanánk komplex hangokat, hanem három különálló tiszta hangot.

10.19. ábra. A Bregman–Pinker-kísérlet (1978) ingeranyagának illusztrációja

A kérdés persze az, mitől függ, hogy melyik csoportosítás jön létre. Bregman és Pinker szerint ezt két tényező határozza meg: az A és B hang frekvenciabeli közelsége, illetve a B és C hang időbeli közelsége, azaz egybeesése. Ezt a két tényezőt az ábrán nyilak jelölik. A kísérlet eredménye szerint az A és B hang akkor került egy láncba, és jött létre két párhuzamos hallási lánc, ha frekvenciájuk nagyon hasonló volt. Ez ugyanaz az elv, amit az előzőekben a szekvenciális csoportosításnál láttunk: a hallórendszer azokat a hangokat véli egy forrásból eredőknek, amelyek hasonló frekvenciával rendelkeznek. Ezzel szemben a B és C hang akkor került egy láncba, és következésképpen akkor jött létre a kettő kombinációjával a komplex hang, ha a két hang kezdete – és lehetőség szerint a vége is – egybeesett, vagy más szóval szinkronban volt. A későbbiekben látni fogjuk, hogy a spektrá- lis szerveződésnél a harmonikusok időbeli egybeesése játssza az egyik legfontosabb szerepet.

A két tényező – az A-B frekvenciaközelség és a B-C egybeesés – azonban egyszerre működött, és ebből következően versengett egymással. Ha az A és B közelsége kicsi volt, akkor valószínűbb volt ezek szekvenciális szerveződése, ha viszont B és C közel volt egymáshoz, vagy egybeesett, akkor ezek spektrális csoportosulása volt valószínűbb. Emlékezzünk vissza, hogy korábban a szekvenciális szerveződésnél azt láttuk, hogy a frekvenciabeli és időbeli közelség ott is verseng, és attól függően, hogy melyik kerül fölénybe, a hangok az idői sorrend vagy a frekvenciabeli hasonlóság szerint csoportosultak. Úgy tűnik tehát, hogy a versengés a különböző elvek között általános jelenség a hallási színtér elemzésében.

A fenti kísérlet azonban csak egy lehetséges csoportosítási elvet ragad ki, ráadásul egy nagyon leegyszerűsített szituációban. Milyen más szabályok használhatók fel annak érdekében, hogy az átfedő frekvenciakomponenseket szétválasszuk?

Egyéb elvek a spektrális szerveződésben

Az egyik ilyen szabályszerűséget úgy nevezhetnénk, hogy „régi plusz új” szabály. Eszerint, ha az éppen hallható frekvenciakomponensek között van egy olyan csoport, amelyik valamilyen okból egy előzőleg elhangzott hang jó folytatásának tekinthető, akkor érdemes ezeket egy láncba csoportosítani. A megmaradó komponenseket pedig egy vagy több másik lánc létrehozására lehet felhasználni. Ezen szabály működését a következő kísérlettel demonstrálták (van Noorden 1975, idézi Bregman 1990). A kísérleti személyeknek két gyorsan váltakozó hangot mutattak be: egy tiszta hangot (A) és egy komplex hangot (B), amely sok frekvenciakomponensből állt, de ezek közül az egyik megegyezett A-val. Az A-B hangsor gyors és ismétlődő bemutatása során azt figyelték meg, hogy az A hang nem egyszer, hanem kétszer hangzott el. Ez az észlelet úgy jöhetett létre, hogy a B hang komponensei közül az A kivált. Ennek az lehetett az oka, hogy a „régi plusz új” szabály alapján az észlelőrendszer arra következtetett, hogy az A hang folytatódott a B-vel párhuzamosan. Az A hang kiválása ugyanakkor nem befolyásolta nagymértékben a B minőségét (hangszínét), mivel az sok harmonikusból állt, és egyetlen harmonikus kiválása nem okozott túl nagy változást.

Egy következő fontos szabályszerűség a harmonikussági alapelv. Eszerint a hallórendszer hajlamos azokat a harmonikusokat csoportosítani, amelyek feltételezhetően egy alaphanghoz tartoznak. Tudjuk, hogy a harmonikusok frekvenciája az alaphang frekvenciájának egész számú többszöröse. Azt is láttuk, hogy a hallórendszer a komplex hangok hangmagasságának megállapításakor, és főként a hiányzó alaphang esetén történő hangmagasság-észleléskor ki is használja ezt a matematikai összefüggést. Ezt a képességünket azonban nemcsak a hangmagasság megállapítására, hanem annak meghatározására is fel tudjuk használni, hogy mely harmonikusok tartoznak egy objektumhoz.

Hasonlóan fontos csoportosítási szabály a közös sors elve. A fentebb bemutatott Bregman-Pinker-kísérlet (1978) kapcsán már említettük, hogy az egy időben szóló hangok akkor csoportosulnak leginkább, ha egyszerre kezdődnek vagy végződnek. A közös sors elve kicsit általánosabban ugyanerre a dologra vonatkozik. Azt mondja ki, hogy az észlelőrendszer azokat a hangokat fogja csoportosítani, amelyek egyszerre változnak meg. A látásban a mozgás észlelése kapcsán láthattuk már ugyanennek az elvnek a működését, amely például a biológiai-nem biológiai mozgás észlelésénél különleges teljesítménnyel ruházza fel az észlelőrendszert. Kérdés, hogy vajon a hallás esetében a hangok milyen jellemzőjében történhet olyan változás, amely a közös eredetükre enged következtetni. Ha belegondolunk, hogy a hangok milyen fizikai jellemzőkkel rendelkeznek, akkor könnyen rájöhetünk, hogy a frekvencia és a hangerő időbeli változásának, vagyis modulációjának követéséről lesz itt szó (a 8. fejezetben beszéltünk már e két modulációról). Eszerint az egyszerre hallható hangok közül azokat fogjuk csoportosítani, amelyeknek frekvenciája vagy amplitúdója együtt járó, azaz korrelált módon változik meg, illetve amelyek egyszerre kezdődnek és végződnek (a hangszínnel foglalkozó részben láthattuk, hogy a hangkezdet és hangvégződés felfogható az amplitúdóváltozás speciális eseteként).

A közös sors elvének működését láthatjuk Rasch (1978) kísérletében, amely a hangkezdetek egybeesésének hatását vizsgálta a hangok elkülönülésére. A kísérletben két komplex hangot használtak, amelyek hasonló spekt- rális szerkezettel, de eltérő alaphanggal rendelkeztek. Egy időben adva a hangokat, azok elfedték egymást, pontosan úgy, ahogy azt a zajelfedési kísérletekben láttuk. A kísérleti személyek feladata az volt, hogy a magasabb alaphanggal rendelkező hangot detektálják a másik hang hátterében. Ha a két hang pontosan egyszerre kezdődött, akkor a célhang detektálásához annak majdnem olyan hangosnak kellet lennie, mint az elfedő hangnak (10.20. a ábra).

10.20. ábra. A Rasch-kísérlet (1978) ingeranyagának illusztrációja

Ha azonban a célhang előbb kezdődött, akkor azt sokkal kisebb hangerő mellett is észrevették (10.20. b ábra). Ráadásul a célhang akkor is folyamatosan hallhatónak tűnt, ha valójában nem is volt jelen az elfedő hang mellett (10.20. c. ábra)! Ehhez az kellett, hogy a célhang előbb kezdődjön, és hogy az elfedő hang hasonló frekvenciakomponenseket tartalmazzon, mint a célhang. Ezt a jelenséget a folytonosság illúziójának nevezzük, és a zártság Gestalt-elvével magyarázható.

A folytonosság illúziójának van egy ennél is erőteljesebb demonstrációja, amelyet a 10.21. ábra illusztrál. Tegyük fel, hogy az ábrán látható módon három, frekvenciájában változó hangot mutatunk be. Ezeket egyértelműen különálló, gyors hangmagasság-változást mutató hangoknak észleljük. Ha ezek után a hangokat elválasztó szüneteket széles sávú zajjal töltjük ki, a hangok észlelése megváltozik: egyetlen folytonos és hangmagasságában lassan változó hangot fogunk hallani. Ha szemügyre vesszük az ábrát, akkor valójában ez a folytonossági illúzió vizuálisan is nyilvánvaló: nem különálló vonalakat látunk, hanem egy összefüggő vonalat, amelyet néha eltakarnak a széles hasábok. Tehát ezt a hangsort hallgatva a hallási élményünk is hasonló lesz, ugyanígy fogunk hallani egy összefüggő hangot, és néha ezzel együtt rövidebb idejű zajt. A folytonosság illúziója azonban csak akkor valósul meg, ha valóban van bizonyíték arra, hogy a hang az elfedés ellenére folytatódik. Ehhez ebben az esetben egyrészt az járul hozzá, hogy a szüneteket kitöltő zaj tartalmaz olyan frekvenciakomponenst, amely a hangban is megvan, másrészt pedig, hogy a szünet utáni hang jó folytatása a szünet előttinek.

10.21. ábra. A folytonosság illúziója. A vonalak a hangok frekvenciájának változását illusztrálják, a hasábok pedig a szüneteket kitöltő széles sávú zajt

A hangkezdetek közötti különbséget a zenehallgatás közben is maximálisan kihasználjuk annak érdekében, hogy az egyes hangszerek hangjait elválasszuk egymástól. Ahogy a hangszín tanulmányozásakor láttuk, a hangszerek hangjai nemcsak abban különböznek egymástól, hogy eltérő spektrális tartalommal rendelkeznek, hanem a hangkezdeti idejükben is. A húros hangszerek hangja például hirtelen, gyors hangosodással kezdődik, a fúvósoké viszont folyamatosan, hosszabb idő alatt hangosodik fel (természetesen a hosszabb idő alatt néhány tíz milliszekundumot kell érteni).

Az utolsó megemlítendő tényező a spektrális szerveződésben a hangok téri iránya. Egy szimfonikus zenekar esetében a különböző hangszerek hangjai viszonylag eltérő irányból származnak. Ez nagymértékben elősegíti a hangszerek hangjának szétválasztását. Ahhoz azonban, hogy a lokalizáció alapján szét tudjuk választani a hangokat, az szükséges, hogy minden egyes spektrális komponensnek külön-külön rendelkezésre álljon a téri iránya. Ezen a feldolgozási szinten ugyanis még nincsenek teljes hangok, vagyis nem tudunk a hangokhoz téri minőséget rendelni, hiszen éppen azon dolgozunk, hogy ezek a teljes hangok létrejöjjenek. Szerencsére úgy tűnik, hogy a hallórendszer képes arra, hogy a komplex hangokat felépítő frekvenciakomponensekhez külön-külön téri irányokat rendeljen, és ha ez megtörtént, akkor a komponensek téri jellemzőit felhasználhatjuk azok csoportosításában.

Összefoglalásul azt mondhatjuk, hogy a hallórendszer sok különböző akusztikus jellemzőt figyelembe vesz annak érdekében, hogy az egy időben megszólaló hangokat forrásuk szerint szétválasszuk. Ahogy láthattuk, egyszerre több csoportosítási elv is működhet, és ezek versengése és együttműködése vezet oda, hogy az akusztikus világ mentális reprezentációja létrejön. Természetesen a hétköznapi életben ritkán fordul elő, hogy a különböző elvek ellentmondanak egymásnak, és így a legtöbb esetben a hallási színtér elemzése helyes megállapításokat tesz az akusztikus esemény számával, irányával és általános tulajdonságaival kapcsolatban. Ezeknek a mechanizmusoknak a tanulmányozása ugyanakkor felhívja a figyelmet arra, hogy az a teljesen automatikusan és minden erőfeszítés nélkül végbemenő tevékenység, amikor például egy koncert hallgatása közben csak a hegedű melódiájára figyelünk, valójában milyen rendkívül bonyolult feldolgozási folyamatokon alapul.

A hallási objektumok szerveződésének szabályszerűségei azt szolgálják, hogy az egymás után következő, de egy forrásból származó hangok (szekvenciális szerveződés), valamint az egyszerre megszólaló hangok (spekt- rális szerveződés) csoportosuljanak és elkülönüljenek egymástól. A csoportosítást a hallásban is olyan elvek vezérlik, mint amilyeneket már a Gestalt-pszichológusok is leírtak a vizuális információ szerveződésével kapcsolatban. A hallási színtér elemzésében az alábbi csoportosítási elvek érvényesülnek:

  1. Hasonlóság. A hasonlósági elv értelmében azok a hangok fognak egy csoportot alkotni, amelyek valamilyen jellemzőjükben hasonlítanak egymáshoz. Ez a jellemző lényegében az eddig említettek közül bármi lehet: hangosság, hangmagasság, hangszín, téri helyzet. Láttuk, hogy a hasonlóság alapján történő csoportosítással lehet magyarázni Bregman klasszikus, három mély és három magas hangot tartalmazó kísérletében a frekvencia alapján létrejövő két külön láncot, a magas és mély hangok váltakozó idői sorrendje ellenére.

  2. Jó folytatás. Ez az elv a hangforrások azon jellemzőjét használja ki, hogy azokban nem történik hirtelen, illetve nagymértékű változás. Ha a hallórendszer egy ilyen változással találkozik, akkor azt általában úgy értelmezi, hogy a változás pillanatában egy másik forráshoz tartozó hang szólalt meg.

  3. Közös sors. Ez az elv, mint a spektrális szerveződésnél már láttuk, arra vonatkozik, hogy az azonos forrásból származó frekvenciakomponensek általában együtt kezdődnek és végződnek, valamint amplitúdójuk és frekvenciájuk egyszerre változik. A közös sors elve elsősorban a komplex hangok spektrális komponenseinek csoportosításában használható ki, és meglehetősen erőteljes csoportosítási elv, hiszen ahogy Bregman és Pinker

  1. , illetve Rasch (1978) kísérlete kapcsán láttuk, képes felülkerekedni a frekvenciabeli hasonlóságon, valamint az elfedésen.

  1. Zártság. A zártság elve a hallás esetében akkor érvényesül, ha a hangokat időlegesen más hangok elfedik, és emiatt azokról nem áll rendelkezésre szenzoros információ. Ekkor az elfedett hang mégis folyamatosan hallhatónak tűnik. A zártság elve felelős a folytonosság illúziójáért.

  2. Hozzátartozóság (kizáró allokáció). Ezt az elvet azért nevezik hozzátartozóságnak, mert egy hangot, illetve komponenst egyszerre csak egy tárgyhoz, vagyis hangforráshoz lehet hozzárendelni. A kizáró allokáció viszont arra a tulajdonságra utal, hogy ha egy hangot egyszer már felhasználtunk egy adott hallási lánc csopor

tosítására, akkor azt több lánchoz nem rendelhetjük hozzá. A kizáró allokáció valójában egy nagyon általános elv, ami a többi csoportosítási elvvel együtt hat: ha egyszer már valamely másik elv alapján létrejött a csoportosítás, akkor a kizáró allokáció valósítja meg azt, hogy az egyes hangok ne tartozzanak több lánchoz.

A fejezetben részletesen bemutattuk azt is, hogy a hallás esetében az észlelőrendszernek mennyire hasonló problémákat kell megoldania, mint a látásnál. A hallás esetében is tárgyakat, objektumokat észlelünk, nem pedig egymástól független jellemzőket, és ahhoz, hogy létre tudjuk hozni a külvilág mentális reprezentációját, meg kell tudnunk határozni, hogy az egyes jellemzők mely tárgyakhoz kapcsolódnak. Albert Bregman a hallási színtérelemzéssel foglalkozó könyvét így zárja:

„Ami számomra leginkább figyelemre méltó..., az az, hogy sok olyan dolog, amit magától értetődőnek tekintünk, mint például a zenei vagy emberi hang egységessége, valójában csoportosítási folyamatok révén jön létre. A másik dolog, ami szintén nem magától értetődő, hogy a hangok sok olyan egyszerű jellemzője, amelyet – úgy tűnik – automatikusan dolgozunk fel, valójában szintén csoportosítás révén jön létre. Ilyenek például a hangmagasság, hangosság, hangszín, helyzet vagy disszonancia. Végül, számomra nagyon meglepő, hogy a hallás azon folyamatai, amelyek a csoportosítást létrehozzák és ezeket a perceptuális élményeket megalapozzák, nagyon gyorsan, néhány milliszekundum alatt kell, hogy végbemenjenek.” (Bregman 1990, 704-705.)

ÖSSZEFOGLALÁS

  1. A hallási észlelés feladata a világ értelmes, jelentéssel bíró egységekre bontása. Ehhez egyrészt meg kell ha-tároznunk, hogy hol található a tárgy (lokalizáció), másrészt pedig meg kell határoznunk, hogy mi az (azonosítás).

  2. A hanglokalizáció az a folyamat, amelynek során a környezetből származó hangok forrásának helyét és távolságát megállapítjuk. Mivel a hallási információ nem tartalmaz egyértelmű téri információkat, a lokalizáció következtetés révén valósul meg. A lokalizációban binaurális (két füllel észlelhető) vagy monaurális (egy füllel észlelhető) információkat használunk fel.

  3. A binaurális lokalizáció az interaurális hangerőkülönbségen (IHK) és az interaurális idői különbségen (IIK) alapul. Az IHK a fej árnyékoló hatása miatt, az IIK pedig amiatt jön létre, hogy a hang a két fület eltérő időben éri el. Mindkét jelzőmozzanat esetében találunk olyan téri pontokat, amelyek lokalizációja nem egyértelmű. Ezt nevezzük tévesztési kúpnak. A lokalizáció duplexelmélete szerint a két jelzőmozzanaton alapuló lokalizáció eltérő frekvenciájú hangok esetében működik jól: a mély hangok esetében inkább az IIK, a magas hangok esetében viszont az IHK. Valamint van egy olyan frekvenciatartomány (2000-4000 Hz között), amelyben egyik jelzőmozzanat sem működik megfelelően. Az IIK esetében ismert a lokalizáció idegi háttere, melyet a késleltetési vonal elmélete ír le.

  4. A monaurális lokalizáció a fülkagyló formáján alapul, és elsősorban a függőleges irányú lokalizációt segíti. A lokalizációban a fülkagyló tekervényeiről visszaverődő hang spektrális megváltozását használjuk fel, amelyet a fejhez kötött átviteli függvény ír le.

  5. A pszeudofonnal végzett vizsgálatok rámutattak arra, hogy a látási információ alapján történő lokalizáció képes befolyásolni a hallási lokalizációt.

  6. A lokalizáció során képesek vagyunk kiszűrni a hangok visszaverődéséből származó információkat. Ezt kísérletileg az elsőbbségi hatásnak nevezett jelenséggel vizsgálják, amely szerint, ha a két hang között elég rövid idő telik el, akkor azok összeolvadnak, és egyetlen hangot hallunk. Az összeolvadt hang lokalizációját az első hang iránya határozza meg, függetlenül attól, hogy a második hang milyen irányból jött.

  7. A binaurális hallás a hanglokalizáció mellett segít elkülöníteni az egyes hangokat a zajos környezet többi hangjától. A binaurális felfedés jelensége arra vonatkozik, hogy az egyik fülbe adott zaj csak akkor fedi el a hangot, ha azokat egy forrásba tartozóknak tartjuk.

  8. A hangok azonosításához az egyszerre a fülünkbe érkező hangokat különálló hallási objektumokba, úgynevezett hallási láncokba kell csoportosítanunk. Ezt a hallási színtérelemzés folyamata valósítja meg. A hallási láncok a hallási észlelés alapegységéül szolgálnak, és így a tárgyak hallásbeli megfelelői.

  9. A hallási színtérelemzés során a perceptuális csoportosítás Gestalt-elvei használjuk fel, amelyek a hallási információ kétféle szerveződését valósítják meg: a szekvenciális (horizontális) és a spektrális (vertikális) szerveződést.

  10. A szekvenciális szerveződés során az egymást követő hangok összetartozását kell eldöntenünk. Ez elsősorban a hangok közötti idői és frekvenciatávolságon alapul, de ezenkívül a hangok lokalizációját, hangosságát és hangszínét is fel tudjuk használni a hallási láncok csoportosításához.

  11. A spektrális szerveződés esetén az a kérdés, hogy hogyan bontjuk részekre az egy időben szóló hangokat. Ebben szintén az idői és a frekvenciatávolságot használjuk ki, valamint olyan elveket, mint a „régi plusz új” szabály (ha az éppen hallható frekvenciakomponensek között van olyan, amely egy előzőleg elhangzott hang jó folytatásának tekinthető, akkor érdemes ezeket egy láncba csoportosítani), a harmonikussági alapelv (azokat a harmonikusokat csoportosítjuk egybe, amelyek feltételezhetően egy alaphanghoz tartoznak) és a közös sors elve (azokat a hangokat csoportosítjuk egybe, amelyek egyszerre változnak meg).

KULCSFOGALMAK

binaurális felfedés, elsőbbségi hatás, fejhez kötött átviteli függvény, hallási láncok, hallási színtérelemzés, inte- raurális hangerőkülönbség, interaurális idői különbség, lokalizáció duplexelmélete, pszeudofon, tévesztési kúp

ELLENŐRZŐ KÉRDÉSEK

  1. Mondjunk egy olyan példát, amikor a hallási lokalizáció jobban működik, mint a látási!

  2. Rosszabbul lokalizáljuk-e a hangokat, ha fülhallgatót viselünk, amelyben hangos zene szól?

  3. Hogyan lehet a visszhangot a tárgyak helyének megállapítására felhasználni?

  4. Miért nincs tudomásunk a hétköznapokban a tévesztési kúpról?

  5. Megváltozik-e a hallási élményünk, ha egy sztereóban rögzített zene hallgatásakor felcseréljük a jobb és bal oldali fülhallgatókat?

  6. Álljunk meg egy pillanatra a tankönyv olvasásában, és figyeljünk a körülöttünk hallható hangokra. Hány hallási láncot tudunk elkülöníteni? És hányra tudunk egyszerre figyelni?

  7. Egy zeneszám hallgatásakor milyen hallási láncok jönnek létre a szekvenciális szerveződés révén? És a spekt- rális szerveződés révén?

  8. Mi a különbség a látási és a hallási színtérelemzés között?

AJÁNLOTT OLVASMÁNY

Bregman, A. S. 1990. Auditory scene analysis: Theperceptual organization of sound MIT Press, Cambridge, MA.

AJÁNLOTT HONLAP

http://www.aip.org/pt/nov99/locsound.html (Ismeretterjesztő cikk, sok illusztrációval, a hanglokalizációval