Ugrás a tartalomhoz

Általános pszichológia 1-3. – 1. Észlelés és figyelem

Csépe Valéria, Győri Miklós, Ragó Anett

Osiris Kiadó

Tárgyreprezentáció az agykéregben

Tárgyreprezentáció az agykéregben

A fejezet első részében megismerkedtünk azzal, hogy miért is nehéz feladat egy adott tárgy felismerése. Viselkedési adatok segítségével mutattuk be, hogy az alakzatok és tárgyak észlelése milyen lépésekben történik, és elemeztük a tárgylátás két legfontosabb modelljét. A továbbiakban azokat az adatokat mutatjuk be, amelyek a főemlősök (főleg az ember és a legtöbbet tanulmányozott makákómajom) tárgyfeldolgozó agykérgi rendszeréről jelenleg rendelkezésünkre állnak.

Mint láttuk, minden tárgy felismerésének alapfeltétele, hogy hátterétől el tudjuk különíteni (perceptuális szegregáció). A szegregáció alapjául szolgáló fizikai paramétert, amely a látható kontrasztot létrehozza, nevezzük vizuális kulcsnak. Nagyon sok adatunk van arról, hogy az egyes vizuális kulcsok által szolgáltatott információt nagyrészt elkülönült módon dolgozza fel az agykéreg. A vizuális kulcsok alapján két fő agykérgi feldolgozó rendszert lehet elkülöníteni: a dorzális rendszert, mely inkább a kép mozgásáért, elemeinek térbeli viszonyaiért és az ezekkel végzett manipulációkért felelős, valamint a ventrá- lis rendszert, mely elsősorban a tárgyak színéért és milyenségéért felelős. A két vizuális rendszer legfontosabb tulajdonságaival már a látás alapvető folyamataival foglalkozó fejezetben is megismerkedhettünk, illetve a főbb jellemzőket Az emlősagy vizuális rendszere című szövegdobozban (165. o.) külön is összefoglaltuk. Ezért a továbbiakban a tárgyfelismerésben fontosabb szerepet betöltő ventrális rendszer tulajdonságaira koncentrálunk.

A ventrális vizuális rendszer

Mint korábban láthattuk, a két vizuális rendszer a nyakszirti vagy tarkólebenyen elhelyezkedő elsődleges látókéregből indul ki. Innen az információ a másodlagos (V2), majd a negyedleges (V4) vizuális agykérgi területen keresztül jut el a halánték- vagy temporális lebeny alulsó részén elhelyezkedő inferior temporális kéregbe (IT). Számos érv szól amellett, hogy a tárgyak durva feldolgozási lépéseit egyre finomodó lépések követik egy több lépcsőből álló hierarchikus rendszer működésének eredményeképpen. Nézzük meg egyenként a legfontosabb érveket ezen állítás mellett (Rousselet et al. 2004)! A feldolgozási hierarchiának itt a V1-et és V2-t követő területeire koncentrálunk, tekintettel arra, hogy ezek tulajdonságait a korábbi fejezetek már tárgyalták.

  1. A ventrális rendszer állomásainak neuronális latenciája fokozatosan hosszabbodik. Egy inger (pl. egy arckép) megjelenésére a neuronok adott késéssel, latenciával válaszolnak. Ez a latencia, amely egyébként jellemző az adott agykérgi területre, a ventrális rendszerben előrehaladva fokozatosan nő (5.9. ábra). A legrövidebb latencia a Vl-neuronokra (majmok esetében átlagosan 60 ms), míg a leghoszabb latencia az IT neuronjaira jellemző (100-120 ms). Ez a latencianövekedés arra utal, hogy az információ a Vl-ből a V2-be, majd onnan a V4-be és végül az IT-be kerül, vagyis alapvetően soros módon dolgozódik fel.

  2. Az egyes állomások neuronjaira jellemző receptív mező mérete fokozatosan növekszik. Míg a Vl-neuronok receptív mezejének átlagos mérete 0,5-1,5 fok között változik (kb. akkora, mint kinyújtott karral nézve hüvelykujjunk körme), addig az IT-neuronok receptív mezeje igen nagy, ennek akár százszorosa is lehet. A receptív mezőnek ez a méretnövekedése annak köszönhető, hogy a ventrális rendszerben igen erős a kapcsolatok konvergenciája. Jusson eszünkbe, hogy a konvergencia fogalmával már találkoztunk korábban, a receptor-ganglionsejt konvergenciaeltéréseivel kapcsolatban, ami magyarázattal szolgált az M és P sejtek működésében az eltérő téri felbontásra. Itt is hasonlóról van szó, azaz például arról, hogy az IT-neuronok nagyon sok alacsonyabb területen elhelyezkedő (és kisebb receptív mezejű) neurontól kapják bemenetüket. Míg a kis receptív mezejű neuronok a látótérbe kerülő kép finom részleteiről és helyéről szolgáltatnak precíz információt, addig a nagy receptív mező akkor hasznos, ha a látótér nagyobb részéről jövő információt kell integrálnunk (például olyankor, amikor egy adott tárgyat helyzetétől függetlenül kell felismernünk).

  1. Az egyes állomások neuronjai az ingerek egyre bonyolultabb vonásaira érzékenyek. Míg a V1-neuronok leginkább adott irányú vonalakra, illetve élekre érzékenyek, addig a hierarchiában feljebb elhelyezkedő területek egyre komplexebb és absztraktabb kontúrokra, geometriai mintázatokra érzékenyek. A V2 esetében vonalak és egyszerű geometriai ábrák, a V4 neuronjainál komplex, színes, 3-D tulajdonságokkal is rendelkező geometriai ábrák, az IT neuronjai esetében viszont bonyolult tárgyak, kategóriák, emberi, illetve állati arcok váltják ki a legnagyobb választ.

Van-e a ventrális rendszer hierarchiájának csúcsa? A kezdeti tárgyfelismerési elméletek szerint a ventrális vizuális rendszer csúcspontján lévő neuronok mindegyike csak és kizárólag egy adott tárgyat, illetve jelenséget kódol. Ezeket a neuronokat kardinális sejteknek vagy megismerési egységeknek nevezték el. Leggyakrabban mégis mint nagymamasejteket emlegetik őket, mivel ha ez az extrém tárgyszelektív kódolás létezne, ezek az idegsejtek egyedül nagymamánk képére aktiválódnának. Könnyen belátható, hogy az ilyen neuronok megléte gyakorlatilag nem gazdaságos, elvileg pedig nem lehetséges. Egyrészt, ha elveszítenénk a nagymama-felismerő idegsejtünket, akkor legközelebb már nem ismernénk fel őt. Másrészt, nyilvánvalónak látszik, hogy véges számú agykérgi neuronjaink nem lennének elegendőek a környező világ végtelen számú dolgának felismerésére. A legfőbb ellenérv a kardinálissejt-modellel szemben az a teljesítményünk, hogy előzetes tapasztalatainkat összegezve képesek vagyunk az olyan tárgyakat is felismerni, melyeket addig még nem láttunk, és amelyekre éppen ezért nem létezhet felismerőegység sem. A hierarchia tetején elhelyezkedő terület, az IT tehát nem az egész tárgyfelismerésnek, hanem csak a ventrális rendszernek a végső állomása. A tárgyakkal kapcsolatos érzelmi, emlékezeti, feladatfüggő döntésekkel kapcsolatos információ további feldolgozó lépéseket igényel (ezekkel az Általános pszichológia 2. kötete több helyen is foglalkozik).

5.9. ábra. A ventrális rendszer állomásainak vázlatos reprezentációja. A V1, V2, V4 és az IT közötti hierarchikus rendszer egyes területeinek átlagos latenciája, receptívmezõ-mérete és a terület által leginkább kedvelt vizuális ingerek példái

V4 – a színlátás agykérgi központja?

Ahogy a dorzális rendszer fő mozgásfeldolgozó területe a V5/MT (lásd az előző fejezeteket, illetve a Mozgásészlelés című fejezetet), úgy tűnt, hogy a színlátás kérgi központja a V1/V2 után következő ventrális rendszerhez tartozó terület, a V4. Az első tanulmányok szerint a terület neuronjai rhesusmajom agyában a fény hullámhosszára igen érzékenyek. Semir Zeki londoni kutató nevéhez fűződik a terület színspecializálódásának leírása és annak felvetése, hogy a V4 egy szelektív színfeldolgozó modul lenne (Bartels-Zeki 2000). Ugyanakkor részletes újabb tanulmányokban sikerült kimutatni, hogy a V4 szerepe mesz- sze túlmutat a színfeldolgozáson. Egyrészt, nem minden V4-neuron érzékeny a tárgyak színére. Másrészt, a neuronok érzékenyek vonalak irányára, egyszerű és bonyolultabb geometriai ábrákra is. Harmadrészt, a tárgyak 3-D tulajdonságai és mozgása is befolyásolja a V4-neuronok aktivitását. Mindebből úgy tűnik, hogy a majmok V4 területének funkciói nem merülnek ki a fény hullámhosszának érzékelésében, és komplex szerepet töltenek be a tárgyfelismerésben.

A fenti majomkísérletektől függetlenül felmerült, hogy az emberi agyban is lenne egy központi színfeldolgozó terület. Feltártak ugyanis egy olyan területet, amelyről úgy gondoljuk, hogy a majmok V4 területének emberi megfelelője (homológja) (5.10. ábra), ezért szintén V4-nek nevezzük. Ennek a területnek az irtása, illetve kiesése (léziója) emberben szelektív színlátászavarokhoz (akromatopszia) vezet. Később funkcionális képalkotó eljárásokkal (PET és fMRI, amelyek működését röviden ismertettük az észlelés természetéről szóló bevezető fejezetben) kimutatták, hogy a terület erős színszelektivitást is mutat. Bár még számos kérdés nyitott a V4 tulajdonságait illetően (egy vagy több agyi területről van-e szó; valóban homológjai-e egymásnak a majom és az ember V4 területei, s ha igen, mennyire, stb.), annyi bizonyos, hogy a ventrális vizuális rendszer és azon belül is a V4 az embernél jelentős szerepet játszik a színfeldolgozás több lépésében is.

5.10. ábra. A V4 megközelítõ helye az emberi agykérgen az agy ventrális nézetén (az ábra

Inferior temporális kéreg – a tárgylátás központi területe

Charles Gross, valamint Robert Desimone munkacsoportjában az elsők között írták le (Gross et al. 1972, Desimone-Gross 1979), hogy a majomagykéreg temporális lebenyének neuronjai komplex tárgyakra és nem utolsósorban arcokra reagálnak a legjobban. Az azóta eltelt idő alatt az inferior temporális kéreg a ventrális rendszer egyik legtöbbet tanulmányozott agykérgi területe lett (Fujita 2002).

Az IT neuronjainak válasza többé vagy kevésbé bonyolult alakzatokra (keresztek, rácsminták, valós és számítógéppel generált tárgyak, emberi és állati arcok, más testrészek stb.) a legnagyobb (5.11. ábra). Az egyes neuronok általában néhány tárgyra vagy alakzatra válaszolnak szelektíven. Nincs azonban olyan neuron, amely kizárólag egy adott tárgy képére aktiválódna, tehát a kezdeti elképzelésekkel ellentétben az IT-ben sincs nagymamasejt! Egy neuron mindig több alakzatra reagál, igaz, eltérő mértékben.

Ez a tárgyszelektivitás az alapja lehet a tárgyfelismerésnek. Ha ez így van, akkor a tárgyfelismerésre jellemző tulajdonságokat az IT-neuronoknak is tükrözniük kell. Az 5.2. ábra bemutatta azokat a legfontosabb tulajdonságokat, melyekre nézve tárgyfelismerésünk invariáns, vagyis ugyanazon tárgyaknak a tulajdonságoktól független felismerését teszik lehetővé. Nézzük most meg, hogy hogyan tükröződnek ezek az invarianciák az IT neuro- nális válaszaiban.

Invarianciák az inferior temporális kéregben

Az egyik legnyilvánvalóbb perceptuális invariancia, hogy ugyanazt a tárgyat helyétől függetlenül fel tudjuk ismerni. Ennek a jelenségnek a kialakulásához az kell, hogy a neuronok hasonlóan válaszoljanak a tárgyakra, függetlenül azok receptív mezőn belüli helyzetétől.

Az IT-neuronok receptív mezeje általban igen nagy, magában foglalja az éles látás helyét, a sárgafoltot, valamint csaknem az egész ellenoldali látómezőt, illetve részben az azonos oldali látómezőt is. Ezen a nagy receptív mezőn belül a neuronok hasonlóan aktiválódnak egy adott tárgyra, mégpedig függetlenül annak helyétől. Valószínűsíthető tehát, hogy a pozicionális invariancia jelenségének a hátterében az ilyen IT-neuronok állnak.

A pozícióinvarianciához hasonlóan, tárgyfelismerésünk méret-, szín-, kontraszt- és vizuáliskulcs-független is. Ennek alapja úgyszintén az IT-neuronok alakszelektivitásának méret-, szín-, kontraszt- és vizuáliskulcs-függetlensége, azaz invariáns természete lehet (Sáry et al. 1995, Kovács et al. 1995, 2003). Ez azt jelenti, hogy ha egy neuron például egy alma, egy pohár, egy szék és egy kutya képére egyre csökkenő mértékben válaszol, akkor ez az alakszelektivitás többé-kevésbé megmarad, ha az adott tárgyak méretét, színét, kontrasztját, illetve az őket definiáló vizuális kulcsokat változtatjuk.

5.11. ábra. Az inferior temporális kérgi neuronok által preferált vizuális ingerek egy reprezentatív csoportja. A képek a Szegedi Tudományegyetem Élettani Intézetének vizuális laboratóriumában végzett kísérletek során használt ingereket ábrázolják

Az inferior temporális kéreg oszlopos elrendeződése

Hasonlóan a V1-hez, az IT is oszlopos (kolumnáris) elrendeződést mutat. Ez azt jelenti, hogy a hasonló tárgyakra szelektív neuronok lokális csoportokba rendeződnek. Ezek a neuroncsoportok végighúzódnak a kéreg rétegein, és úgynevezett agykérgi oszlopokat alkotnak (5.12. ábra). Egy adott tárgyra egyszerre több ilyen agykérgi oszlop, vagyis egyszerre több tízezer neuron hálózata aktiválódik, mégpedig eltérő mértékben. A legújabb elképzelések szerint a különböző tárgyakat átfedő, de aktivitásukban eltérő neuronális hálózatok kódolják. Tehát mondjuk egy alakzatra a legnagyobb tüzelési frekvenciával az 5.12. ábra jobb sarkában látható oszlop neuronjai válaszolnának, ám kisebb mértékben ugyan, de adna választ a többi oszlop neuronja is. Egy arcra az 5.12. ábra arcoszlopának neuronjai válaszolnának a legnagyobb aktivitásfokozódással, de azért a oszlop idegsejtjei is reagálnának, csak kevésbé. Ugyanazon idegsejtcsoport (hálózat) eltérő aktivitásmintázata által tehát képes lenne egyszerre számtalan tárgyat „kódolni”.

5.12. ábra. Az inferior temporális kéreg oszlopos szerkezete. Az egyes oszlopokat eltérõ szürke árnyalatok jelölik. Az oszlopok által leginkább preferált vizuális ingereket az oszlop oldalán látjuk

Az emberi tárgyfeldolgozó rendszer

Az emberi agy ventrális vizuális rendszere alapfelépítését tekintve megegyezik a majmok agyánál leírtakkal, de a részleteket tekintve jelentősek az eltérések. Az ember ventrális rendszere is a V1 és V2-ből indul ki, majd a V4-ben folytatódik. Az elmúlt években, a funkcionális képalkotó eljárások (eleinte a PET, majd később dominánsan az fMRI) fejlődésével ugyanakkor nemcsak ezeknek az alacsonyabb rendű vizuális területeknek, hanem a magasabb szintű, komplexebb területeknek a feltérképezése is megkezdődött (Malach et al. 2002). Ezek a tanulmányok azt igazolták, hogy a nyakszirti és a halántéklebenyek oldalsó (laterális) és alsó (ventrális) felszínén egy nagy kiterjedésű, összetett agyterület található, amelynek meghatározó szerepe van a tárgyfelismerésben. Ez a terület a LOC, a laterális okcipitális komplexum (Lateral Occipital Complex; 5.13. ábra). A vizsgálatok szerint a terület aktivitása megnövekszik, ha a kísérleti személyeknek tárgyak (3-D tárgyak, körvonalrajzok, emberi arcok stb.) képét mutatják, míg mintázott felületekre, véletlenszerű vizuális zajra a terület nem reagál. Az LOC, hasonlóan a majmok IT kérgéhez, nem retinotopikus, vagyis a bemutatott tárgy helyétől függetlenül aktiválódik. E mellett a pozicionális invariancia mellett a terület méret- és vizuáliskulcs-, illetve minden valószínűség szerint nézőpont-invarianciát is mutat. A terület hasonlóképpen aktiválódik tárgyak fényképére és azok körvonalrajzaira is. Mindezek az adatok arra utalnak, hogy a LOC igen hasonló tulajdonságokat mutat a tárgyfelismerés jelenségeihez, és ez valószínűsíti, hogy fontos szerepet játszik abban.

5.13. ábra. Az ember nyakszirti és halántéklebenyének alulsó részén található, tárgyfelismerésben fontos területek megközelítõ helyzete. Baloldalt alulsó, jobboldalt alulsó-oldalsó nézetben látszanak az agyféltekék. A többféle tárgykategóriára aktív LOC (laterális okcipitális komplexum) részben magában foglalja az EBA-t (extrastriatális testterület), mely testrészekre, és az FFA-t (fuziformis arcterület) is, mely szelektíven arcokra aktív. A PPA (parahippokampális helyterület) ettõl kissé elkülönülve található. Az agyat úgynevezett felfújt állapotban mutatjuk; gyrusok: sötét sávok, sulcusok: világos sávok

Az emberi agykéreg kategóriaspecifikus területei

A legújabb vizsgálatok szerint a nyakszirti és halántéklebenyek területén, részben a laterális okcipitális komplexummal átfedően találhatóak olyan kisebb területek, melyek adott specifikus kategóriába tartozó tárgyak képére nagyobb aktivitást mutatnak, mint más tárgyakéra (5.13. ábra).

Már korai neuropszichológiai, majd elektrofiziológiai megfigyelések is utaltak arra, hogy a halántéklebeny alulsó részén van egy terület, mely elsősorban az emberi arcok feldolgozásában játszik szerepet. Később fMRI-vizsgálatok megerősítették, hogy a terület aktivitása jóval nagyobb emberi arcokra, mint betűkre, különböző tárgyakra, állatokra vagy hátulról mutatott emberi fejekre. A területetfusiform face areának, vagyis fuziformis arcterületnek (FFA) nevezték el. Aktivitása akkor is erősebb, ha fekete-fehér portrékat, festményeket, arcok körvonalrajzait, karikatúráit, állatok arcát, ismeretlen személyeket mutatnak a kísérleti személyeknek.

Egy másik kategóriaszelektív agyterület az úgynevezett parahippocampal place area vagy parahippokampális helyterület (PPA), amely a LOC-tól némileg elkülönülten helyezkedik el. A PPA elsősorban tájképek, épületek, emberalkotta tájak (még legóból épített absztrakt tájképek is) bemutatásakor aktiválódik inkább, szemben az arcok, vizuális zajok és tárgyak bemutatásával. Ez a fokozott válasz megjelenik a ppA területén, függetlenül attól, hogy milyen feladata van a kísérleti személynek, ami arra utal, hogy a PPA elsősorban épületek és helyszínek perceptuális feldolgozásában játszik szerepet.

Újabban leírtak még egy területet a halántéklebenyben, részben átfedően a LOC területtel, amely specifikusan akkor aktiválódik, amikor emberi testek vagy testrészek képét mutatják be az alanyoknak. A területet extrastriatális testterületnek (extrastriate body area – EBA) nevezték el. Bár az EBA igen specifikusan leginkább testrészekre aktiválódott, a szerzők nem vitatják, hogy hasonlóan az FFA, illetve a PPA területekhez, az EBA is aktiválódik más ingerekre is. További kategóriák, melyekre specifikus agykérgi területek létezéséről vannak adataink: állatok, élőlények, kéziszerszámok, székek. Ezeknek a kategóriáknak a specifikus agykérgi reprezentációja ugyanakkor sokak által megkérdőjelezett, így tankönyvünkben sem tárgyaljuk őket tovább.

6.2. táblázat -

SPECIÁLISAK-E AZ ARCOK?

Négy fő csoportja van azoknak az érveknek, melyek az emberi arcfeldolgozás speciális volta mellett szólnak. Mint látni fogjuk, mind a négy kérdéskör esetében megkérdőjelezhető specialitásuk, nem véletlen, hogy az erről folyó vita is folyamatos az irodalomban.

Az első kérdéskör az arcok perceptuális feldolgozásának specialitásait illeti. Számos arcspecifikus perceptuális jelenség van. Egyik ilyen példa az inverziós hatás: míg mindenki remekül felismeri egy ismerőse arcát, ugyanazon személy arcát sokkal nehezebb felismerni megfordítva (lásd az ábrát). Ezt a jelenséget azzal magyarázzák, hogy az arcok feldolgozása során van egy olyan speciális lépés, amikor nem az arc részletei alapján, hanem azok konfigurációs tulajdonságai, az arc egésze alapján döntünk, és az arcok megfordítása ezt a holisztikus feldolgozást zavarja meg. Bár eredetileg a jelenséget speciálisan az arcokra gondolták csak érvényesnek, bizonyos személyek esetén (írásszakértők, kutyaszakértők és ujjlenyomat-szakértők) újabban kimutatták más, tehát nem arckategóriákra is.

A második kérdéskör az emberi agy arcérzékeny területének, az FFA-nak a létrejöttével kapcsolatos. Miért és hogyan jött létre? Öröklött vagy szerzett tulajdonságról van-e szó? Egyesek szerint az arcok geometriájára érzékeny arcspecifikus kérgi modul velünk született. Ezt támogatja például az az adat, mely szerint újszülöttek is preferálják az egyenes állású arcokat más ingerekkel és fordított állású arcokkal szemben. Igaz azonban az is, hogy az újszülöttek minden olyan ingert preferálnak, melynek geometriájában több elem helyezkedik el annak felső, mint alsó részén.

A harmadik vitatott kérdés az arcfelismerés szelektív zavarát, a prozopagnóziát (prosopos [gör.] – arc) illeti. Régóta tudjuk, hogy az okcipitális és temporális lebeny ventrá- lis részének lézióját követő arcfelismerési zavar során a betegek képtelenek a látott személyt arca alapján felismerni, bár hangja, gesztusai vagy mozgása alapján meg tudják állapítani identitását. vitatott kérdés ugyanakkor az irodalomban, mennyire független egymástól a minden tárgykategóriára kiterjedő általános tárgyagnózia és a speciális prozopagnózia, mivel eddig csak nagyon kevés betegről sikerült a prozopagnóziát mindenfajta tárgyagnózia nélkül bizonyítani. Fontos érv a későbbi elkülönülés mellett, hogy gyerekeknél soha nincs prozopagnózia tárgyagnózia nélkül.

Végül az utolsó érv az arcok speciális feldolgozása mellett a speciális arcfeldolgozó neuronok és modulok, így az FFA megléte (lásd a fejezet főszövegét). Ez a speciális modul azonban, mint fejezetünkben bemutattuk, az újabb eredmények szerint nemcsak arcokra aktiválódik, tehát ez az érv sem teljesen meggyőző.

Kiket ábrázol a kép? Vegyük észre, hogy megfordítva a leghíresebb személyek képét sem egyszerű felismerni!

összefoglalva tehát azt mondhatjuk, hogy bár vannak adatok az arcok speciális perceptuális és idegrendszeri feldolgozása mellett, egyik sem bizonyítja azt teljes mértékben.


Az agykérgi reprezentáció elméletei

Sokan sokféle elképzeléssel élnek arra vonatkozóan, hogy valójában mit is jelent ezeknek a kategóriaspecifikus agyterületeknek a megléte. Több elmélet van arra, hogy miért éppen arcokra, tájképekre és testrészekre alakultak ki ilyen specifikus agyterületek. Az elméletek alapvetően három csoportba sorolhatók.

  1. Kategóriaspecifikus modulok. Jeny Fodor volt az, aki felvetette, hogy az egyes kognitív feladatok specifikus és egymástól függetlenül működő idegrendszeri modulok aktivitásán keresztül valósulnak meg (Fodor 1983). Az FFA, a PPA és az EBA olyan specifikus területek lennének, melyek az adott kategória reprezentációjára fejlődtek ki. A legfontosabb bizonyítékok az arcfelismerés specifikus voltára a neuropszichológiai eredményekből származnak. A szelektíven arcfelismerési zavarban (prozopagnóziában) szenvedő betegek mellett létezik az ellenkező kórkép is, melyben tárgyfelismerési zavar, agnózia van ép arcfelismerő képesség mellett, vagyis kettős disszociáció van az arc- és a tárgyfelismerő rendszerek között. Az elmélet ugyan vonzó, és vannak mellette szóló adatok, mégis számos problémát vet fel a benne foglalt túlzott specializáció. Könnyű belátni például, hogy sokkal több a reprezentálandó kategória a világban, mint amennyit az agykéreg kapacitása lehetővé tesz. Ezért az elmélet újragondolt változatában azt vetették fel a kutatók, hogy az evolúciósan fontos, sokat gyakorolt kategóriákra (mint amilyenek az arcok vagy a betűk, a tájképek) kialakulhatnak erősen szervezett speciális modulok, míg a többi kategóriák tagjainak felismerését változatlanul a ventrális rendszer egészének működése biztosítja. Ez az elmélet már nem áll messze attól az elmélettől, amely a tapasztalat hatását hangsúlyozza. (Az emberi arcfelismerés speciális voltáról lásd a szövegdobozt.)

  2. A feladat és a gyakorlás hatására kialakult modulok. Az egyes kategóriák jelentősen különböznek hasznukat és használatukat illetően. Egyes tárgyakat például manipulációra (eszközök), környezetünkben való tájékozódásra (tájképek), navigálásra használunk, mások viszont inkább szociális interakcióinkban fontosak (arcok), megint másokat pedig olvasáskor használunk (betűk). Elképzelhető tehát, hogy a kategóriákat reprezentáló modulok használatuk szerint alakulnak ki. Mivel bizonyos kategóriák mindenkinek hasonlóan fontosak (pl. az arcok), rájuk mindenkiben kialakulnak specifikus modulok. Ugyanakkor ez az arcfelismerő modul, az FFA, nemcsak arcok, hanem bármely más, a személynek fontos és sokat gyakorolt kategória elemeinek egymástól való megkülönböztetésére, felismerésére is aktiválódna. Az egyes agyterületek specializálódása nem a priori, hanem az éppen szükséges perceptuális feladatok függvényében, gyakorlás által automatikusan változik, flexibilis (Palmeri-Gauthier 2004). Mivel az emberi életben igen fontos az arcok, testrészek egymástól való megkülönböztetése és felismerése, valamint a környezetünkben való tájékozódás, így az átlagember is jóval kiterjedtebb tapasztalattal rendelkezik arcok, testrészek és tájak kategorizációját, mint bármi más perceptuális kategóriát illetően. Sokat gyakorolva kategorizációjukat, mintegy „szakértőivé” válunk a fenti kategóriáknak. (A kategorizáció magasabb szintű szerveződésével itt most nem foglalkozunk. A perceptuális kategóriák és a fogalmi reprezentáció, tágabban pedig a tudásreprezentáció kérdéseit az Általános pszichológia 2. és 3. kötetei bővebben tárgyalják.) Ezt támogatja az a megfigyeléssorozat, mely szerint olyan emberek, akik hobbijukon, illetve foglalkozásukon keresztül szakértői más, nem-arc kategóriákba tartozó tárgyaknak (madarászok, autó- és kutyaszakértők stb.), az általuk jól ismert kategória tagjait az emberi arcokhoz hasonló módon és hasonló agyterületek aktiválódása mellett dolgozzák fel és ismerik fel. Ez magyarázná tehát az FFA, az EBA és a PPA meglétét.

  3. Szétosztott reprezentáció. A harmadik elmélet szerint az egyes kategóriák ventrális rendszerbeli reprezentációja több területre szétszórva és részben egymást átfedve valósul meg. E szerint az elmélet szerint egy geometrikus hasonlóságon alapuló tárgytulajdonság-térkép található a halántéklebenyben. Az adott kategóriákra maximálisan aktiválódó neuronok csoportjai a LOC területén egymástól elkülönülten, de szétszórtan helyezkednek el, és jól meghatározható topográfiával rendelkeznek. Az egyes modulok egymást átfedik, és az egyes tulajdonságok több mint egy helyen vannak reprezentálva. Egy adott tárgy kategóriáját tehát nem egy körülhatárolt terület, hanem a halántéklebeny területén szétszórtan elhelyezkedő neuroncsoportok jelentős részének aktivitásmintázata tükrözné. Az elmélet hasonlóságot mutat a majmok agyában, az inferior temporális kéregben egy- sejt-vizsgálatokkal feltárt kódolással.

ÖSSZEFOGLALÁS

  1. Az emberi tárgyészlelés első látásra egyszerűnek tűnik, valójában azonban igen bonyolult számítási (komputációs) feladat. Ennek első lépése a tárgynak a hátterétől való elkülönítése, a perceptuális szegregáció, amelynek fontos agykérgi korrelátumait a V1 működési tulajdonságai határozzák meg. Az értelmetlen körvonaldarabkákat a Gestalt-törvé- nyeknek megfelelően csoportosítjuk.

  2. A tárgylátás folyamatainak modelljeit két fő csoportba sorolhatjuk: strukturális és képi leíró modellek. Míg az első csoport a képet részeire bontva, strukturálisan értelmezi, addig a második a kétdimenziós képen megjelenő tulajdonságok alapján képzeli el reprezentációjukat.

  3. A főemlősök agyában a ventrális rendszer felelős a tárgyak feldolgozásáért. A rendszerben a V1-től előre haladva egyre bonyolultabb és absztraktabb tulajdonságok reprezentá- lódnak. A majmok agyában az inferior temporális kéreg az, amely a tárgyfelismerésben a legfontosabb.

  1. Az emberi agyban a tárgyakra szelektív területek a nyakszirti és a halántéklebeny alul- só részén helyezkednek el. Az egyes kategóriákra érzékeny területek egymástól többé-ke- vésbé elkülönülnek.

KULCSFOGALMAK

Gestalt, illuzórikus kontúrok, inferior temporális kéreg (IT), komponensalapú felismerés modellek, nagymamasejt, perceptuális szegregáció; tárgytulajdonság-térkép

ELLENŐRZŐ KÉRDÉSEK

  1. Sorolja fel az összes (5.2. ábrán látható) képtranszformációt, melyekre alak- és tárgyfelismerésünk invarianciát mutat!

  2. Mi kell ahhoz, hogy egy tárgy a hátterétől elkülönüljön?

  3. Mik a legfontosabb Gestalt-törvények?

  4. Miért látszanak az illuzórikus kontúrok?

  5. Nézőpontfüggő reprezentációt feltételez-e Marr, Biederman, illetve a képalapú modellek?

  6. Hány geonból épül fel egy váza, egy telefon és egy repülőgép?

  7. Mutassuk meg az 5.8. b) és az 5.8. c) ábrát néhány ismerősünknek, és mérjük le, átlagosan mennyi ideig tart, amíg felismerik az ábrán látható kutyát és arcot!

  8. Próbáljuk lemérni, milyen gyakran váltakozik a két rivalizáló értelmezés az 5.8. d)-h) ábrákon! Akaratlagosan meg tudjuk-e tenni, hogy csak az egyik értelmezést lássuk?

  9. Milyen érvek vannak a ventrális rendszer hierarchiája mellett?

  10. A neuronok mely tulajdonságai változnak a ventrális rendszerbeli feldolgozás során?

  11. Miért nem létezhet „nagymamasejt”?

  12. Milyen különbségek és hasonlóságok vannak az emberi V4 és a majom V4 területe között?

  13. Miért gondoljuk, hogy az IT központi szerepet játszik a tárgyfelismerésben?

  14. Az információfeldolgozás szempontjából miért hasznos, hogy az IT oszlopos elrende- ződésű?

  15. Milyen magyarázatok vannak arra, hogy specifikusan arcok, tájképek és székek bemutatására is aktiválódnak agyterületek?

AJÁNLOTT OLVASMÁNYOK

Kovács Gyula 2006. Arcpercepció. In: Racsmány Mihály – Lukács Ágnes (szerk.): Az ezerarcú elme.

Akadémiai Kiadó, Budapest.

Kovács Gyula 2004. A perceptuális kategorizáció alapjai. In: Pléh Csaba – Gulyás Balázs – Kovács Gyula: Kognitív idegtudomány. Osiris, Budapest, 202-216.