Ugrás a tartalomhoz

A magyar nyelv

Kiefer Ferenc, Bakró-Nagy Marianne, Bartha Csilla, Bánréti Zoltán, Borbély Anna, Cser András, Dömötör Adrienne, É. Kiss Katalin, Gerstner Károly, Gósy Mária, Gyuris Beáta, Haader Lea, Hattyár Helga, Holló Dorottya, Horváth László, Kassai Ilona, Kenesei István, Kiefer Ferenc, Kiss Jenő, Kontra Miklós, Korompay Klára, Kurtán Zsuzsa, Laczkó Krisztina, Nádasdy Ádám, Németh T. Enikő, Olaszy Gábor, Pléh Csaba, Prószéky Gábor, Sándor Klára, Sipőcz Katalin, Siptár Péter, Szabó Mária Helga, Tolcsvai Nagy Gábor, Váradi Tamás (2006)

Akadémiai Kiadó Zrt.

A hangfelismerés és -észlelés

A hangfelismerés és -észlelés

Beszédhangfelismerés-elméletek

A beszédészlelés egyik legfontosabb jelenségtani vonása a kategorikusság. A beszédhangokat nem fokozatos diszkriminációval észleljük, hanem például mesterséges zárhangok észlelésekor vagy a megadott [b] vagy a [t] kategóriába tartozónak vesszük, s további, finomabb eltéréseket nem tudunk következetesen észlelni. Ez a kategorikusság a magyar beszédhangok észlelésére is jellemző. Ennek megfelelő összekeverési mintázatokat kapunk például erőteljes zajban a beszédhangok között (Gósy 2005). A beszédhangok észlelésének elméletei az alulról felfelé (1. ábra) és a felülről lefelé (2. ábra) típusú elméletalkotásnak megfelelően alakulnak.

A megértés különböző részfeladatai

  1. Szűrőelméletek. Az egyes beszédhang-jegyekre megfelelő szűrőrendszerek működéseként analitikusan állna össze a beszédhangok észlelése. Egy-egy jegyre, például a zöngésségre, a kerekítettségre és így tovább, jellegzetes szűrőrendszerek állnának rendelkezésünkre.

  2. Templátum- vagy illesztésiminta-elmélet. Egészleges mintákhoz illesztenénk a beszédhangokat, s egy adott akusztikus eseményt annak a hangnak megfelelően hallanánk, amelyik templátum a legjobban hasonlít az általa feldolgozott inger izgalmi mintázatához. A templátumelméletnek számos szótagváltozata van, melyek szerint néhány ezer szótagból álló mintát használva tudunk igazából gyors és hatékony beszédhang-felismerést produkálni.

  3. Az „analízis szintézis révén” koncepciók a szűrőelméletekből kiindulva aktív perceptuális felfogásokat hirdetnek. Az elsődleges elemzésnél a rendszer becslést készítene arra, hogy mi is lehet az adott hang. A becslésnek megfelelő idegrendszeri izgalmi mintázatot vetné össze a ténylegesen beérkező mintázattal, s ha az illeszkedés elég jó lenne, akkor megelégedne és a megfelelő kategóriába sorolná be a hangot, ha nem, akkor tovább finomítaná a becslést. Minden ilyen „analízis szintézis révén” elmélet feltételez egy jó első becslést. Minél gazdagabb a szűrőrendszer alapján történő előzetes becslés, annál gyorsabban működik a rendszer. Az elmélet sajátos változata a korábban igen népszerű motoros beszédészlelési elmélet. E szerint az invarianciáért a saját beszéd artikulációs mintázatainak aktiválása lenne a felelős. A motoros elmélettel azonban számos probléma van. Siketek is tudnak hallani, képesek vagyunk meghallani olyan hangtani szembenállásokat is, amelyeket nem tudunk utánozni és így tovább.

Grammatikai hatások a beszédhang felismerésében

A megértésben részt vevő folyamatok elemzésében központi szerepe van a kontextus figyelembevételének. Ennek szélső esete a hangfelismerés közbeni hanghelyreállítási hatások megléte. Warren (1970) nyomán Dankovics és Pléh (2001) magyar anyagon is kimutatták, hogy mennyire erőteljes lehet már a beszédhangok hallása során is a kontextus figyelembevétele. A 4. ábra mutatja, hogyan készítünk jellegzetes köhögő hanggal torzított szöveget. Ilyenkor a személyek igen nagy mértékben hajlanak a kiegészítésre. Az 5. ábrán látható ennek aránya különböző grammatikai elvárásoknál.

Egy jellegzetes hanghelyreállítási kísérleti szóanyag. A szóban a szürkével bejelölt helyen egy köhögés törli az eredetileg ott volt beszédhangot

A hanghelyreállítás mértéke különböző szembeállított mondatpároknál

Az 5. ábrán felülről lefelé haladva az alábbi (1)–(4) példáknak megfelelő mondatpárok szembeállítása látható, mindenütt a kitörölt részeket aláhúzva a példán.

Többes szám helye

24.2. táblázat -

(1)

a. A macskák megették a kolbászt.

 

b. A kolbászt megették a macskák.


Látható, hogy a többes szám helyének nem volt hatása a rekonstrukcióra. Ugyanakkor a tárgyrag esetében (2) a hátul, jellegzetesebb helyén álló tárgyrag ((2b), sötét oszlop) rekonstrukciója nagyobb mértékű.

Tárgyrag helye

24.3. táblázat -

(2)

a. A macskát kergeti a kutya.

 

b. A kutya kergeti a macskát.


Az ige vonzatkeretének, amely a mondatszintű megértési folyamatok egyik vezető tényezője, nagy elváráskeltő hatása van. (3a) esetén sokkal nagyobb a rekonstrukció, mint (3b)-nél, amelyben ugyanaz a szótag egy lexikai szó (ének) része.

Ige vonzatkerete

24.4. táblázat -

(3)

a. Kati hitt Imrének Velencében.

 

b. Kati hitt az ének erejében.


Ugyanakkor, mint a (4) példáknak megfelelő alsó oszlopok mutatják az ábrán, a lexikai alapú hanghelyreállítás erőteljesebb, mint a grammatikai alapú. Az egészlegesebb reprezentációkkal dolgozó szókincs esetén nagyobb a rekonstrukció.

Elhagyható esetragok

24.5. táblázat -

(4)

a. Hiányzik a papucsomnak a bojtja.

 

b. Hiányzik a motorcsónak a partról.