Ugrás a tartalomhoz

A magyar nyelv

Kiefer Ferenc, Bakró-Nagy Marianne, Bartha Csilla, Bánréti Zoltán, Borbély Anna, Cser András, Dömötör Adrienne, É. Kiss Katalin, Gerstner Károly, Gósy Mária, Gyuris Beáta, Haader Lea, Hattyár Helga, Holló Dorottya, Horváth László, Kassai Ilona, Kenesei István, Kiefer Ferenc, Kiss Jenő, Kontra Miklós, Korompay Klára, Kurtán Zsuzsa, Laczkó Krisztina, Nádasdy Ádám, Németh T. Enikő, Olaszy Gábor, Pléh Csaba, Prószéky Gábor, Sándor Klára, Sipőcz Katalin, Siptár Péter, Szabó Mária Helga, Tolcsvai Nagy Gábor, Váradi Tamás (2006)

Akadémiai Kiadó Zrt.

A magyar nyelvtechnológia eredményei a gépi fordításban

A magyar nyelvtechnológia eredményei a gépi fordításban

A számítógépes nyelvészeti kutatás klasszikus problémája a gépi fordítás, melynek természetesen csak tudományos, szakmai, esetleg köznapi szövegek (hírek, hirdetések stb.) lefordításában vagy megértésében van szerepe. A kutatások nem tudnak és nem is szándékoznak kiterjedni a szépirodalmi szövegek számítógépes vizsgálatára és a műfordításra. Ebben az irányban, tehát a hagyományos, teljesen gépi úton végzett fordítórendszer fejlesztése irányában is megindultak munkálatok. Az MTA Nyelvtudományi Intézetében az EU 5. keretprogramja által finanszírozott MATCHPAD projektum keretében folyt egy nagyszabású kísérlet egy angol-magyar fordító rendszer kifejlesztésére (Senellart et al. 2001). A szoftvertechnológiát a francia Systran cég nyújtotta, amely egyike az első generációs fordító rendszereknek, és jelenleg szinte az egyetlen olyan általános célú gépi fordítórendszer, amely bizonyítottan jól működik. A magyar nyelv ehhez szükséges leírása a Nyelvtudományi Intézet és a MorphoLogic együttműködésével készült. A rendkívül gazdag morfológia, az indoeurópai nyelvekétől nagymértékben különböző elvő mondatszerkesztés igazi kihívást jelentett a francia szoftvercég számára is, és bebizonyosodott, hogy a nemzeti nyelvek technológiai megoldásait nem lehet automatikusan importálni más nyelvek bevált rutinmegoldásaiból.

A MorphoLogic MetaMorpho projektumában (Prószéky–Tihanyi 2002) gépi fordítórendszer készül, melyben az igazi újdonságot egyrészt a szabályok és a példák egységes kezelése jelenti, másrészt a rendszer a hagyományos fordítóprogramoktól eltérő elvet használ: gyakorlatilag a forrásnyelvi elemzés „melléktermékeként” jön létre a célnyelvi szöveg. A fejlesztők nyelvi mintának neveznek minden olyan szimbolikus leírást, melyet a szövegtest valamely részére helyezve, a benne szereplő szimbólumok illeszkednek a szöveg megfelelő elemeire, legyen ez az illeszkedés betű szerinti, szófaji vagy jelentés alapú, vagy a nyelvész által definiált egyéb megfeleltetés. Ha a minták rövidek és specifikusak, akkor más elméletekben szótári elemeknek hívják őket. Ha hosszabbak, akkor ezek kollokációk vagy idiómák. Ha viszont kevésbé specifikusak, akkor ezek a minták nem lexikális, hanem strukturális szegmensek, azaz nyelvi szerkezetek, címkézett zárójelezések. A több mint kétszázezer szabálysémát tartalmazó MetaMorpho mindezeket a mintákat egységesen kezeli, illeszthetőségük sikeressége esetén lehetővé teszi a nekik megfelelő < forrásnyelvi minta, célnyelvi minta > alakú mintapárok megjelenését. A rendszer a célnyelvi oldalon a minták egymásba építését egyfajta függvényalkalmazásként oldja meg.

A MoBiMouse rendszer felületének, valamint MetaMorpho-elvnek a kombinációja az internetes szolgáltatásként működő MoBiCAT megértéstámogató–fordító program, mely már a mondatok szintjén képes – első változatában az angol és a magyar nyelv között – fordítási támogatást adni (www.mobicat.hu). Angol szövegek tényleges fordítását végzi a MorphoWord alaprendszer és kiegészítése, a MorphoWord Pro, amelynek nyelvi tudását maga a felhasználó is bővítheti. Egy 2005 elején indult NKFP-pályázati projekt keretében folyik a magyar-angol változat fejlesztése is, a NewsPro rendszert készítő, MorphoLogic vezette konzorcium laboratóriumaiban.