Ugrás a tartalomhoz

Alkalmazott Mesterséges Intelligencia

Dudás László (2011)

Kempelen Farkas Hallgatói Információs Központ

5. fejezet - Tanulás

5. fejezet - Tanulás

A tanulás fogalma

A tanulás az emberi kognitív, megismerést jelentő működés legfontosabb eleme. Lényege asszociációk képzése és eltárolása. Az asszociációk időben és térben közeli érzékleteket társítanak. Az érzékletek forrása lehet az ágens környezete, vagy belseje is, utóbbira példa lehet egy hascsikarás fájdalma. Az ágens környezetét célszerűbb úgy definiálni, hogy az a hely, ahol szenzorai vannak, ahonnan a szenzorai által közvetített ingerek érik. Az asszociációk érinthetnek egyszerűbb ismeretszerkezeteket, pl. egyedi érzékletek társítása, mint egy tüskeszúrás megtörténte és az okozott fájdalom társítása, vagy összetett érzékletsorozatokat, pl. verstanulás, illetve magasabb szintű, az agy kategóriaképzése révén kialakult ismerethierarchiában meglévő összetevők közötti kapcsolatképzést, pl. ma találkozott Obama és Sarkozy közlés hatására a tanulás összetett kognitív működéseket kísér: ma elnöki találkozó volt. Ilyen módon új cselekvéseket, viselkedéseket, összetett ismereteket is tanulunk.

A tanulás evolúciós úton szelektálódott alapvető működés, mely nélkül a környezethez való alkalmazkodás és létezés lehetetlen volna. Ebből ered a felejtés fontossága, a már kevésbé fontos, ritkábban előhívott tanultak háttérbe kerülése.

A mesterséges intelligencia tanuló képességének árnyaltsága és sokrétűsége még messze elmarad az emberi tanulás összetettségétől. Ezzel analóg az intelligenciájában megfigyelhető különbség, hiszen nincs tartós intelligencia tanulás nélkül. Megemlíthető itt az előzetes betanítás és a folytonos tanulás közötti különbség. Az első zárt világot feltételez, ahol nem várható fejlődés és elsősorban egyszerű reflex ágensre gondolunk, mely a világnak csak a betanított aspektusait veszi észre és azokra reagál. Fontos kiemelnünk azt, hogy a betanított szabályok nem vonatkoznak új asszociációk, új szabályok képzésének mikéntjére és hiányzik az új, tartós asszociációk képzésének képessége. Bár egy reflex ágens kötött szabálykészlettel is mutathat ugyanazon külső észleletekre eltérő viselkedést, ezek nem jelentenek tartós tanulást és a tárolt szabályhalmaz megváltozását. A változatos reflexiók előállíthatók random generátor általi válasz szelekcióval, mint a beszélgetőrobotok egyszerűbb fajtáinál, vagy rögzített érzékletkészletre reagálni képes belső tárolók alkalmazásával. Vegyük észre, hogy ilyenkor is kötött a szabályhalmaz, mely az ágensnek az észleletekre adott változás-válaszait tárolja.

Egyesek, pl. Russel-Norvig (2000) hajlamosak az összetett reflex ágensek egyik fajtáját, a célorientált ágenst külön kezelni. Hasonlóan megkülönböztetnek hasznosság orientált ágenst, mely szintén célorientált ágens, amennyiben a célja a cselekedetei hasznosságának maximálása. Fontos megjegyeznünk, hogy amíg az ágens beépített programja nem változik meg valamilyen külső, vagy belső hatásra, azaz nincs szabálytanulás, lehet a működés bármilyen változatos és változó elvárásokra, célokra adott válaszaiban tűnhet igen összetettnek és alkalmazkodónak, akkor is reflex ágens marad, legfeljebb a szabálykiértékelés bonyolult segédtevékenységeket is igényelhet, pl. keresést. Leginkább úgy éreztethetjük ezt, ha azt mondjuk, hogy az ágens másolatától is ugyanolyan működéseket várhatunk el – beleértve a random generátor okozta sokszínűséget is -, mint az eredetitől. Hiányoznak a tanulásra, új szabályok, algoritmusok, viselkedés beépítésére vonatkozó szabályok. Ebből a legutolsó megállapításból következik, hogy a reflex ágensek és a tanuló ágensek között nem húzódik nagy szakadék, a kategóriák határa egybemosódik. Másik példaként a reflex ágensek és a tanuló ágensek közötti eltérést érzékeltethetjük olyan számítógépi programokon keresztül, melyeknél első esetben a programkód futása csak az adatokat változtathatja – melyek nem kódolt szabályok és a program nem azok értelmezője –, míg a második esetben a program önmagát is felülírhatja, módosíthatja, különösen kívülről érkező hatásokra reagálva.

Felhasznált és ajánlott irodalom

1. Artificial Neural Networks (2010) http://en.wikibooks.org/wiki/Artificial_Neural_Networks#Table_of_Contents, Elérés: 2010.12.21.

2. Benkő Tiborné – Tóth Bertalan (2007) Együtt könnyebb a programozás. Java. ComputerBooks 2007

3. California Scientific (2008) BrainMaker Neural Network Software, http://www.calsci.com/BrainIndex.html Elérés: 2008.04.07.

4. Dudás L. (2006) Mesterséges intelligencia elektronikus jegyzet, p578. http://ait.iit.uni-miskolc.hu/~dudas /oktatas/mesint, Elérés: 2010.12.20.

5. FIRA (2011) http://www.fira.net/

6. Freisleben, B., (1992) "Teaching a Neural Network to Play GO-MOKU," in I. Aleksander and J. Taylor, eds, Artificial Neural Networks 2, Proc. of ICANN-92, Brighton UK, vol. 2, pp. 1659-1662, Elsevier Science Publishers, 1992

7. Freisleben, B. (1995) "A Neural Network that Learns to Play Five-in-a-Row," Artificial Neural Networks and Expert Systems, New Zealand Conference, pp. 87, 2nd New Zealand Two-Stream International Conference on Artificial Neural Networks and Expert Systems (ANNES '95), Dunedin, New Zealand November 20-November 23. 1995. ISBN: 0-8186-7174-2

8. Freisleben, B.and Luttermann, H. (1996) Learning to play the game of Go-Moku: A neural network approach. Australian Journal of Intelligent Information Processing Systems, 3(2):52–60, 1996.

9. Haykin, S. (2009) Neural Networks and Learning Machines, Prentice Hall p.906 ISBN 0131471392 ebook: http://www.mediafire.com/?98j1oqt8sd4ny95 Elérés: 2010.12.21.

10. Hewitt, Carl (1985): The Challenge of Open Systems Byte Magazine. April 1985. (Reprinted in The foundation of artificial intelligence—a sourcebook Cambridge University Press. 1990

11. Horváth G. (ed.) (1995) Neurális Hálózatok és Műszaki Alkalmazásaik, Műegyetemi Kiadó, Budapest, p.314 ISBN 9789634205777

12. Horváth G. (ed.) (2007) Neurális Hálózatok, PANEM p. 448. ISBN 9789635454648

13. Lawrence, J. (1993) Introduction to Neural Networks, 5th edition, ISBN 1-883157-00-5

14. Millington, I. – Funge, J., (2009) Artificial intelligence for games, Second Edition, Morgan Kaufmann Publishers, USA, ISBN978-0-12-374731-0

15. Smith, L. (2003) An Introduction to Neural Networks http://www.cs.stir.ac.uk/~lss/NNIntro/InvSlides.html#what Elérés: 2010.12.21.

16. Stefán P. (1999): Megerősítő tanulási módszerek alkalmazása az informatikában Doktorandusz Fórum1999 Miskolc, http://members.iif.hu/stefan/PDF/dforum_1999.pdf, Elérés: 2010.12.20.

17. Sutton, R.S. – Barto, A.G., (1998): Reinforcement Learning: An Introduction, The MIT Press, Cambridge, Massachusetts, London, England http://www.cse.iitm.ac.in/~cs670/book/the-book.html Elérés: 2010.12.20.

18. Russell, S. J. – Norvig, P., (2000): Mesterséges Intelligencia Modern Megközelítésben. Budapest., PANEM-PRENTICE Hall, 2000.

19. Tóth P. (2010) Robotfocizás programozása szálkezeléssel és multi-ágens rendszerrel, Szakdolgozat, Miskolci Egyetem 2010.

20. Tzuu-Hseng Steve Li & Hernsoo HAHN (2010) AndroSot (Android Soccer Tournament) Laws of the Game 2010, http://big5.iware.com.tw/public/updata/B1AndroSotGameRulesApril052010.pdf Elérés: 2010.12.20.