Ugrás a tartalomhoz

Térbeli döntéselőkészítés 7., Térbeli döntések

Márkus Béla (2010)

Nyugat-magyarországi Egyetem

7.5 Hibák és minőség

7.5 Hibák és minőség

Amint korábban több ízben hangsúlyoztuk, a GIS műveletek elvégzésekor tisztában kell lennünk azzal, hogy az adatainkat hibák terhelik. Ezek megléte elkerülhetetlen. Általában nem a hibák mértékének csökkentése, hanem azok ismerete, az információra gyakorolt hatásának szabályozása, kezelése a megoldás. Ebben az alfejezetben az adatok és a belőlük levezethető információk minőségével foglalkozunk.

7.23. ábra. A GIS hibák forrásai

7.5.1 Hibaterjedés

A hibaterjedési vizsgálat azért szükséges, becsülni tudjuk a hibákkal terhelt adatokból levezetett információk megbízhatóságát.

Logikai függvények (raszter)

A logikai és (AND) függvény alkalmazását vizsgálva megállapítható, hogy az átlapolással keletkező kompozit pontossága nem lehet nagyobb, mint a legpontatlanabb adatszint pontossága. A kompozit pontossága a leképezési folyamatban szereplő adatszintek számának növekedésével csökken.

Viszont a logikai vagy (OR) függvényt alkalmazva a kompozit megbízhatósága mindig meghaladja a legpontosabb adatszint pontosságát. Az adatszintek számának növekedésével a kompozit pontossága nő.

7.24. ábra. A megbízhatóság (függőleges tengely) változása az adatszintek számának és a logikai műveletek függvényében

Logikai függvények (vektor)

7.25. ábra. A hibasávok módszere

Az átlapolási műveletek számának növekedésével a kompoziton rohamosan növekszik a foltok száma, egyre kisebb foltok alakulnak ki. Gondoljunk arra, hogy minden határvonal tartalmaz bizonyos digitalizálási hibát. (Ezt gyakran hibasávként említik). Például az 1:10000 ma. topográfiai térképről digitalizált növényhatárok mintegy 3 m-es hibasávval jellemezhetők. A képen övezeteket szerkesztettünk a hulladékelhelyezőnek alkalmas poligonok határvonalára. Az egyszeres hibasávval való szűkítés 67%-os valószínűségi szinten biztosítja az eredmény megbízhatóságát. Ha 95%-os valószínűséggel akarunk biztosak lenni az információban, akkor egy újabb sávval (kétszeres hibasávval) kell leszűkítenünk a potenciális területeket! Ezt a valószínűségi szintet alkalmazzák általában a mérnöki, tervezési gyakorlatban.

A kis foltok megbízhatósága alacsony, a nagyobb foltoké magasabb. Ebből a feltevésből kiindulva az egyes adatszintekre ún. méret-valószínűség függvény (MVF) is szerkeszthető. A kompozit MVF az adatszintek MVF értékeinek szorzataként számítható. Ebből egy megbízhatósági korláttal megszerkeszthető az a mérethatár, mely alatti foltokat meg kell szüntetni, mert valószínűségük rendkívül alacsony.

7.26. ábra. A méret-valószínűség függvény

Aritmetikai függvények

Amennyiben a térbeli elemzésekben felhasznált adatszintek egymástól függetlenek, akkor az

U = f (x1,x2,...,xn)

függvény (levezetett érték, vagyis információ) középhibája megadható az

mU = f* M f

képlettel, ahol M a variancia-kovariancia mátrix, f pedig a parciális deriváltak vektora. Ezt hívják a hibaterjedés törvényének.

Arról van szó, hogy a független adatszintek pontosságának ismeretében az eredmény pontossága becsülhető. Például a láthatósági vizsgálathoz összeadtuk a terepfelszín (T) és a növényzet (N) magasságát.

Z = T + N

A Z magasság megbízhatósága a hibaterjedés törvényéből

Vagyis, ha a terepmagasság szórása 2 m, a növényzeté 1 m, akkor az eredmény 2,2 m. Nem 3 m!

7.5.2 Műveletek életlen halmazokkal

Az előzőekben feltételeztük, hogy a poligonok határvonala éles (sharp, crisp). A valóságban az erdő és a rét határvonala életlen (fuzzy).

Filozófiailag a fuzzy gondolatkör a sztoikusokig nyúlik vissza. Ők voltak, akik először mutattak rá, hogy természetes fogalmaink igazságtartományának határai nem jelölhető ki egyértelműen. Klasszikus példájuk a kupac, vagy szóritész paradoxon volt. Eszerint tekintsünk egy halom vagy kupac kavicsot. A sztoikusok arról faggatták hallgatóságukat, hogy ha egyenként elveszünk egy-egy kavicsot, akkor meddig mondhatjuk még, hogy a szóban forgó dolog még kavicshalom-e vagy már más[2].

A fogalmaink igazságtartományának elmosódott határait matematikai szempontból először Lotfi Zadeh, a Berkeley Egyetem professzora vizsgálta, 1965-ben. Ő adta a fuzzy logika (fuzzy = pontatlan, elmosódott, életlen) kifejezést is. Ezt úgy modellezte, hogy minden egyes logikai kijelentéshez valamilyen módon egy, a [0,1] zárt intervallumba eső értéket rendelt. Példaként mutatjuk a következő ábrát, mely az életkor minősítésének bizonytalanságát, életlenségét fejezi ki.

7.27. ábra. Az életkor életlen (fuzzy) minősítése

Logikai modellek esetén a fuzzy halmazok elmélete nyújt perspektivikus lehetőségeket. A fuzzy logika – eltérően a hagyományos Boole logikától – nemcsak 0 és 1 (fekete-fehér) értékekkel dolgozik, hanem megkülönböztet több árnyalatot is. A hagyományos (sharp, crisp) halmazelmélettel operáló logikai modellek feltételezik, hogy a forrásadatok egyöntetűek, a határvonalakat élesen meg tudjuk vonni, az algoritmusok háttere determinisztikus, és az egyes adatszinteken definiált osztályhatárok minden adatszintre megfelelőek. Az osztályozás logikai modelljének döntési felületei itt élesek. A fuzzy modell árnyaltabb képet ad. A klasszifikálás eredményeként megkapjuk az osztályba sorolás megbízhatóságát is. Ezzel precízebben kezelhetnénk a modulban tárgyalt esettanulmányban a rét „alkalmas”, az erdő „alkalmatlan” határon a minősítés problémáját.

7.28. ábra. Életlen határvonalak

Az életlen határvonalak kezelésére a fuzzy halmazok az előzőekben említett „hibasávok” módszerénél matematikailag egzaktabb megoldásokat szolgáltatnak.

Az intelligens GIS az előzőek alapján számítja, és közli a megjelenő információ mellett annak megbízhatóságát is, segítve ezzel az információk alapján hozott döntések kockázatának megítélését. Aritmetikai modellt alkalmazva lehetséges megoldást jelent a megbízhatósági térképek szerkesztése is.

7.5.3 Tervezés

Az információ megbízhatóságának növelése csökkenti a döntések kockázatát. Ez a tény a GIS alkalmazások legfőbb haszna, terjedésének mozgatórugója. A megalapozottabb döntés óriási veszteségektől mentheti meg a döntéshozót. Más oldalról viszont az információ előállítása költséges. Annál költségesebb, minél pontosabb, megbízhatóbb információt kérünk. Ugyancsak fontos korlátozó, vagy költségnövelő tényező lehet az idő. Az információ mindig adott célok kielégítésére szolgál. A cél ismeretében levezethető a kívánt adatminőség, meghatározható a még megengedhető hibák mértéke. Vagyis az adatbázis optimalizálható. Ne lőj ágyúval verébre!

7.29. ábra. Az adat/információ minősége és költsége

A hibaterjedés törvényszerűségeit alkalmazva a konkrét rendszerre olyan adatgyűjtési stratégiák alakíthatók ki, melyek a legkisebb költségráfordítással biztosítják a kívánt eredményt. Ugyanakkor a lehetséges algoritmusok összehasonlító pontossági vizsgálatával kiválaszthatók azok, melyek a legkisebb hibahalmozódást eredményezik.



[2] http://hu.wikipedia.org/wiki/Elmosódott_halmazok_logikája