Ugrás a tartalomhoz

Térinformatikai 2., A valós világ modellezésének folyamata

Végső Ferenc (2010)

Nyugat-magyarországi Egyetem

2.5 A geoadatbázis adatmodell

2.5 A geoadatbázis adatmodell

A geoadatbázis modell lényegét tekintve egy objektum orientált adatmodell. Az új adatmodell célja a térinformatika szempontjából az volt, hogy intelligens egyedeket definiálhassunk és kapcsolatokat (relációkat) teremthessünk a többi egyeddel. A geoadatbázis modell közelebb hozta egymáshoz a fizikai és a logikai adatmodellt, vagyis kevesebb absztrakcióra volt szükség. Mint láttuk korábban, az absztrakció növekedése csökkenti az adatmodellünk valósághoz való hűségét. A geoadatbázis adatmodell lehetővé teszi az egyedi viselkedések definiálását programozás nélkül. A legtöbb tulajdonság definiálható öröklődési szabályok által vagy előre definiált szabályokon keresztül (pl. a vízelzáró szerelvény csak a vízvezetéken lehet). Programot csak akkor kell írni, ha az objektumok viselkedése nagyon különleges (pl. közlekedési hálózat modellje).

2.5.1 Intelligens egyedek

Az előző bekezdésben megemlítettük az intelligens egyedeket. Mielőtt továbblépnénk a valós világ modellezésében, nézzük meg, mi tesz egy egyedet intelligenssé. Bár a geoadatbázisban előfordulhatnak vektoros adatok, raszteres adatok, felszín adatok és objektum adatok egyaránt, ebben a fejezetben a vektoros adatokon mutatjuk be az egyedek intelligenciáját. Ennek magyarázata, hogy a térinformatikai adatbázisban az esetek többségében nagy súllyal szerepelnek vektoros adatok.

Az egyedeknek van alakja

Az egyedeknek – miután absztrakción esnek át – jól megkülönböztethető és leírható alakjuk van. A leíró adatok táblájában ezt egy speciális mező tárolja, amelyet „geometria” néven ismerünk. A mező tartalma csak a felhasználói felületen keresztül látszik, és szimbolikus bejegyzést tartalmaz (pont, vonal, poligon).

Az egyedeknek van vetülete

Az egyedek alakját koordinátákkal írjuk le egy y,x derékszögű koordináta rendszerben. A föld alakja azonban nem sík, a legjobb megközelítésben geoid. A vetület megadja, hogy az egyed hol helyezkedik el a föld felszínén.

Az egyedeknek vannak leíró adatai

Az egyed saját tulajdonságait mezők tartalmazzák az attribútum táblában. A leíró adat alaptípusát tekintve lehet szám, szöveg vagy egyéb (dátum, objektum azonosító vagy multimédiás adat).

Az egyedeknek vannak alcsoportjai

Az egyedek összessége egyed osztályt alkot. Az egyed osztályok az egyedek homogén készletéből állnak, de az egyedek között lehetnek jelentős alcsoportok. Az épületek alkothatnak egy ilyen osztályt, és alcsoportjai lehetnek a lakóépületek, kereskedelmi épületek, ipari épületek. Az alcsoportok fokozott ellenőrzési lehetőséget adnak az egyedek fölött a rájuk vonatkozó szabályok vagy az attribútum terjedelmek definiálása által. Közlekedési példával élve, ha egy egyed a burkolatlan utak alcsoportjába tartozik, nem folytatódhat autópályaként.

Az egyedeknek vannak térbeli kapcsolataik

A térben minden egyednek van valamilyen kapcsolata a többi egyeddel, semmi sem létezik önmagában. A topológia segítségével fejezhetjük ki explicit módon ezeket a kapcsolatokat. Ezen túlmenően lehetnek kapcsolatok nem térbeli objektumokkal, mint például a háznak a tulajdonosával.

A leíró adatokat kontrollálhatjuk

A leíró adatok gyűjtése során felléphetnek hibák (elírások, téves bejegyzések). Az ilyen hibák csökkentése céljából az egyedhez hozzárendelhetünk attribútum terjedelmet. Ez lehet egy szám intervallum vagy az érvényes kifejezések listája (pl. a művelési ágak neve). Ezen túlmenően az egyedhez hozzárendelhetünk alapértelmezett leíró adatot, amely automatikusan megjelenik az attribútum táblában, amikor az egyedet létrehozzuk. Az egyedek minden alcsoportjához rendelhetünk atrribútum terjedelmet és alapértelmezett leíró adatot.

Az egyedeket szabályozhatjuk

Az objektumok a valós világban szabályokat követnek, amikor a helyükre kerülnek vagy helyet változtatnak. Ezeknek a szabályoknak a segítségével ellenőrizhetjük, hogyan kapcsolódnak a hálózat részei (pl. az eltérő átmérőjű csövek csak szűkítővel csatlakozhatnak), vagy kontrollálhatjuk, hogy egy ingatlannak hány tulajdonosa lehet.

Az egyedeknek lehet topológiája

Az egyedek nagy részének pontosan meghatározható szomszédsági kapcsolataik vannak, amelyet a topológia segítségével ábrázolhatunk. A földrészleteknek átfedés és hézag nélkül kell csatlakozniuk. Ezt a kétdimenziós geometriát nevezik síkbeli topológiának. A hálózat vonalainak és szerelvényeinek hézag nélkül kell csatlakozniuk. Ezt az egydimenziós geometriát nevezzük hálózati geometriának.

Az egyedeknek összetett viselkedésük lehet

Az egyszerű (átlagos) viselkedésű egyedeknek van geometriai megfelelője, topológiai tulajdonságai, kapcsolatai, attribútum terjedelme és meghatározott viselkedési szabályai.

Ha ennél bonyolultabb viselkedésű egyedekkel van dolgunk, az egyszerű viselkedésű egyedet továbbfejleszthetjük testre szabott egyeddé.

2.5.2 Példák az objektumok egymásra hatására

Bemutatunk néhány példát arra, hogy miért hasznos és mire ad lehetőséget az objektum orientált adatmodell.

Egyedek hozzáadása az adatbázishoz és szerkesztésük

  • az egyedhez rendelt leíró adat beleesik egy előre definiált készletbe és csak előírt értéket vehet fel. Jó példa erre a földrészletek művelési ága. A művelési ágak számát és szabványos megnevezését jogszabály írja elő, ezért nem lehetnek az adatbázisban erre vonatkozó eltérő megnevezések (pl. legelő helyett füves terület).

  • egy egyed a térben csak akkor helyezhető el, ha bizonyos feltételek teljesülnek. Az italbolt nem lehet az előírt távolságnál közelebb az iskolához, vagy egy út az autópályához csak felhajtón keresztül csatlakozhat.

  • bizonyos egyedeknek a természet által megszabott tulajdonságaik vannak. A víz mindig lefelé folyik.

  • az egyedek alakja gyakran szabályokat követ. Az épületek oldalai a legtöbb esetben derékszögben találkoznak.

Az egyedek térbeli kapcsolatai

A világban minden egyed valamilyen kapcsolatban van a többi egyeddel. A térinformatika szempontjából ennek a kapcsolatnak három formája van: a topológiai kapcsolat, a térbeli kapcsolat és az általános kapcsolat.

Néhány példa ezek szemléltetésére:

  • ha egy vízvezeték hálózatot szerkesztünk, a hálózat csöveinek találkozniuk kell és a szerelvényeknek a hálózaton kell lenniük. Ez teszi lehetővé, hogy végig követhessük a víz útját (a szoftver segítségével) a hálózaton. Számos előre definiált topológiai szabály segíti a munkánkat, ha kapcsolódó hálózatot szerkesztünk a térinformatikai szoftverben.

  • ha településszerkezeti térképet készítünk, fontos elkülöníteni, hogy mely épületek mely építési tömbbe, vagy szerkezeti terv szerinti övezetbe esnek. Lehetőségünk van megállapítani, hogy egy egyed a másiktól valamilyen távolságban van, érinti azt, beleesik, illetve átfedi-e azt?

  • sok objektum kapcsolat nem jelenik meg a térképen, holott tudunk róla. Például a teleknek van tulajdonosa (ez fontos tulajdonság), de a tulajdonos nem látható a térképen. A telket és a tulajdonost általános kapcsolat köti össze.

Térképi megjelenítés

Az esetek egy részében szeretnénk eltérni a „korrekt” (a topológiából következő) térképi megjelenítéstől. Az objektum orientált szemlélet erre is lehetőséget ad. Lássunk erre néhány példát:

  • ha szintvonalakat rajzolunk a térképre, sokkal könnyebb a térképet olvasni, ha a szintvonalak magasságát a szintvonalakat megszakítva írjuk fel, holott az adatbázisban a szintvonalak folyamatosak.

  • ha nagy méretarányú várostérképet rajzolunk, az akkor lesz szép, ha az útkereszteződésekben az utak sarkát lekerekítjük, pedig a földmérési alaptérképen például nincs is valódi ív.

  • ha egy villanyoszlopról párhuzamosan különböző áramkörök futnak le (távolságuk gyakorlatilag nulla), hasznos, ha a vezetékeket eltolással ábrázolhatjuk. Ugyanez vonatkozik a föld alatt egymás fölött húzódó vezetékekre.

Interaktív elemzés

A térinformatikai térkép szinte hívogatja a felhasználót, hogy kiválasszon elemeket, lekérdezze tulajdonságaikat, kapcsolataikat:

  • rámutathatunk egy objektumra, és egy megjelenő űrlapon módosíthatjuk a tulajdonságait

  • egy elektromos vagy más hálózaton a hiba helyéről kiindulva kiválaszthatjuk a kapcsolódó vezetékszakaszokat, szerelvényeket, az érintett fogyasztókat és a továbbiakban csak velük foglalkozhatunk.

2.5.3 A geoadatbázis adatmodell előnyei

Az eddigi példák szemléltették, mennyire hasznos az objektum orientált szemlélet alkalmazása a valós világ leírására. Az objektum orientált adatmodell segítségével az egyedeket a maguk természetességében ragadhatjuk meg. Könnyebben kezelhetjük a sajátosságaikat, topológiai, térbeli és általános tulajdonságaikat. Definiálhatjuk a többi egyedhez fűződő viszonyukat. A továbbiakban összefoglaljuk a geoadatbázis adatmodell fő előnyeit:

  • a földrajzi adatok egységesített gyűjteménye. Minden, az adott munkához szükséges földrajzi adat egy helyen, egy adatbázisban tárolható és kezelhető.

  • az adatbevitel és a szerkesztés sokkal precízebb. Kevesebb lesz a tévedés, mert beépített szabályok gondoskodnak a topológiai és egyéb konzisztencia megőrzéséről. Sok felhasználónak már ez is elég ok a geoadatbázis adatmodelljének használatára.

  • a felhasználó sokkal kreatívabban definiálhatja egyedeit. A geoadatbázis adatmodell a felhasználói modellhez közelítő egyedekkel dolgozik. Pontok, vonalak és zárt poligonok helyett a felhasználó transzformátorokat, utakat és tavakat kreálhat.

  • az egyedeknek gazdagabb környezeti kapcsolatrendszere van. A topológiai leírás segítségével, a térbeli megjelenítéssel és az általános kapcsolatok segítségével nem csak az egyed tulajdonságait ábrázolhatjuk, hanem a környezetéhez való viszonyát is. Így meghatározhatjuk, mi történjen, ha az egyedet elmozdítjuk, megváltoztatjuk vagy töröljük. A környezeti kapcsolatrendszer segítségével megtalálhatjuk és vizsgálhatjuk a kiválasztott egyedünkkel kapcsolatban lévő többi egyedet.

  • jobb térképet készíthetünk. Több ellenőrzésünk van az egyedek térképi megjelenítését illetően, és intelligens térképrajzoló funkciókat használhatunk.

  • az egyedek megjelenítése a képernyőn dinamikussá válik. Az egyed a megjelenítéskor reagálni tud a környezetében lévő egyedekre. Hozzá lehet rendelni az elemzési utasítást vagy az elemző eszközt az egyedhez.

  • az egyedek alakja jobban követhető. A geoadatbázis adatmodell lehetővé teszi az egyedek alakjának a valósághoz jobban közelítő ábrázolását. Az egyenes szakaszokon kívül rajzolhatunk köríveket, elliptikus íveket vagy akár Bézier görbéket is.

  • az egyedek sokaságának tárolása válik lehetővé. A geoadatbázis – alapelvéből következően – lehetővé teszi nagyon sok egyed befogadását és tárolását szegmentálás vagy egyéb térbeli elkülönítés nélkül.

  • több felhasználó szerkesztheti a geoadatbázist egyidejűleg. A geoadatbázis adatmodell lehetővé teszi, hogy több felhasználó szerkeszthesse egyidejűleg ugyan annak a földrajzi helynek az adatait, és kezelje a felmerülő ellentmondásokat.

Természetesen a fenti előnyök egy része megvan a hagyományos adatmodellek esetén is, de ott van egy nagy hátrány is: az említett előnyök csak külső programok megírásával aknázhatók ki. Az alapvető előny az objektum orientált adatmodell esetében az, hogy keretet ad olyan intelligens objektumok definiálásához, amelyek viselkedésükben és kapcsolataikban utánozni tudják a valós világ objektumait.

A geoadatbázis a földrajzi adatok négy formájának megjelenítését támogatja:

  • vektoros adatok az egyedek ábrázolására

  • raszter adatok a képek, raszteres tematikus adatok és felszínek ábrázolására

  • TIN (Triangulated Irregular Network), vagyis szabálytalan háromszög hálózat a felszínek ábrázolására

  • hely meghatározások (pl. postacím) és koordináták a földrajzi hely meghatározására

A geoadatbázis a felsorolt adattípusokat sztenderd (kereskedelmi) relációs adatbázis kezelőben tárolja (pédául az ArvGis szoftver a Microsoft Access adatbázis kezelőt használja). Ez egyrészt azt jelenti, hogy a térinformatikai adatok központilag kezelhetők informatikusok segítségével, másrészt a térinformatika folyamatosan profitálhat az adatbázis kezelés tudományának fejlődéséből.

2.5.3.1 Az egyedek vektoros ábrázolása a geoadatbázisban

A valós világban sok egyednek jól definiálható formája, határai vannak (főleg az ember által alkotott környezetben). A vektoros adat pontosan és tömören írja le ezeket a határokat. Ez a leírási forma támogatja a legjobban a számítási műveleteket, mint a területszámítás, kerület számítás, relatív helyzet (átfedés, metszés) megállapítása, a közvetlen, vagy egy adott távolságon belül lévő szomszédok megkeresése.

A vektoros adatokat a dimenziójuk alapján rendszerezhetjük:

  • a pont nulla dimenziós, és olyan földrajzi egyedek ábrázolására használjuk, amelyek hossza vagy területe az adott modellben elhanyagolható.

  • a vonal egy dimenziós, és olyan földrajzi egyedek ábrázolására használjuk, amelyek szélessége elhanyagolható a hosszához képest az adott modellben. A vonalat y,x koordináták rendezett sorozataként tároljuk. A vonal darabjai lehetnek egyenesek, körívdarabok, ellipszisdarabok vagy simított görbék.

  • a zárt poligonok kétdimenziósak, területi kiterjedéssel rendelkező földrajzi egyedek ábrázolására. A poligonokat vonalak alkotják, és egy területet zárnak körbe.

További vektoros adat a megírás vagy címke. Ezek a címkék az egyedekhez vannak rendelve és neveket, leíró adatokat tartalmazhatnak. A vektoros adatoknak a geoadatbázisban meghatározott struktúrája van, amely meghatározza az egyedek dimenzióját és kapcsolataikat. Az egyedek adatainak összessége a térbeli egyedek, a nem térbeli objektumok (emlékezzünk a térképen nem található objektumra, a tulajdonosra) és a köztük lévő kapcsolatok tároló helye. A topológiai kapcsolatokat síkbeli topológia és hálózati topológia írja le. A geoadatbázis tartalmaz még érvényességi feltételeket és kódtáblákat is, amelyek biztosítják, hogy ha új egyedet hozunk létre, vagy a meglévőt megváltoztatjuk, a leíró adataik érvényesek legyenek és igazodjanak a hozzájuk hasonló objektumokhoz.

2.5.3.2 Az egyedek ábrázolása raszterrel

A geoadatbázisba kerülő adatok egy része raszter formátumú. Ennek egyik oka, hogy az adatgyűjtő eszközök egy része (szkenner, digitális kamera) raszter formában rögzíti a gyűjtött adatokat. A raszter elemi egysége a pixel vagy cella, amelynek értéke sok mindent reprezentálhat. A cella tárolhatja a fény adott spektrumban visszaverődő részét, egy fénykép színinformációját, tematikus adatot, mint a növényzet típusa, felszínre jellemző értéket vagy magasságot.

2.5.3.3 A felszín ábrázolása TIN hálózattal

A TIN a felszín egyik lehetséges modellje. A geoadatbázis a TIN-t magasságokkal rendelkező pontok és élekkel határolt háromszögek formájában tárolja. Bármely pont magasságát meghatározhatjuk interpolálással a TIN földrajzi határain belül. A TIN lehetővé teszi a felszínelemzéseket, például vízrajzi elemzések, láthatósági vizsgálat, a terep szemléltetése stb.

2.5.3.4 Helymeghatározó elemek a geoadatbázisban

Talán a leggyakoribb térinformatikai művelet egy földrajzi hely megkeresése. A geoadatbázis tartalmazhat postacímeket, y-x koordinátákat, helyneveket. Itt meg kell jegyezni, hogy minden egyedet vagy egyedtípust ugyanabban a koordináta rendszerben kell ábrázolni. A közös koordináta rendszer biztosítja a geoadatbázis geometriai integritását, a topológia konzisztenciáját és így végső soron a térinformatikai elemzések helyességét.

2.5.4 A geoadatbázis tervezése

A geoadatbázis tervezése alapvetően megegyezik bármely adatbázis tervezésével. A geoadatbázis lényegét tekintve relációs adatbázis azzal a kiegészítéssel, hogy az adatbázis földrajzi adatokat is tartalmaz. A geoadatbázis részben kibővíti, részben leegyszerűsíti a tervezést az objektum orientált szemlélet által, mert eleve tartalmazza a földrajzi egyedek térbeli és topológiai kapcsolatait. Ennek a struktúrának a része egy speciális adattípus, a topológia amely integrált rendszerek leírására alkalmas, mint például a vízhálózat vagy az úthálózat. A geoadatbázis adatmodell hidat képez az embereknek a világ objektumairól alkotott képe és a relációs adattárolási és adatkezelési technika között.

A hagyományos relációs adatbázis tervezés két fő lépésből áll: a logikai adatmodell létrehozása és az adatbázis modell fizikai megvalósítása. A logikai adatmodell tartalmazza az adatok összességét a felhasználó szempontjából, az adatbázis modell ezt megvalósítja a relációs adatbázis kezelés technológiája segítségével.

2.5.4.1 A logikai adatmodell tervezése

A logikai adatmodell felépítésének kulcskérdése a minket érdeklő objektumok pontos kiválasztása és a köztük lévő kapcsolatok megállapítása. Az objektumokra általában úgy gondolunk, mint hétköznapi dolgokra, például utak, földrészletek, épületek, tulajdonosok stb. A kapcsolatukat is természetes nyelven fejezzük ki, mint például „mellette”, „tulajdonosa”, „része”. Az adatmodell megtervezése általában nem egy lépéses folyamat. A kezdeti modellt fel lehet tölteni adatokkal, tesztelni lehet, össze lehet vetni a felhasználó szükségleteivel és a felhasználó szervezet (cég, hivatal, hatóság) gyakorlatával vagy üzleti politikájával. Különösen fontos a tervezésbe bevonni a későbbi felhasználók csoportját. Ez a kulcsa annak, hogy ne csak elvileg korrekt, hanem a felhasználók szükségleteit is kielégítő adatmodell szülessen.

Ahogyan már említettük, a logikai adatmodell létrehozása iteratív eljárás, és jellemzően a tapasztalatok alapján módosuló folyamat. Nem létezik valahol egy „igazi” modell, hanem vannak jobb és kevésbé jó modellek. Nehéz pontosan meghatározni, hogy egy modell mikor jó és teljes, de van néhány jele annak, amikor ezekre a kérdésekre igennel válaszolhatunk:

  • a logikai adatmodell tartalmaz-e minden adatot lehetőleg ismétlődés nélkül?

  • támogatja-e a logikai adatmodell a szervezet üzleti (jogszabályi) előírásait?

  • tartalmazza-e a logikai adatmodell a felhasználók különböző csoportjainak eltérő nézőpontját az adatokra vonatkozóan? (a csővezeték a mérnök számára átmérővel rendelkező anyag, a könyvelő számára költségelem).

2.5.4.2 A logikai adatmodell megjelenítése

A legutóbbi időkig a logikai adatmodellt a közismert egyed-reláció diagramként ábrázolták. A vezető objektum orientált modellfejlesztő cégek továbbfejlesztették ezt az ábrázolásmódot, hogy még szemléletesebben és több aspektusból lehessen szemlélni és értékelni az adatmodellt. Kibővítették az egyed-reláció ábrázolást az adatáramlás ábrázolásával és a használati-eset vonatkozások ábrázolásával. Ezekkel csak az volt a baj, az egyes tervezési módszerek nem egységes jelöléseket használtak. Napjainkban a legtöbb objektum orientált modellező módszer alkalmazza az egységesített modellező nyelvet, idegen kifejezéssel az UML-t (Unified Modeling Language), amely az objektum orientált modellezés szabványos nyelvévé vált.

11. ábra Tipikus UML diagram[9]

Fontos megjegyezni, hogy az UML nem tervezési módszer, inkább a tervezési folyamat áttekintését segítő diagramrendszer. Természetesen az UML tartalmaz olyan beépített szabályokat, amelyek figyelmeztetik a felhasználót a helytelen utasításokra, belső ellentmondásokra. Az UML abban nyújt segítséget, hogy használhassuk az objektum orientált tervezési módszertant a saját céljainkra és modellünket szabványos, mások által is érthető módon írhassuk le.

2.5.4.3 A adatbázis modell fizikai megvalósítása

A fizikai adatbázist a logikai adatbázis modell alapján készítjük. A legtöbb esetben egy relációs adatbázis építésben jártas szakember megkapja a logikai adatmodellt a modellezőtől és az adatbázis kezelő szoftver parancsainak segítségével megalkotja az adatbázis szerkezetét, és definiálja az adatbázis részeit, hogy be lehessen olvasni vagy billentyűzni az adatokat. A fizikai adatbázis sokban hasonlít a logikai adatbázisra, de technikai okok miatt sokban el is tér tőle. A táblázatokban való megjelenítés az objektumok osztályait összevonhatja vagy szétválaszthatja. A szabályokat és a kapcsolatokat is többféleképpen ki lehet fejezni. A legfontosabb előnye a geoadatbázis modellnek, hogy úgy tartalmazza az adatokat, hogy azok a legjobban emlékeztessenek a logikai adatmodellre. Más szóval a fizikai átalakítás nem rejti el teljesen a felhasználó elől az adatbázis logikáját. A korábbi (pl. állomány orientált) adatbázisok csak egy programozott felületen át voltak elérhetők, a felhasználó semmit sem látott az adatbázis belső struktúrájából. Ennek fő hátránya az volt, hogy a felhasználó mindig rá volt szorulva a fejlesztőre.

A logikai és fizikai adatbázis elmei

A következő táblázat a logikai adatmodellnek megfelelő fizikai modell elemeit állítja párhuzamba:

A logikai adatmodell az egyed absztrakciója, amellyel az egyes alkalmazásokban találkozunk. Ezt az absztrakciót konvertáljuk adatbázis elemekké. Az egyed egy valós objektumot reprezentál, mint az épület, tó vagy a fogyasztó. Az egyedet a táblázatban sorként tároljuk. Az egyednek egy sor jellemzője, leíró adata van. A leíró adat az objektum minőségi paramétereit jeleníti meg, mint a neve, mérete, minősége vagy azonosítója (kulcsa) egy másik egyedhez. Az attribútumokat a táblázatban oszlop (mező) formájában tároljuk. Az osztály a hasonló egyedek gyűjteménye. Egy osztályban minden egyednek ugyanaz a leíró adatkészlete. Az osztályt az adatbázisban táblaként tároljuk. A sorok és oszlopok a táblázatban két dimenziós mátrixot alkotnak.

Az összetett adatok problémája

A relációs adatbázis kezelés annak köszönheti elterjedtségét, hogy egyszerű, elegáns, könnyen megérthető és áttekinthető szerkezete van. Az egyszerűsége egyben a hátránya is – könnyű vele relációs adatbázist definiálni, de bonyolult modellezni az összetett adatokat. Márpedig a földrajzi adatbázisok összetett adattípusokat is tartalmaznak. A vonal vagy a zárt poligon koordináták strukturált sorozat, és nem írható le olyan elemi adattípussal mint az egész szám, tört szám vagy karaktersorozat. Ráadásul az egyedeket olyan adatbázisba gyűjtjük, amelyben szerepelnie kell topológiai információnak, térbeli kapcsolatoknak és általános kapcsolatoknak egyaránt. A relációs adatbázis tehát csak az alapja a geoadatbázisnak. A geoadatbázis fő célja az összetett adatok kezelése egységes adatmodellben lehetőleg függetlenül a relációs adatbázis kezelés hátrányaitól.

2.5.5 A geoadatbázis tervezés fő lépései

A geoadatbázis tervezésnek a módszertantól többé-kevésbé függetlenül vannak egymást követő logikus lépései:

  • Az adatok modellezése a felhasználó szemszögéből nézve. A felhasználóval beszélgetni kell (interjút készíteni), át kell tekinteni a felhasználó szervezet struktúráját, elemezni kell a jelenlegi, esetleg a jövőbeni szükségleteket.

  • Az egyedek és kapcsolataik meghatározása. Az egyedekből fel kell építeni a logikai adatmodellt annak figyelembe vételével, hogy milyen kapcsolatok vannak közöttük.

  • Ki kell választani az egyedek geometriai megjelenítését. El kell dönteni, hogy a vektoros, a raszteres, vagy a felszínleíró geometria közül melyik jellemzi legjobban az egyedeket az adatmodell céljai alapján.

  • A geoadatbázis elemeinek meghatározása. A logikai adatmodellben szereplő egyedeket be kell illeszteni a geoadatbázisba.

  • A geoadatbázis szerkezetének meghatározása. Fel kell építeni a geoadatbázis struktúráját a tematikus csoportosítások, topológiai kapcsolatok és nem utolsó sorban a felhasználó szervezet felelősségi viszonyai alapján.

2.5.5.1 Az adatok modellezése a felhasználó szemszögéből nézve

Ennek a lépésnek az a fő célja, hogy közös nevezőre jussanak a fejlesztők és azok, akik a kész térinformatikai adatbázist használni fogják. Ebben a lépésben a fejlesztő:

  • felméri azokat a tevékenységeket, amelyek a szervezet (cég, hatóság, hivatal) működését és céljait szolgálják

  • azonosítja a tevékenységekhez szükséges adatokat

  • az adatokat egyedek szerint logikusan csoportosítja

  • meghatározza a megvalósítás menetét

  • leírja a szervezet funkcióit

Ebben a fázisban a GIS-től elvárt előny nem más, mint a szervezet (cég, hatóság, hivatal) működési hatékonyságának növelése.

2.5.5.2 A szervezet funkcióinak felmérése

Minden típusú szervezet rendelkezik funkciókkal, tevékenységekkel, amelyek a szervezet céljait szolgálják. Ezek a tevékenységek adják az adatbázis tervezés kiinduló pontját. A tervezés során inkább a tevékenységeket kell szem előtt tartatni, mint a szervezeti egységeket illetve a szervezeti felépítést. Ennek az a magyarázata, hogy hosszabb távon a tevékenységtípusok stabilabbak, mint a szervezeti felépítés. Előfordulhat, hogy az a feladat, amit ma az egyik szervezeti egység végez, jövőre más szervezeti egység fogja végezni (a csavargyár mindig csavart fog gyártani, akkor is, ha a könyvelésre van saját részlege, vagy kiadta külső cégnek ezt a feladatot).

Az első lépésben fel kell deríteni a térinformatikai projekt hatókörébe eső funkciókat. Az kiválasztott funkciókhoz tartozó teendőket le kell írni. Ilyen teendő lehet a területfejlesztés engedélyezése, a földhasználat ellenőrzése vagy fejlesztési megállapodás megkötése az infrastruktúra fejlesztőjével. A szervezet munkatársain kívül jó információforrások lehetnek a szervezet által használt dokumentumok, térképek. Érdemes utánanézni az újságcikkeknek, stratégiai terveknek, informatikai rendszerek terveinek.

2.5.5.3 Az adatforrások felmérése

Ha a tevékenységeket felmértük, a következő lépés a funkciók végrehajtása során használt adatkörök megállapítása. Meghatározzuk, hogy az adott tevékenység előállít-e adatot vagy csak használja az adatot. Általánosságban az adatok két típusával dolgozunk: a minket közvetlenül érintő adatokkal és a háttéradatokkal. Természetesen a minket közvetlenül érintő adatokkal foglalkozunk részletesen. Elemezhetjük minden funkció hatókörét a többi funkcióhoz képest illetve a külső szereplőkkel kapcsolatban. Nagyon gyakori, hogy a tevékenység során keletkezett adatot maga a funkció állítja elő.

Ebben a fázisban a következő alapkérdésre keressük a választ: „Mit csinál ez a funkció, amikor kapcsolatba kerül a másikkal, és mi a kapcsolat természete?”

Amikor kapcsolatba hozzuk az adatokat a tevékenységekkel, gyakran találkozhatunk szinonimákkal, eljárásokkal amelyek oda vezethetnek, hogy egy adatot többször tárol a szervezet vagy ugyanazt az adatot más néven tárolja. Ezeket a helyzeteket azonnal rendezni kell, vagy rögzíteni későbbi intézkedés végett. Az adatforrások összeállítása a végrehajtók számára interaktív folyamat, a végleges lista több „menet” után áll össze. A következő táblázatban szemléltetjük a bekezdésben leírtakat:

2.5.5.4 Az adatok csoportosítása

Az alapszinten csoportosított adatok fognak egymással kapcsolatba lépni a GIS-en belül. Ezek a csoportok komplett rendszereket képviselnek, mint a vízhálózat, ingatlan nyilvántartás, úthálózat vagy a földfelszín. Funkcionális oldalról ezek a csoportok fogadnak és továbbítanak információkat. Például a felszínmodell a csapadékmennyiséggel kombinálva átadja a hidrológiai adatokat a csatornahálózati modellnek. Minden adatcsoportnak szigorúan ugyanabban a koordináta rendszerben és topológiai típusban (hálózati, normál vagy topológia nélküli) kell lennie.

Az alábbi táblázat szemléltet egyfajta csoportosítást:

2.5.5.5 Az egyedek és kapcsolataik meghatározása

Ebben a lépésben közelebbről kell megvizsgálnunk adatainkat. Ki kell választanunk olyan objektumokat – egyedeknek nevezzük őket – amelyeknek közös tulajdonságaik vannak. Ennek a folyamatnak a fő lépései:

  • az egyedek azonosítása és leírása

  • az egyedek közötti kapcsolatok megállapítása és leírása

  • az egyedek és a kapcsolatok dokumentálása UML diagram formájában

Ajánlatos az utolsó lépésben valamilyen, a kereskedelemben kapható UML konvenció szerint működő grafikus szoftvert használni, mert így a sémát és az összekötő vonalakat (a jelentésükkel együtt) már nem kell megrajzolnunk. Ez a lépés azért fontos, mert részletes áttekintést ad a felhasználónak az adatokról és az adatok relációiról. A legfontosabb, hogy a felhasználót feltétlenül vonjuk be ebbe a munkába, hogy az eredményt ellenőrizhesse a saját szempontjai szerint. Ebben a lépésben előfordulhat, hogy hatalmas mennyiségű adatot kell kezelnünk. Célszerű tevékenységek szerint szétbontani a feladatot és csak az adott tevékenységhez tartozó adatokra koncentrálni. Előfordulhat, hogy csak több közelítés után tudjuk tisztázni az egyedek definícióját és kapcsolataikat.

2.5.5.6 Az egyedek és kapcsolataik megfogalmazása

Az egyedeket és kapcsolataikat állításokkal lehet kifejezni. Az egyedeket tekinthetjük a főneveknek, a kapcsolataikat az igéknek. Néhány példa erre:

  • Az elzáró szabályozza a gáz áramlását. Ez az állítás egy egyedet ír le.

  • A csatlakózó szerelvény összekapcsol két vagy több gázvezetéket. Ez az állítás leírja az egyedek közötti szerkezeti kapcsolatot.

  • A gázhálózat szerelvényekből és csövekből áll. Ez az állítás az egyedek halmazát írja le, amelyek így egy új, összetett egyedet képeznek (gázhálózat).

  • A fővezeték a gázvezetékek egy típusa. Ez az állítás leírja az egyedek hierarchikus csoportosítását.

2.5.5.7 Az egyedek és kapcsolataik dokumentálása

A tervezés ezen szakaszának legtömörebb és legérthetőbb dokumentálási formája az UML diagram elkészítése. A következő ábrán egy példát adunk az UML diagram megjelenítésére:

A fenti diagramból az alábbiakat lehet kiolvasni:

  • a vízhálózat a hálózatok egy típusa

  • a fővezetékek és az elágazó vezetékek képezik a vízvezeték rendszert

  • a fővezeték lehet védőcső nélküli, de lehet akár több védőcsöve is

  • a nyomott vezeték és a gravitációs vezeték a fővezetékek egy – egy fajtája

A eddig leírt lépések táblázatba foglalhatók:

egyed

kapcsolat

Vízhálózat

szivattyú

-

vízóra

-

vízóra akna

vízóra

elzáró

-

fővezeték

--

szennyvíztelep

-

Ingatlan nyilvántartás

földrészlet

-

szolgalom

-

tulajdoni lap

földrészlet

földr. fényképe

-

tulajdonos

földrészlet

tulaj. címe

-

Úthálózat

út

-

híd

-

utcanév

út

közlekedési lámpa

-

autóbusz járat

-

autóbusz megálló

-

Környezet

emlékmű

-

kerítés

-

felszínborítás

-

helynevek

-

folyóvölgy

-

űrfelvétel

-

2.5.5.8 Az egyedek megjelenítésének meghatározása

Ebben a lépésben minden egyedhez hozzárendeljük a geoadatbázisban történő megjelenítését. Bizonyos egyedeknek lesz geometriai megjelenítése a hozzá tartozó leíró adatokkal. ezeket az egyedeket geometriai tulajdonságaik alapján soroljuk egy csoportba. Más egyedeknek csak leíró adataik lesznek, míg mások raszterek, fényképek vagy vektoros rajzok formájában jelennek meg.

A következő megfontolásokat kell ezzel kapcsolatban tenni:

  • az egyednek meg kell jelenni a térképen vagy nem.

  • az egyed alakja (geometriája) megfelelő lesz-e a tervezett térbeli elemzéshez.

  • az egyed csak egy adat, amelyet csak más egyeddel együtt tudunk megjeleníteni (például egy adott telek tulajdonosát csak a telek kiválasztása után tudjuk megjeleníteni).

  • az egyednek különböző alakban kell-e megjelennie különböző ábrázolási méretarányokban.

  • megjelenik-e az egyedhez tartozó szöveges információ a térképen vagy a képernyőn.

Az alábbi szabályok segíthetnek a megjelenítés módjának kiválasztásában. Az ebben a lépésben kialakult információkat össze kell foglalni egy adatszótárban. Ez az adatszótár arra szolgál, hogy dokumentáljuk az egyedek megjelenését a geoadatbázisban.

  • Pont – olyan egyedet ábrázolunk vele, amelynek kiterjedése elhanyagolható az adatbázis adott felbontása mellett

  • Vonal – olyan egyedet ábrázolunk vele, amelynek a szélessége elhanyagolható az adatbázis adott felbontása mellett

  • Zárt poligon – olyan egyedet ábrázolunk vele, amelynek van síkbeli kiterjedése az adatbázis adott felbontása mellett

  • Felszín – lényegében ez is zárt poligon, csak a töréspontoknak eltérő magassági adatai vannak

  • Raszter – egy területet derékszögű cellák formájában ábrázol (űrfelvétel, légifelvétel, folyamatos felszín) és elemzési célokra használható

  • Fénykép, rajz, műszaki rajz – digitális képet jelenítenek meg valamiről, elemzésre nem használhatók

  • Objektum – olyan egyedek ábrázolására, melyeknek nincs geometriai megjelenítési lehetősége (pl. tulajdonos)

Egy egyedet természetesen többféleképpen megjeleníthetünk a geoadatbázisban a tervezett megjelenítési méretarány, vagy a tervezett alkalmazás függvényében. Például ugyanaz az út lehet vonal is, poligon is mert a közlekedésszervező vonalnak tekinti, a földmérő földrészletként kezeli. Ugyan az a település lehet pont, vagy lehet poligon, a pont a kisméretarányú megjelenítéskor, a poligon a nagyméretarányú megjelenítésnél hasznos.

A fentebb említett adatszótár szemléltetésére álljon itt egy táblázat:

egyed

kapcsolat

térbeli megjelenítés

Vízhálózat

szivattyú

-

pont

vízóra

-

pont

vízóra akna

vízóra

pont

elzáró

-

pont

fővezeték

--

vonal

szennyvíztelep

-

pont

Ingatlan nyilvántartás

földrészlet

-

zárt poligon

szolgalom

-

vonal

tulajdoni lap

földrészlet

szöveg

földr. fényképe

-

kép

tulajdonos

földrészlet

objektum

tulaj. címe

-

cím

Úthálózat

út

-

vonal

híd

-

pont

utcanév

út

szöveg

közlekedési lámpa

-

pont

autóbusz járat

-

vonal

autóbusz megálló

-

pont

Környezet

emlékmű

-

pont

kerítés

-

vonal

felszínborítás

-

zárt poligon

helynevek

-

szöveg

folyóvölgy

-

felszín

űrfelvétel

-

kép

2.5.5.9 Egyeztetés a geoadatbázis modellel

Ebben a lépésben meghatározzuk, hogy az egyed reprezentációja hogyan oldható meg az adott térinformatikai szoftverben. Minden adatbázis tervezés ott végződik, hogy egy kiválasztott szoftver lehetőségeihez kell alkalmazkodnunk.

A hangsúly ebben a fázisban átkerül a felhasználó szükségleteiről a hatékony adatbázis kialakítására. Innentől szükség van a csoportban egy szakértőre, aki ért a geoadatbázis adatmodellhez és átlátja a későbbi elemzési lehetőségeket.

2.5.5.10 A geoadatbázis megfogalmazása

A térinformatikai szoftverek lehetőséget adnak rá, hogy az egyedeket egyszerű jelenségként, összetett jelenségként vagy objektumként kezeljük.

  • A más pontokkal nem összefüggő pontokat, mint például az emlékművek, egyszerű pontként definiáljuk.

  • Az egyedeket összekapcsoló pontokat, mint az út – útkereszteződés kapcsolat, egyszerű hálózati pontként kezeljük.

  • A belső topológiával rendelkező pontokat, mint például a szennyvíztisztító, összetett hálózati pontként kezeljük.

Ha az egyed geometriai megjelenése vonal:

  • Az egyedülálló vonalszerű egyedeket – mint például a kerítés – egyszerű vonalként definiáljuk.

  • Azokat az egyedeket, amelyek egy vonalrendszer részei – mint például az úthálózat – egyszerű hálózati élként definiáljuk.

  • Azokat az egyedeket, amelyek hálózatokat kötnek össze, összetett hálózati élként definiáljuk.

Ha az egyednek van síkbeli kiterjedése:

  • Az önálló foltokat, mint például egy park, poligonként definiáljuk (ez a kifejezés térinformatikai szoftverekben általában zárt poligont jelent).

  • A teret kitöltő foltokat – mint például a felszínborítás – topológiával rendelkező poligon egyedként definiáljuk.

Ha az egyed képként képződött le (fénykép, szkennelt térkép, űrfelvétel stb.), akkor a geoadatbázisban raszterként definiáljuk.

Ha az egyed valaminek a felszíne:

  • Azoknál a felszíneknél, ahol a terepfelszín részletei fontosak (műszaki alkalmazások), a felszínt TIN – ként definiáljuk.

  • Ha nagy területek felszínét akarjuk ábrázolni és fel akarjuk használni a meglévő digitális felszínmodellt, rasztert definiálunk.

Ha az egyed objektum, objektumként definiáljuk. Ezek olyan egyedek, amelyeknek nincs földrajzi megjelenésük, de egy térinformatikai egyedhez tartoznak (telek – tulajdonos).

A fejezetben eddig leírtakat szemlélteti a következő táblázat:

egyed

kapcsolat

térbeli megjelenítés

térinformatikai egyedtípus

Vízhálózat

szivattyú

-

pont

objektum

vízóra

-

pont

pont

vízóra akna

vízóra

pont

pont

elzáró

-

pont

egyszerű hálózati pont

fővezeték

--

vonal

összetett hálózati él

szennyvíztelep

-

pont

összetett hálózati pont

Ingatlan nyilvántartás

földrészlet

-

zárt poligon

poligon

szolgalom

-

vonal

vonal

tulajdoni lap

földrészlet

szöveg

leíró adat

földr. fényképe

-

kép

raszter

tulajdonos

földrészlet

objektum

objektum

tulaj. címe

-

cím

cím típusú leíró adat

Úthálózat

út

-

vonal

vonal

híd

-

pont

pont

utcanév

út

szöveg

leíró adat

közlekedési lámpa

-

pont

pont

autóbusz járat

-

vonal

vonal

autóbusz megálló

-

pont

pont

Környezet

emlékmű

-

pont

pont

kerítés

-

vonal

vonal

felszínborítás

-

zárt poligon

poligon

helynevek

-

szöveg

leíró adat

folyóvölgy

-

felszín

TIN

űrfelvétel

-

kép

raszter

Az egyes térinformatikai szoftverek filozófiájából következően az egyedek egyedosztályokba, az egyedosztályok adatkészletekbe, az adatkészletek geoadatbázisba csoportosíthatók. Ezek a csoportosítások megkönnyítik az egy földrajzi területhez, projekthez, vagy szervezeti egységekhez tartozó földrajzi adatok tárolását, kezelését és a szabályozott hozzáférés biztosítását más felhasználók számára.

2.5.6 A geoadatbázis tervezésének szükségessége és célja

A valós világ modellezésének megismerése után sejthető, hogy a geoadatbázis megtervezése nem pusztán műszaki kérdés. A geoadatbázis egyrészt nem ragadható ki abból a szakmai – társadalmi környezetből, amelyben működni fog. Másrészt nem lehet jó geoadatbázist tervezni anélkül, hogy az adatbázis felhasználási célját ne ismernénk, vagy ne tartanánk szem előtt.

2.5.6.1 A tervezés szükségessége

Ami a GIS-t hatékonnyá teszi, az a jól megtervezett geoadatbázis. Kérdés, hogy mit nevezünk ebben az esetben jónak? Erre nincs végleges és zárt válasz. A helyesen feltett kérdések segítik a jó adatbázis megtervezését:

  • Hogyan illeszthető be a térinformatikai technológia a szervezet meglévő funkciói közé? Mit kell a korábbi rendszeren megváltoztatni?

  • Mely adatokból profitálhat legtöbbet az adott szervezet?

  • Mely adatokat tudjuk tárolni?

  • Ki lesz felelős az adatbázisok karbantartásáért?

A fenti kérdések megválaszolásának módja elsősorban attól függ, mennyire ismerjük a GIS technológiát. A GIS megvalósításának tervezése olyan, mint bármely más tervezés. Kezdődik a célok megértésével és folytatódik az egyre részletesebb tervezéssel, ahogyan egyre több adatot és információt gyűjtöttünk a feladatunkról. Az előzetes célkitűzés és a tervezésre fordítható pénzösszeg is befolyásolja a tervezési munka részletességét. A tervezési folyamat gyakran nem kap megfelelő hangsúlyt a geoadatbázis építésében. Ennek oka, hogy nagyon időigényes, és nem hoz látványos eredményeket. Annak a kockázata is fennáll, hogy a tervezés nem is történik meg. Ha nem hajtjuk végre a tervezést, előfordulhat, hogy a megszülető adatbázis nem felel meg az igényeinknek sem most, sem a jövőben. Ez oda vezethet, hogy többször előforduló, hiányzó, illetve felesleges adataink vannak, ami hatalmas pazarláshoz vezethet. Tudvalévő, hogy egy térinformatikai rendszer komponensei közül (adat, hardver, szoftver, személyzet) az adatok előállítása nagyságrenddel haladja meg a többi komponens költségeit.

2.5.6.2 A tervezés céljai

A tervezés az a folyamat, amelynek során kitűzzük a célokat, a megoldásra alternatívákat dolgozunk ki, ezeket értékeljük, és végül megalkotjuk a megvalósítási tervet. Az első szinten a tervezés képet ad arról hogy hol tartunk most, hová akarunk eljutni, hogyan juthatunk egyik szintről a másikra. Ahogy haladunk a tervezéssel, egyre több a részlet, adatokat és térbeli struktúrát határozunk meg. Az adatbázis tervezés legfőbb előnye, hogy mindenre kiterjedő áttekintést ad a leendő geoadatbázisról. A jól végrehajtott tervezés eredménye egy jól funkcionáló és hatékonyan működő adatbázis. Ennek ismérvei:

  • teljesíti a kitűzött célokat és segíti a szervezet működését (nem pedig megnehezíti)

  • Tartalmaz minden szükséges adatot, de nem tartalmaz redundanciát (adatismétlődést). Ez alól kivétel, ha az ismétlődés kimondottan benne van a tervekben és szükségessége dokumentálva van.

  • Úgy szervezi meg az adattárolást, hogy különböző felhasználók elérhessék ugyanazokat az adatokat (ne kelljen másolgatni az adatokat).

  • Befogadja az adatok különböző nézeteit.

  • Elkülöníti az adatkezelő alkalmazásokat az adatfelhasználó alkalmazásoktól.

  • Helyesen jeleníti meg, kódolja és szervezi adatbázisba a földrajzi jelenségeket.

Említettük, hogy a tervezés időigényes folyamat, de a jó tervből az alábbi előnyök származnak:

  • Megnövekedett rugalmasság az adatkeresésben és elemzésben.

  • Meghozza a felhasználók kedvét újfajta alkalmazási módokhoz.

  • Elosztja az adatgyűjtés, tárolás és visszakeresés költségeit.

  • Többféle felhasználót kiszolgáló adatbázis jön létre.

  • Rugalmasságot biztosít a jövőbeni igények kielégítésére, új funkciók befogadására.

  • Minimalizálja az adatismétlődést.

2.5.6.3 Tervezési irányelvek

A tervezési folyamat általában nehéz munka. Néhány tényező szem előtt tartásával ez a folyamat megkönnyíthető és sikeresebbé tehető:

  • Vonjuk be a felhasználókat a tervezésbe. Ezzel a felhasználók egyre inkább magukénak érzik a rendszert és a tervező is hasznos információkhoz jut.

  • Egyszerre csak egy lépéssel foglalkozzunk. Nem szükséges az összes részletet egyszerre kidolgozni. A tervezés folyamatos közelítési feladat. Olyan lépésekben lehet haladni, amelyek illeszkednek a szervezet felépítéséhez.

  • Alakítsunk csoportot. A tervezés során sok információra, szaktudásra és döntéshozatalra van szükség. Ezt egyedül nem tudjuk megoldani.

  • Legyünk kreatívak. Egy új projekt indítása jó lehetőség arra, hogy megismerjük a korszerű technológiákat.

  • Osszuk a tervezési munkát kezelhető részekre. A nagy projekteket fel lehet osztani elhatárolható és átlátható egységekre. Egy – egy mérföldkő a projektben ne legyen időben közelebb egymáshoz, mint két hónap. Ez megkönnyíti, hogy a projektre fókuszáljunk.

  • Tartsuk szem előtt a szervezet céljait és szükségleteit. Fontos, hogy a geoadatbázis valós igényeket elégítsen ki, végtére is a felhasználók kedvéért készül.

  • Ne foglalkozzunk a részletekkel túl korán. Például ne próbáljuk meg az egyed osztályokra vonatkozó szabályokat lefektetni a geoadatbázis szerkezetének elkészítése előtt.

  • Dokumentáljuk a tervezést alaposan. Minél bonyolultabb az adatbázis, annál nagyobb hasznot hoz a dokumentálás. Hasznos lehet a folyamat dokumentáló szoftverek alkalmazása (pl. Microsoft Project).

  • Legyünk rugalmasak. A kezdeti terv biztosan nem lesz ugyanaz, mint a végső állapot. A tervezésnek reflektálnia kell a szervezetben bekövetkező változásokra, a menet közben megjelenő új technológiákra és a résztvevők növekvő hozzáértésére

  • Készítsünk megvalósítási tervet a modellünkről. A megvalósítási tervnek tartalmaznia kell a tevékenységek fontossági sorrendjét.



[9] www.thuvien-it.net