Molnár, Géza Gábor (2022) Szemantikus web technológiák alkalmazási lehetőségei az „exploratory” OLAP-ban. PhD thesis, Budapesti Corvinus Egyetem, Közgazdasági és Gazdaságinformatikai Doktori Iskola. DOI https://doi.org/10.14267/phd.2022062
|
PDF : (az értekezés)
3MB | |
|
PDF : (az értekezés tézisei magyar nyelven)
1MB | |
|
PDF : (draft in English)
1MB |
Official URL: https://doi.org/10.14267/phd.2022062
Abstract
Az utóbbi évtizedben a strukturálatlan adatok (pl. szövegek) mennyisége sokkal nagyobb mértékben nőtt, mint a strukturált adatoké. Ez nem kis mértékben a közösségi médiának és az okos eszközök elterjedésének köszönhető. A nagy mennyiségű adat tárolása egyelőre nem okoz gondot, mivel a tároló eszközök ára az utóbbi időben jelentősen csökkent, kapacitásuk viszont közben növekedett. A strukturálatlan adatok feldolgozásával viszont más a helyzet. A nagy adatmennyiség miatt sokszor reménytelen, hogy hasonló feladatokat manuálisan végezzünk el. Ezért manapság különösen fontos, hogy olyan számítógépes eljárásokat dolgozzunk ki, amely lehetővé teszi a strukturálatlan – többnyire szöveges - adatok feldolgozását és elemzését. A strukturálatlan adatok feldolgozása, mint probléma sok részterületet érint, többek között a tudásreprezentáció, a szemantikus technológiák, az adat-, web-, és szövegbányászatot, a mesterséges intelligencia részterületeit ezen belül a tanuló algoritmusok témáját is. A struktúra alkotás fontos eszközei a szemantikus technológiák, ezek közül az ontológiák, amelyek egy adott terület fogalmi leírását adják meg. Segítségükkel egy adott területre jellemző fogalmak és a közöttük lévő kapcsolatok definiálhatók. Kutatási témám a szemantikus technológiák (elsősorban ontológiák) adattárházakban való felhasználásával kapcsolatos. Olyan megoldásokat vizsgálok, amelyek lehetővé teszik a strukturált és nem strukturált adatok együttes elemzését az adattárház/üzleti intelligencia rendszerekben. Az ilyen rendszereket a szakirodalomban exploratory OLAP rendszereknek is nevezik. Az exploratory OLAP rendszerek területe meglehetősen új, a legelső modellek a szakirodalomban alig több, mint tíz éve jelentek meg. Fontos megjegyezni, hogy a legtöbb ilyen modell megmaradt koncepcionális szinten. Néhány esetben készült ugyan prototípus, viszont azok általános alkalmazhatósága még nem igazolt. Kutatásom során a következő kérdések megválaszolását tűztem ki célul: • Hogyan tehető szemantikussá a hagyományos OLAP és az adattárház, vagyis hogyan lehet megtervezni a szemantikus réteg integrációját az adattárházba? • Hogyan lehet a megtervezett modellt a gyakorlatban megvalósítani egy prototípus segítségével? • Mi lehet egy hatékony validálási módszer az „exploratory OLAP” modell esetében? A kutatás elvégzéséhez többféle módszert is alkalmaztam. A módszerek közé tartozik a design science, az adatgyűjtés és adatelemzés, az ontológia fejlesztési és értékelési módszertan, valamint a prototípus készítése során alkalmazott fejlesztési módszertan. A kutatás fontosabb eredményei a következők: • A helpdesk/ticketing ontológia elkészítése. Erre nem találtam meglévő releváns példát a szakirodalomban. Az általam készített változat nem fedi le az egész ticketing területet, elsősorban a hibabejelentésekre (incidensek) fókuszál. A ticketing ontológiákból két verziót is készítettem. Az első verzió egy kétszintű taxonómia, amely elősegíti a szemantikus keresést az incidensekben. Az ontológia második (továbbfejlesztett) verziója jobban írja le a ticketing rendszer működését, azon belül is az incidensek kezelését. További jellemzője, hogy ebben az osztály-alosztály kapcsolaton kívül más kapcsolatok, illetve az osztály tulajdonságok is megjelenjenek. • Exploratory OLAP prototípusok elkészítése. Az exploratory OLAP prototípusok közül nagyon kevés működő változat van a gyakorlatban. A kutatás során általam létrehozott prototípusok felhasználnak meglévő modelleket (Prasad, Abello), de azokat átalakítva, és a szükséges mértékig leegyszerűsítve. A prototípusok értékelésére egy validálási rendszert is kidolgoztam és alkalmaztam.
Item Type: | Thesis (PhD thesis) |
---|---|
Supervisor: | Kő Andrea |
Subjects: | Knowledge economy, innovation Computer science |
ID Code: | 1242 |
Date: | 7 October 2022 |
DOI: | https://doi.org/10.14267/phd.2022062 |
Deposited On: | 27 Jun 2022 11:57 |
Last Modified: | 28 Nov 2022 11:54 |
Repository Staff Only: item control page