Szemantikus web technológiák alkalmazási lehetőségei az „exploratory” OLAP-ban

Molnár, Géza Gábor (2022) Szemantikus web technológiák alkalmazási lehetőségei az „exploratory” OLAP-ban. Doktori (PhD) értekezés, Budapesti Corvinus Egyetem, Közgazdasági és Gazdaságinformatikai Doktori Iskola. DOI https://doi.org/10.14267/phd.2022062

Teljes szöveg

[img]
Preview
PDF : (az értekezés)
3MB
[img]
Preview
PDF : (az értekezés tézisei magyar nyelven)
1MB
[img]
Preview
PDF : (draft in English)
1MB

Hivatalos URL: https://doi.org/10.14267/phd.2022062

Kivonat, rövid leírás

Az utóbbi évtizedben a strukturálatlan adatok (pl. szövegek) mennyisége sokkal nagyobb mértékben nőtt, mint a strukturált adatoké. Ez nem kis mértékben a közösségi médiának és az okos eszközök elterjedésének köszönhető. A nagy mennyiségű adat tárolása egyelőre nem okoz gondot, mivel a tároló eszközök ára az utóbbi időben jelentősen csökkent, kapacitásuk viszont közben növekedett. A strukturálatlan adatok feldolgozásával viszont más a helyzet. A nagy adatmennyiség miatt sokszor reménytelen, hogy hasonló feladatokat manuálisan végezzünk el. Ezért manapság különösen fontos, hogy olyan számítógépes eljárásokat dolgozzunk ki, amely lehetővé teszi a strukturálatlan – többnyire szöveges - adatok feldolgozását és elemzését. A strukturálatlan adatok feldolgozása, mint probléma sok részterületet érint, többek között a tudásreprezentáció, a szemantikus technológiák, az adat-, web-, és szövegbányászatot, a mesterséges intelligencia részterületeit ezen belül a tanuló algoritmusok témáját is. A struktúra alkotás fontos eszközei a szemantikus technológiák, ezek közül az ontológiák, amelyek egy adott terület fogalmi leírását adják meg. Segítségükkel egy adott területre jellemző fogalmak és a közöttük lévő kapcsolatok definiálhatók. Kutatási témám a szemantikus technológiák (elsősorban ontológiák) adattárházakban való felhasználásával kapcsolatos. Olyan megoldásokat vizsgálok, amelyek lehetővé teszik a strukturált és nem strukturált adatok együttes elemzését az adattárház/üzleti intelligencia rendszerekben. Az ilyen rendszereket a szakirodalomban exploratory OLAP rendszereknek is nevezik. Az exploratory OLAP rendszerek területe meglehetősen új, a legelső modellek a szakirodalomban alig több, mint tíz éve jelentek meg. Fontos megjegyezni, hogy a legtöbb ilyen modell megmaradt koncepcionális szinten. Néhány esetben készült ugyan prototípus, viszont azok általános alkalmazhatósága még nem igazolt. Kutatásom során a következő kérdések megválaszolását tűztem ki célul: • Hogyan tehető szemantikussá a hagyományos OLAP és az adattárház, vagyis hogyan lehet megtervezni a szemantikus réteg integrációját az adattárházba? • Hogyan lehet a megtervezett modellt a gyakorlatban megvalósítani egy prototípus segítségével? • Mi lehet egy hatékony validálási módszer az „exploratory OLAP” modell esetében? A kutatás elvégzéséhez többféle módszert is alkalmaztam. A módszerek közé tartozik a design science, az adatgyűjtés és adatelemzés, az ontológia fejlesztési és értékelési módszertan, valamint a prototípus készítése során alkalmazott fejlesztési módszertan. A kutatás fontosabb eredményei a következők: • A helpdesk/ticketing ontológia elkészítése. Erre nem találtam meglévő releváns példát a szakirodalomban. Az általam készített változat nem fedi le az egész ticketing területet, elsősorban a hibabejelentésekre (incidensek) fókuszál. A ticketing ontológiákból két verziót is készítettem. Az első verzió egy kétszintű taxonómia, amely elősegíti a szemantikus keresést az incidensekben. Az ontológia második (továbbfejlesztett) verziója jobban írja le a ticketing rendszer működését, azon belül is az incidensek kezelését. További jellemzője, hogy ebben az osztály-alosztály kapcsolaton kívül más kapcsolatok, illetve az osztály tulajdonságok is megjelenjenek. • Exploratory OLAP prototípusok elkészítése. Az exploratory OLAP prototípusok közül nagyon kevés működő változat van a gyakorlatban. A kutatás során általam létrehozott prototípusok felhasználnak meglévő modelleket (Prasad, Abello), de azokat átalakítva, és a szükséges mértékig leegyszerűsítve. A prototípusok értékelésére egy validálási rendszert is kidolgoztam és alkalmaztam.

Tétel típusa:Disszertáció (Doktori (PhD) értekezés)
Témavezető:Kő Andrea
Tárgy:Innováció, tudásgazdaság
Számítástechnika
Azonosító kód:1242
Védés dátuma:7 október 2022
DOI:https://doi.org/10.14267/phd.2022062
Elhelyezés dátuma:27 Jun 2022 11:57
Last Modified:28 Nov 2022 11:54

Csak a repozitórium munkatársainak: tétel módosító lap

Letöltések

Letöltések száma az elmúlt két évben, havonkénti bontásban

View more statistics