Munkaerőpiaci adattárház tervezése kompetenciatrendek elemzésére

Neusch, Gábor Loránd (2021) Munkaerőpiaci adattárház tervezése kompetenciatrendek elemzésére. PhD thesis, Budapesti Corvinus Egyetem, Gazdaságinformatika Doktori Iskola. DOI https://doi.org/10.14267/phd.2021038

[img]
Preview
PDF : (az értekezés)
3MB
[img]
Preview
PDF : (draft in English)
640kB
[img]
Preview
PDF : (az értekezés tézisei magyar nyelven)
647kB

Abstract

A munkaerőpiaci kereslet rendkívüli ütemben változik. A kompetenciák és a tudás a kereslet szempontjából gyorsan avulnak, egyre újabb és újabb ismeretekre van szükség. A legfontosabb alapkészségek megalapozásán túl, melyeket a hallgatók hosszú távon használni tudnak, a rövid távú versenyképesség biztosítása érdekében az oktatási intézményeknek folyamatosan összhangban kellene tartania a tanterveket a munkaerőpiaci kereslettel, amit számos tényező befolyásol és előrejelzése egyáltalán nem triviális. Az érintettek, a tárgy- és szakfelelősök legnagyobb nehézsége ebből a szempontból az, hogy nem látják előre az igények változását. Ha objektív képet kaphatnának arról, hogy a kompetenciák iránti kereslet hogyan alakul a munkaerőpiacon, akkor következtetéseket tudnának levonni a jövőbeli trendekre vonatkozóan. A legfontosabb információ, amire egy ilyen előrejelzéshez szükség van, az a munkaerőpiaci kereslet reprezentációja az egyes pillanatokban, idősorosan rögzítve. Ezt tulajdonképpen „pillanatképek” összességének is felfoghatjuk az egyes időpillanatokban igényelt kompetenciahalmazokról. Disszertációmban erre, a kompetenciakereslet és a felsőoktatási kínálat rövid távú összehangolására igyekszem fókuszálni egy olyan keretrendszer felvázolásával, melynek segítségével a munkaerőpiaci trendek és a keresletet leíró adatok valós időben elemezhetőek. Egy munkaerőpiaci „adattárház” koncepciójának kidolgozására teszek kísérletet, melyben a keresletre vonatkozó, álláshirdetésekben megjelenő információk összegyűjthetőek. Megvizsgálok olyan módszereket, melyek segítségével az állásajánlatokban explicit és implicit módon megjelenő, kompetenciakeresletet tükröző információk kinyerhetőek. Egy ilyen jellegű információforrás segítségével a felsőoktatás döntéshozói folyamatosan hozzá tudnák igazítani a kurzusok tematikáját a munkaerőpiaci kereslethez, és olyan kompetenciák elsajátítására tudnak lehetőséget kínálni a hallgatóknak, amit azok karrierjük első éveiben sikeresen értékesíteni tudnak a piacon. Az első kutatási kérdésem célja az adattárolási architektúra kiválasztását megalapozó szempontrendszer, majd segítségével a legmegfelelőbb architektúramodell kidolgozása volt. Implementáltam az adatokat legyűjtő scraper alkalmazást és elkezdtem az automatizált adatgyűjtést. 2019 januárjától közel négyszázezer hirdetést gyűjtöttem össze. Kidolgoztam az adatoknak egy lehetséges modelljét, továbbá a kiválasztási szempontok részletes vizsgálatával ajánlást tettem a megvalósításra javasolt adattárolási architektúrára. Kutatásom ezen szakasza feltáró jellegű. Az architektúraválasztási szempontrendszert szekunder kutatás, illetve szakirodalmi áttekintés segítségével dolgoztam ki. A munkaerőpiaci adattárház legfontosabb céljaként fogalmaztam meg, hogy a hirdetések kompetenciatartalmáról, annak időbeli- és térbeli alakulásáról hasznos információkat szolgáltasson a döntéshozók számára. Disszertációm második kutatási kérdéséhez kapcsolódóan bemutattam olyan módszereket, melyekkel hatékonyan kinyerhető ez az információ a hirdetések szövegéből. Bemutattam gyakori szövegbányászati – az egyes2 kifejezések előfordulási gyakoriságára alapuló – módszereket. Külső ontológiákban található kompetenciakifejezések és karakterláncok hasonlóságát számszerűsítő metrikák segítségével felépítettem egy logit modellt, melynek tesztadatokon mért felidézési aránya 85%, míg a precizitása 71,9%. Mivel a folyamatba való manuális beavatkozás kezdetben elkerülhetetlen, azaz mielőtt elfogadhatnánk ezeket a kompetenciajelölteket valós kompetenciaként, egy szakértőnek át kell néznie az eredményeket, így a modell elfogadható, mint ami hasznos információkkal tud szolgálni, és hozzáadott értékkel bír. A kutatás harmadik nagy blokkjában megvizsgáltam, hogy az álláshirdetésekben közvetlenül nem megjelenő, látens kompetenciák beazonosítása milyen módszerekkel lehetséges. Kidolgoztam egy reguláris kifejezésekre és egyszerű szabályokra alapuló módszert, melynek segítségével a 2019 októberi álláshirdetések 23,7%-át tudtam foglalkozáshoz kapcsolni, 97,5%- ban helyesen. Részletesen bemutattam egy döntési fára alapuló osztályozó modellt, melynek segítségével arra tettem kísérletet, hogy a hirdetéseket – címük alapján – a felhasznált ontológiákban leírt foglalkozásokhoz társítsam. A legjobbként elfogadott modell teszthalmazon mért precizitása 58%, míg felidézési aránya 68%, ami bár nem kiemelkedő, de felveszi a versenyt az irodalomban általam fellelt, hasonló feladatra megalkotott modellekkel (Amato et al. 2015). Saját t-SNE módszerrel végzett kísérletem alapján megerősítettem Csepregi (2020) eredményeit, miszerint az álláshirdetések klaszterei (témacsoportok) nem, vagy csak nagyon korlátozottan, kis hatásfokkal beazonosíthatóak azok leírásából készült tf-idf mátrix alapján. A 7. fejezet utolsó részében bemutattam egy harmadik lehetséges irányt a látens igények feltárására, az explicit megjelenő kompetenciák ontológiakapcsolatainak segítségével

Item Type:Thesis (PhD thesis)
Supervisor:Borbásné Szabó Ildikó
Uncontrolled Keywords:munkaerőpiac, kompetenciák
Subjects:Education
Labour economics
ID Code:1130
Date:28 June 2021
DOI:https://doi.org/10.14267/phd.2021038
Deposited On:31 Mar 2021 14:32
Last Modified:23 Jul 2021 07:01

Repository Staff Only: item control page

Downloads

Downloads per month over past two year

View more statistics