Takács, Olga (2023) Bérfüggvények becslése Magyarországon gépi tanuló algoritmusokkal. PhD thesis, Budapesti Corvinus Egyetem, Közgazdasági és Gazdaságinformatika Doktori Iskola. DOI https://doi.org/10.14267/phd.2023035
|
PDF : (az értekezés)
4MB | |
|
PDF : (az értekezés tézisei magyar nyelven)
311kB | |
|
PDF : (draft in English)
291kB |
Abstract
A munkagazdaságtan egyik leginkább kutatott témája, hogy milyen tényezők határozzák meg a béreket. Emellett a nemi bérkülönbségek vizsgálatánál is hasonlóan fontos kérdés, hogy a megfigyelt munkaerőpiaci jellemzők mennyiben magyarázzák a férfiak és a nők bérei közti különbséget. A kutatásom kiindulópontja, hogy az eddigi szakirodalomban leginkább hagyományos ökonometriai módszerekkel – főként regressziókkal – becsülték a bérfüggvényeket, melyekben a felhasznált változók közti kapcsolatok korlátozott mértékben jelentek csak meg. Általában azok a kereszthatások szerepeltek a becslőfüggvényekben, melyek az adott kutatás/kérdésfelvetés szempontjából lényegesek voltak. Azonban a függvényforma korlátozása befolyásolhatja mind a paraméterek, mind a bérek becslését. Emiatt a disszertációmban a bérfüggvények formájára való korlátozást oldottam fel tanuló algoritmusok használatával. A tanuló algoritmusok a hagyományos statisztikai módszerekkel összehasonlítva más feltételezésekből indulnak ki. A tanuló algoritmusok igyekeznek a lehető legszabadabb függvényformákat alkalmazni, ami által „adatvezérelt” módon a lehető legtöbb információ kinyerhető az adatokból. Ezek az eljárások képesek rátanulni az adatban rejlő összefüggésekre, emiatt nem kell előzetes feltételezéseket tenni az adatgeneráló folyamatról. A disszertációmban a gépi tanuló algoritmusok használata kettős célt szolgál. Egyrészről a magyarországi bérfüggvényt becslem tanuló algoritmussal, mellyel feltárhatóak a változók közötti kapcsolatok. Másrészről a nemi bérkülönbségek irodalmában gyakran használt Blinder-Oaxaca dekompozícióhoz használt férfi és egy női bérfüggvényt becslem meg tanuló algoritmusokkal. A nemi bérkülönbségek vizsgálatánál a becslési eredmények pontosítása miatt tartom lényegesnek a tanuló algoritmusok használatát. A célom annak bemutatása, hogy a bérfüggvények becslési módszertanának megváltoztatása milyen mértékben befolyásolja a Blinder-Oaxaca dekompozícióból kapott eredményeket, illetve a kapott eredmények további elemzése. Az értekezésben a 2016-os Bértarifa adatbázis felhasználásával feltételes következtetési fákkal becslem meg béreket. A fák könnyen interpretálható eredményeket adnak és természetes módon használhatóak a változók közti interakciók megtalálására. Emellett elemeztem a változófontossági mértékeket, valamint a változók szurrogátum jellegét. Ezek a vizsgálatok összességében igazoltak néhány kutatási kérdést és van, ahol további kérdéseket vetettek fel. Nem sikerült például igazolni az életkor bérmeghatározó szerepét. Helyette a szolgálati idő – mint a munkatapasztalat proxy változója – bizonyult fontosabb változónak. A változók közül kiemelkedik a foglalkozás és az iskolai végzettség bérmeghatározó szerepe. A szurrogátumok vizsgálata pedig arra hívta fel a figyelmet, hogy az ágazat bizonyos kontextusban erősen összefügghet a többi változóval. Tehát nem mondható, hogy az ágazat erősen korrelál a többi változóval, azonban egyes csoportoknál ez mégis igaz. A nemi bérkülönbségek irodalmához kapcsolódóan a célom annak bemutatása, hogy a bérfüggvények becsléséhez használt módszertan milyen mértékben befolyásolja a Blinder-Oaxaca dekompozícióból kapott eredményeket. A bérfüggvények becsléséhez egy OLS regressziót, valamint egy regressziós erdőt használok és az ezekből számolt bérbecsléseket használom fel a dekompozícióban, majd a kapott eredményeket hasonlítom össze. Az eredmények rámutattak, hogy a dekompozícióból számolt összetételhatás magasabb az erdő esetében, ami miatt a bérstruktúrahatás viszont alacsonyabb. Azonban az összetétel- és a bérstruktúrahatások így is hasonlóan alakulnak az OLS és az erdő esetében. Mindkét módszer esetében kimutatható, hogy a bérstruktúrahatás jelentősen magasabb, mint az összetételhatás. Emellett a heterogén bérstruktúrahatások számszerűsítésével vizsgálom a változók egyedi hatásait. A heterogén bérstruktúrahatás megmutatja, hogy mekkora lenne a különbség egy nő bérében, ha a férfi, illetve a női bérfüggvénnyel áraznák a munkáját. Az OLS-sel és az erdővel számolt heterogén hatások közti közepes korreláció módszertani különbségre hívja fel a figyelmet. Vagyis bár az átlagok hasonlóan alakulnak, azonban az egyéni szinten számolt hatásokat jelentős mértékben befolyásolhatja a módszertan megválasztása. Emellett az OLS-sel és az erdővel számolt változókategóriánkénti átlagos hatások nagy különbségeket mutatnak ott, ahol kevés számú megfigyelés esik az adott csoportba. Azonban nem lehet egy változót azonosítani, amely egyértelműen felelős lenne a két módszerrel számolt heterogén bérstruktúrahatások közti különbségért. Az eredményeim egybevágnak Weichselbaumer–Winter-Ebmer (2005) eredményeivel, akik kimutatták, hogy a Blinder-Oaxaca dekompozícióban használt módszerek hasonló eredményekre vezetnek, azonban a különböző becslési eljárások másként értékelik a változók nemi bérkülönbségre gyakorolt hatását. A heterogén bérstruktúrahatások időbeli alakulását is vizsgálom és azonosítom azokat a csoportokat, amelyek a leginkább, illetve a legkevésbé járultak hozzá az átlagos bérstruktúrahatás fennmaradásához. A disszertáció ezen részében regressziós erdőkkel becslem meg a férfi és a női bérfüggvényeket éves szinten a 2008 és 2016 közti időszakban. Az időbeli trendeket vizsgálva Magyarországon a nyers bérkülönbség időben emelkedett 2008 és 2016 között. A Blinder-Oaxaca felbontás alapján a nyers különbségen belül a negatív összetételhatás idővel csökkent, míg a bérstruktúrahatás időben állandónak bizonyult. A csökkenő összetételhatás vélhetően a rendszerváltást követő munkaerőpiaci átrendeződés hosszútávú eredménye. Klasszifikációs analízis (CLAN) segítségével vizsgáltam azoknak a nőknek a csoportjait, akik a legnagyobb és a legkisebb heterogén bérstruktúrahatással rendelkeztek. Azok a nők, akiknél a bérstruktúrahatás alacsony volt, a kisebb hazai szolgáltatószektorban tevékenykedő vállalatoknál dolgoztak a központi régióban. Ezzel szemben a legnagyobb bérstruktúrahatással rendelkező csoport tagjai a nagyobb, külföldi tulajdonú, feldolgozóipari vállalatoknál dolgoztak a Dunántúlon. A két csoport elkülönülése magyarázható a monopszonikus munkapiac elméletével, mely szerint a nők vállalati rugalmassága kisebb, mint a férfiaké és ez vezethet a munkáltató piaci erőfölényéhez. A CLAN eredményei alátámasztják ezt elméletet, ugyanis a központi régióban nagyobb lehet a munkáltatók közti verseny, illetve a nők könnyebben juthatnak új állásokhoz, ami miatt a munkaadók piaci erőfölénye kisebb lehet. Tehát ezen a területen kevésbé valószínű, hogy a fennálló nemi bérkülönbség a vállalat monopszonikus erejéből származzon.
Item Type: | Thesis (PhD thesis) |
---|---|
Supervisor: | Vincze János |
Subjects: | Knowledge economy, innovation Human resource management Computer science |
ID Code: | 1256 |
Date: | 19 June 2023 |
DOI: | https://doi.org/10.14267/phd.2023035 |
Deposited On: | 27 Oct 2022 08:15 |
Last Modified: | 06 Oct 2023 08:37 |
Repository Staff Only: item control page