Bilicz, Hanga Lilla and Bilicz, Dávid (2025) Imputálási eljárások hatékonyságának tesztelése egyváltozós paneladatokon: szimulációs elemzés és gyakorlati ajánlások = Evaluating the effectiveness of imputation methods for univariate panel data: a simulation analysis and practical recommendations. STATISZTIKAI SZEMLE, 103 (8). pp. 719-757. ISSN 0039-0690
|
Text
2025_08_719.pdf - Published Version Download (2MB) | Preview |
Abstract
A hiányzó adatok kezelése kiemelt jelentőségű a statisztikai modellezés és az empirikus kutatások pontosságának biztosítása érdekében. Különösen a területi paneladatok esetében kulcsfontosságú a megfelelő imputációs módszerek kiválasztása, mivel a hagyományos törlési eljárások jelentős adatvesztésselés torzítással járhatnak. Tanulmányunkban egyváltozós paneladatok hiányzó értékeinek imputációjátvizsgáljuk öt, különböző karakterisztikákkal rendelkező ismérv esetében, szimulációs kísérlet segítségével tesztelve tizenegy különböző, széles körben alkalmazott eljárást. Eredményeink alapján az adatokpanel jellegét figyelembe vevő, peremeloszlásra építő módszerek általánosan jobb teljesítményt nyújtanak, függetlenül az adatok jellegétől. Következésképpen alkalmazásukat különösen ajánljuk a hiányzóterületi adatok imputációjára, hiszen nemcsak a panelelemzések, hanem sok esetben a keresztmetszetiadatokra építő kutatások esetén is elérhető panelmegfigyelés a területi ismérvek tekintetében, amelykarakterisztika figyelembevétele jelentősen javíthatja az imputálás és következésképpen a statisztikaieljárások megbízhatóságát. Kutatásunk rávilágít továbbá arra is, hogy az aggregált értékek ismeretenem feltétlenül javítja az imputálás pontosságát, valamint bármilyen csoportosításon alapuló technikahatékonysága erősen függ a csoportképzés relevanciájától. | Handling missing data is crucial for ensuring the accuracy of statistical modeling and empirical research. The selection of appropriate imputation methods is particularly important for spatial panel data, as traditional deletion techniques may lead to significant data loss and bias. In our study, we examine the imputation of missing values in univariate panel data across five variables with different characteristics, testing eleven widely used methods through a simulation experiment. Our results indicate that methods based on marginal distributions, which account for the panel nature of the data, consistently outperform other approaches, regardless of data characteristics. Consequently, we strongly recommend their application for imputing missing spatial data, as panel observations are often available even in cross-sectional studies involving spatial indicators. Considering these characteristics can significantly improve imputation accuracy and, consequently, the reliability of statistical analyses. Furthermore, our research highlights that the knowledge of aggregated values does not necessarily enhance imputation accuracy, and the effectiveness of any grouping-based technique heavily depends on the relevance of the grouping criteria.
| Item Type: | Article |
|---|---|
| Uncontrolled Keywords: | hiányzó adatok, imputációs módszerek, panelelemzés, missing data, imputation methods, panel data analysis |
| Subjects: | H Social Sciences / társadalomtudományok > HA Statistics / statisztika |
| SWORD Depositor: | MTMT SWORD |
| Depositing User: | MTMT SWORD |
| Date Deposited: | 09 Aug 2025 10:19 |
| Last Modified: | 09 Aug 2025 10:19 |
| URI: | https://real.mtak.hu/id/eprint/222164 |
Actions (login required)
![]() |
Edit Item |




