REAL

Normális eloszlás vizsgálata: melyik tesztet alkalmazzuk a gyakorlatban? = Examining normal distribution: which test to use?

Szilárd, Pálma Bernadett and Badics, Milán Csaba (2024) Normális eloszlás vizsgálata: melyik tesztet alkalmazzuk a gyakorlatban? = Examining normal distribution: which test to use? STATISZTIKAI SZEMLE, 102 (1). pp. 5-37. ISSN 0039-0690

[img]
Preview
Text
2024_01_005.pdf

Download (748kB) | Preview

Abstract

A statisztikában a normális eloszlásnak központi szerepe van. Kutatásunk az alábbi tizenegy normalitásteszt statisztikai erejét vizsgálja: Shapiro–Wilk- (SW-), Shapiro–Francia- (SF-), Filliben- (F-), Kolmogorov–Smirnov- (KS-), Anderson–Darling- (AD-), Kuiper- (K-), Cramér–von Mises- (CvM-), D’Agostino–Pearson- (DP-), Jarque–Bera- (JB-), Khí-négyzet- (CS-) és Vasicek- (V-) teszt. Az összehasonlításhoz öt, a normálistól eltérő eloszláscsoportból generálunk mintát Monte Carloszimulációval: (–∞, ∞) tartójú szimmetrikus és aszimmetrikus, (0, ∞) tartójú, (0, 1) tartójú és kevert eloszlásokból. A makrogazdasági és pénzügyi adatsorok gyakran 100-nál kisebb elemszámú megfigyelést tartalmaznak, új minta nem szimulálható, ezért kutatásunkban a 10, 20, 30, …, 100 elemszámú mintaméretekre fókuszálunk. Az eredmények alapján a (–∞, ∞) tartójú eloszlások esetén a regressziós és a korrelációs tesztek – mint például a Shapiro–Wilk- és a Filliben-próba – statisztikai ereje a legmagasabb. A (0, ∞) és (0, 1) tartójú eloszlásokon a Shapiro–Wilk- és a Vasicek-teszt teljesít a legjobban, míg a kevert a mintákon a Jarque–Bera-próba statisztikai ereje a kiemelkedő. A tanulmányunkban kapott eredmények segíthetnek a statisztikusoknak és az ökonométereknek a megfelelő normalitásteszt kiválasztásában a vizsgált adatgeneráló folyamatról kialakított prior elképzeléseik alapján. = In statistics, normal distribution has a fundamental role. This study analyses the statistical power of eleven tests of normality: Shapiro–Wilk (SW), Shapiro–Francia (SF), Filliben (F), Kolmogorov–Smirnov (KS), Anderson–Darling (AD), Kuiper (K), Cramér–von Mises (CvM), D'Agostino–Pearson (DP), Jarque–Bera (JB), Chi-square (CS) and Vasicek (V) test. The power comparison is obtained by sampling data from 5 distribution groups with Monte Carlo simulation: support (–∞, ∞) symmetric and asymmetric, support (0, ∞), support (0, 1), and contaminated distributions. We focus on the smaller 10, 20, 30, …, 100 sample sizes given that econometrics often model macroeconomic and financial timeseries within this range of samples. Results suggest that the regression and correlation-based normality tests, such as the Shapiro-Wilk and Filliben tests perform well on distributions with support (–∞, ∞). For distributions with (0, ∞) and (0, 1) support the Shapiro-Wilk and the Vasicek tests have the highest power while on contaminated samples the Jarque–Bera test outperforms them. The results could help statisticians and econometrics to apply the best-performing normality test having a prior assumption or information on the support of the data-generating process.

Item Type: Article
Uncontrolled Keywords: normalitásvizsgálat, Monte Carlo-szimuláció, statisztikai tesztek ereje = normality test, Monte Carlo simulation, power of statistical tests
Subjects: H Social Sciences / társadalomtudományok > HA Statistics / statisztika
SWORD Depositor: MTMT SWORD
Depositing User: MTMT SWORD
Date Deposited: 01 Feb 2024 14:09
Last Modified: 01 Feb 2024 14:09
URI: http://real.mtak.hu/id/eprint/187040

Actions (login required)

Edit Item Edit Item