setoya-blog

システム開発技術、データ分析関連でお勉強したことや、山奥生活を綴る、テンション低めなブログです。

Rでデータの正規性を検定する

データが正規分布になっているかどうかは、シャピロ・ウィルク検定で簡単に検証できる。

> x <- rnorm(20, mean=5, sd=2)
> x
 [1] 7.3414508 3.4414882 5.4764692 4.7784505 8.0017854 2.8685248 5.2045962
 [8] 1.6700683 7.0892245 4.1862463 4.7856539 5.6737798 2.9965587 7.1440601
[15] 0.9903376 6.0238779 6.1670122 7.1271021 5.8264607 6.3503228
> shapiro.test(x)

	Shapiro-Wilk normality test

data:  x 
W = 0.9471, p-value = 0.3251

この場合、p値が大きいのでxは正規分布に従うという帰無仮説は棄却されない。rnormで生成しているので当たり前だけど。