setoya-blog

システム開発技術、データ分析関連でお勉強したことや、山奥生活を綴る、テンション低めなブログです。

2013-02-04から1日間の記事一覧

Rubyでhtmlタグが含まれたテキストをサニタイズする

rgrove/sanitize · GitHubを使うと簡単にできる。 require 'sanitize' html = '<b><a href="http://foo.com/">foo</a></b><img src="http://foo.com/bar.jpg">' Sanitize.clean(html) # => 'foo'

Rでデータの正規性を検定する

R

データが正規分布になっているかどうかは、シャピロ・ウィルク検定で簡単に検証できる。 > x <- rnorm(20, mean=5, sd=2) > x [1] 7.3414508 3.4414882 5.4764692 4.7784505 8.0017854 2.8685248 5.2045962 [8] 1.6700683 7.0892245 4.1862463 4.7856539 5.6…