データへ欠損値をランダムに代入、欠損値にデータの中央値や平均値を代入、そしてデータの欠損値情報を表示するコマンドが収録されたパッケージの紹介です。
バージョンは1.0.3。実行コマンドはR version 3.2.2で確認しています。
パッケージのインストール
下記コマンドを実行してください。
[code language=”R”]
#パッケージのインストール
install.packages(“ForImp”)
[/code]
実行コマンド
詳細はコメント、パッケージヘルプを確認してください。
[code language=”R”]
#パッケージの読み込み
library(“ForImp”)
###データ例の作成####
TestData
[code language=”R”]
#NA値に各列データの平均値を代入:medianimpコマンド
meanimp(MissData)
[,1] [,2] [,3] [,4] [,5]
[1,] 1.000000 11.00000 21.00000 35.625 41.000
[2,] 2.000000 12.00000 22.00000 32.000 45.875
[3,] 3.000000 15.77778 23.00000 33.000 43.000
[4,] 4.000000 14.00000 24.83333 34.000 44.000
[5,] 5.000000 15.00000 24.83333 35.000 45.000
[6,] 6.000000 16.00000 26.00000 36.000 45.875
[7,] 7.000000 17.00000 24.83333 37.000 47.000
[8,] 5.222222 18.00000 28.00000 38.000 48.000
[9,] 9.000000 19.00000 29.00000 35.625 49.000
[10,] 10.000000 20.00000 24.83333 40.000 50.000
#マトリックスを指定した値を代入:transfmatcatコマンド
transfmatcat(TestData, cat = c(2,5))
[,1] [,2] [,3] [,4] [,5]
[1,] 1 1 1 1 1
[2,] 1 1 1 1 1
[3,] 1 2 1 2 1
[4,] 1 2 1 2 1
[5,] 1 3 1 3 1
[6,] 2 3 2 3 2
[7,] 2 4 2 4 2
[8,] 2 4 2 4 2
[9,] 2 5 2 5 2
[10,] 2 5 2 5 2
[/code]
少しでも、あなたのウェブや実験の解析が楽になりますように!!