データの特徴を把握するのに便利なパッケージの紹介です。基本的な記述統計を簡単に確認することができます。
パッケージバージョンは0.0.2。実行コマンドはwindows 7およびOS X 10.11.5のR version 3.3.0で確認しています。
パッケージのインストール
下記コマンドを実行してください。
#パッケージのインストール install.packages("devtools") devtools::install_github("gitronald/dtables")
実行コマンド
詳細はコマンド、パッケージのヘルプを確認してください。
#パッケージの読み込み library("dtables") ###データ例の作成##### n <- 300 TestData <- data.frame(Group = sample(paste0("Group", 1:5), n, replace = TRUE), Data1 = rnorm(n), Data2 = rnorm(n) + rnorm(n) + rnorm(n), Data3 = sample(0:1, n, replace = TRUE), Data4 = sample(LETTERS[1:26], n, replace = TRUE)) ####### ###データの要約を表示:dftコマンド##### #割合を表示:propオプション;初期値TRUE #パーセントを表示:percオプション;初期値TRUE #基本的な使い方 dft(TestData$Group) Group n prop perc 1 Group1 62 0.2066667 20.7% 2 Group2 71 0.2366667 23.7% 3 Group3 69 0.2300000 23.0% 4 Group4 51 0.1700000 17.0% 5 Group5 47 0.1566667 15.7% #byオプションで要素の記述統計が可能です dft(TestData$Group, by = TestData$Data1) Group n prop mean sd se X11 Group1 62 0.21 -0.07 0.94 0.12 X12 Group2 71 0.24 0.00 1.08 0.13 X13 Group3 69 0.23 -0.24 1.01 0.12 X14 Group4 51 0.17 0.29 0.89 0.12 X15 Group5 47 0.16 -0.03 0.97 0.14 #データ構成を表示:dvariableオプション dvariable(TestData) variable class mode type levels frequencies statistics 1 Group factor numeric integer 5 1 0 2 Data1 numeric numeric double 300 0 1 3 Data2 numeric numeric double 300 0 1 4 Data3 integer numeric integer 2 1 1 5 Data4 factor numeric integer 26 0 0 #データ要素の記述統計を一括表示:dtableコマンド dtable(TestData) Note: 'Data4' was not classified. $Frequencies dataset demographic NA. n perc 1 TestData Group Group1 62 20.7% 2 Group2 71 23.7% 3 Group3 69 23.0% 4 Group4 51 17.0% 5 Group5 47 15.7% 6 TestData Data3 0 144 48.0% 7 1 156 52.0% $Statistics dataset variable vars n mean sd median trimmed mad min max range skew kurtosis se X1 TestData Data1 1 300 0.0 1.0 -0.1 0.0 0.9 -2.8 2.9 5.6 0.0 0.2 0.1 X11 TestData Data2 1 300 0.0 1.8 0.0 0.0 1.9 -6.1 4.0 10.1 -0.2 -0.2 0.1 X12 TestData Data3 1 300 0.5 0.5 1.0 0.5 0.0 0.0 1.0 1.0 -0.1 -2.0 0.0
少しでも、あなたの解析が楽になりますように!!