Rで解析：記述統計の把握に便利かも「dtables」パッケージ

データの特徴を把握するのに便利なパッケージの紹介です。基本的な記述統計を簡単に確認することができます。

パッケージバージョンは0.0.2。実行コマンドはwindows 7およびOS X 10.11.5のR version 3.3.0で確認しています。

パッケージのインストール

下記コマンドを実行してください。

#パッケージのインストール
install.packages("devtools")
devtools::install_github("gitronald/dtables")

実行コマンド

詳細はコマンド、パッケージのヘルプを確認してください。

#パッケージの読み込み
library("dtables")

###データ例の作成#####
n <- 300
TestData <- data.frame(Group = sample(paste0("Group", 1:5), n, replace = TRUE),
                       Data1 = rnorm(n),
                       Data2 = rnorm(n) + rnorm(n) + rnorm(n),
                       Data3 = sample(0:1, n, replace = TRUE),
                       Data4 = sample(LETTERS[1:26], n, replace = TRUE))
#######

###データの要約を表示:dftコマンド#####
#割合を表示:propオプション;初期値TRUE
#パーセントを表示:percオプション;初期値TRUE
#基本的な使い方
dft(TestData$Group)
Group  n      prop  perc
1 Group1 62 0.2066667 20.7%
2 Group2 71 0.2366667 23.7%
3 Group3 69 0.2300000 23.0%
4 Group4 51 0.1700000 17.0%
5 Group5 47 0.1566667 15.7%

#byオプションで要素の記述統計が可能です
dft(TestData$Group, by = TestData$Data1)
Group  n prop  mean   sd   se
X11 Group1 62 0.21 -0.07 0.94 0.12
X12 Group2 71 0.24  0.00 1.08 0.13
X13 Group3 69 0.23 -0.24 1.01 0.12
X14 Group4 51 0.17  0.29 0.89 0.12
X15 Group5 47 0.16 -0.03 0.97 0.14

#データ構成を表示:dvariableオプション
dvariable(TestData)
variable   class    mode    type levels frequencies statistics
1    Group  factor numeric integer      5           1          0
2    Data1 numeric numeric  double    300           0          1
3    Data2 numeric numeric  double    300           0          1
4    Data3 integer numeric integer      2           1          1
5    Data4  factor numeric integer     26           0          0

#データ要素の記述統計を一括表示:dtableコマンド
dtable(TestData)
Note: 'Data4' was not classified.
$Frequencies
dataset demographic    NA.   n  perc
1 TestData       Group Group1  62 20.7%
2                      Group2  71 23.7%
3                      Group3  69 23.0%
4                      Group4  51 17.0%
5                      Group5  47 15.7%
6 TestData       Data3      0 144 48.0%
7                           1 156 52.0%

$Statistics
dataset variable vars   n mean  sd median trimmed mad  min max range skew kurtosis  se
X1  TestData    Data1    1 300  0.0 1.0   -0.1     0.0 0.9 -2.8 2.9   5.6  0.0      0.2 0.1
X11 TestData    Data2    1 300  0.0 1.8    0.0     0.0 1.9 -6.1 4.0  10.1 -0.2     -0.2 0.1
X12 TestData    Data3    1 300  0.5 0.5    1.0     0.5 0.0  0.0 1.0   1.0 -0.1     -2.0 0.0

少しでも、あなたの解析が楽になりますように！！