Rで解析:データ特徴を図で確認「visdat」パッケージ

Rの解析に役に立つ記事
スポンサーリンク

データ特徴を確認するコマンドに「str」「sumarry」「class」コマンドなどがありますが、図でザクッと確認したい方へオススメのパッケージです。

パッケージバージョンは0.6.0.9000。実行コマンドはR version 3.2.3で確認しています。

スポンサーリンク

パッケージのインストール

下記、コマンドを実行してください。

#パッケージのインストール
install.packages("devtools")
devtools::install_github("tierneyn/visdat")

実行コマンド

詳細はコメント、パッケージのヘルプを確認してください。

#パッケージの読み込み
library("visdat")

###データ例の作成#####
n <- 30
#data.frame class
TestData <- data.frame(Group = sample(paste0("Group ", 1:5), n, replace = TRUE),
                       Data1 = sample(0:700, n, replace = TRUE),
                       Data2 = sample(c(40:80, NA), n, replace = TRUE),
                       Data3 = sample(60:1000, n, replace = TRUE),
                       Data4 = as.numeric(sample(c(80:90, NA), n, replace = TRUE)),
                       Data5 = sample(LETTERS[1:24], n, replace = TRUE),
                       Data6 = sample(c("Group", 1:5, NA, "2016/03/12", 5.3,
                                        LETTERS[1:24], 0.000321), n, replace = TRUE))
########

#データ構造の確認
str(TestData)
'data.frame':   30 obs. of  7 variables:
  $ Group: Factor w/ 5 levels "Group 1","Group 2",..: 3 3 5 3 2 2 5 5 1 4 ...
$ Data1: int  392 334 631 493 435 504 514 654 500 165 ...
$ Data2: int  63 47 66 61 56 63 71 56 63 75 ...
$ Data3: int  922 627 779 140 575 846 444 665 360 273 ...
$ Data4: num  85 87 89 88 83 81 88 89 87 89 ...
$ Data5: Factor w/ 18 levels "A","B","C","D",..: 13 18 2 3 17 8 6 1 17 14 ...
$ Data6: Factor w/ 20 levels "2016/03/12","3",..: 3 2 12 15 17 NA 12 1 20 16 ..

#データ構造を図式化:vis_datコマンド
#class毎に並び替え設定:sort_typeオプション
vis_dat(TestData, sort_type = FALSE)

#データの欠損値を図式化:vis_missコマンド
#欠損値をまとめて表示:clusterオプション
vis_miss(TestData, cluster = TRUE)

#配列内のデータ構造を図式化:vis_guessコマンド
vis_guess(TestData[, 6:7])

出力例

・vis_datコマンド

vis_dat

・vis_missコマンド

vis_miss

・vis_guessコマンド

vis_guess

少しでも、あなたのウェブや実験の解析が楽になりますように!!

タイトルとURLをコピーしました