データ特徴を確認するコマンドに「str」「sumarry」「class」コマンドなどがありますが、図でザクッと確認したい方へオススメのパッケージです。
パッケージバージョンは0.6.0.9000。実行コマンドはR version 3.2.3で確認しています。
パッケージのインストール
下記、コマンドを実行してください。
#パッケージのインストール install.packages("devtools") devtools::install_github("tierneyn/visdat")
実行コマンド
詳細はコメント、パッケージのヘルプを確認してください。
#パッケージの読み込み library("visdat") ###データ例の作成##### n <- 30 #data.frame class TestData <- data.frame(Group = sample(paste0("Group ", 1:5), n, replace = TRUE), Data1 = sample(0:700, n, replace = TRUE), Data2 = sample(c(40:80, NA), n, replace = TRUE), Data3 = sample(60:1000, n, replace = TRUE), Data4 = as.numeric(sample(c(80:90, NA), n, replace = TRUE)), Data5 = sample(LETTERS[1:24], n, replace = TRUE), Data6 = sample(c("Group", 1:5, NA, "2016/03/12", 5.3, LETTERS[1:24], 0.000321), n, replace = TRUE)) ######## #データ構造の確認 str(TestData) 'data.frame': 30 obs. of 7 variables: $ Group: Factor w/ 5 levels "Group 1","Group 2",..: 3 3 5 3 2 2 5 5 1 4 ... $ Data1: int 392 334 631 493 435 504 514 654 500 165 ... $ Data2: int 63 47 66 61 56 63 71 56 63 75 ... $ Data3: int 922 627 779 140 575 846 444 665 360 273 ... $ Data4: num 85 87 89 88 83 81 88 89 87 89 ... $ Data5: Factor w/ 18 levels "A","B","C","D",..: 13 18 2 3 17 8 6 1 17 14 ... $ Data6: Factor w/ 20 levels "2016/03/12","3",..: 3 2 12 15 17 NA 12 1 20 16 .. #データ構造を図式化:vis_datコマンド #class毎に並び替え設定:sort_typeオプション vis_dat(TestData, sort_type = FALSE) #データの欠損値を図式化:vis_missコマンド #欠損値をまとめて表示:clusterオプション vis_miss(TestData, cluster = TRUE) #配列内のデータ構造を図式化:vis_guessコマンド vis_guess(TestData[, 6:7])
出力例
・vis_datコマンド
・vis_missコマンド
・vis_guessコマンド
少しでも、あなたのウェブや実験の解析が楽になりますように!!