データ構造をヒートマップで確認するのに便利なパッケージです。確認は欠損値だけでなく条件に該当やデータの比較が可能です。
パッケージバージョンは0.5.3。実行コマンドはwindows 11のR version 4.1.2で確認しています。
パッケージのインストール
下記コマンドを実行してください。
#パッケージのインストール install.packages("visdat")
実行コマンド
詳細はコマンド、パッケージのヘルプを確認してください。
#パッケージの読込み library("visdat") ###データ例の作成##### n <- 300 TestData <- data.frame("Group" = factor(sample(paste0("Group", 1:3), n, replace = TRUE)), "Data1" = sample(c(rnorm(3), NA), n, replace = TRUE), "Data2" = sample(c(rnorm(3), NA), n, replace = TRUE), "Character" = sample(c("ABC", "CDE", NA), n, replace = TRUE), "Logical" = rep(c(TRUE, NA), each = n/2), stringsAsFactors = FALSE) #構造確認 #str(TestData) ######## #データタイプ,欠損値を表示:vis_datコマンド #色を指定:palette;"default","qual","cb_safe" #データの並び順:sort_type;FALSEで元データ順 vis_dat(x = TestData, palette = "default", sort_type = FALSE) #欠損値の出現割合を表示:vis_missコマンド #欠損値の出現割合が高い順に表示:sort_miss;TRUE/FALSE vis_miss(x = TestData, sort_miss = TRUE) #条件に該当するか視覚化:vis_expectコマンド #条件式を設定:expectation;~.x 条件式で設定 #該当したデータ割合を表示:show_perc vis_expect(data = TestData, expectation = ~.x %in% !NA, show_perc = TRUE) #データを比較して表示:vis_compareコマンド ###比較用のデータを準備##### Data2 <- TestData Data2[50:199, 3] <- sample(c(rnorm(3), NA), 150, replace = TRUE) ##### vis_compare(TestData, Data2)
出力例
・vis_datコマンド
・vis_missコマンド
・vis_expectコマンド
・vis_compareコマンド
少しでも、あなたの解析が楽になりますように!!