データの欠損値の状況を把握するのに大変便利なプロットを作成できるパッケージの紹介です。欠損値をパターン表示、influx-outflux plot、データ間の相関を表示が作成できます。
パッケージバージョンは0.0.1。実行コマンドはwindows 11のR version 4.1.3で確認しています。
パッケージのインストール
下記、コマンドを実行してください。
#パッケージのインストール install.packages("ggmice")
実行コマンド
詳細はコメント、パッケージのヘルプを確認してください。
#パッケージの読み込み library("ggmice") ###データ例の作成##### #tidyverseパッケージがなければインストール if(!require("tidyverse", quietly = TRUE)){ install.packages("tidyverse");require("tidyverse") } set.seed(12345) n <- 300 TestData <- tibble(Group = sample(paste0("Group", 1:2), n, replace = TRUE), Data1 = sample(c(1:50, NA), n, replace = TRUE), Data2 = sample(c(LETTERS, NA), n, replace = TRUE), Data3 = sample(c(100:150, NA), n, replace = TRUE)) ######## #欠損値をパターン表示:plot_patternコマンド #表示するデータを選択:vrbオプション;必要があれば列名を指定 #セルの正方形/長方形:squareオプション;TRUE:正方形/FALSE:長方形 #Variableのラベルを90度回転:rotateオプション;TRUE/FALSE plot_pattern(data = TestData, vrb = "all", square = TRUE, rotate = FALSE) #influx-outflux plotの作成:plot_fluxコマンド #plotの意味はhttps://cran.r-project.org/web/packages/ggmice/vignettes/ggmice.htmlを参照 #シンボルラベルのプロット位置:labelオプション;プロット内:TRUE plot_flux(data = TestData, vrb = "all", label = FALSE, caption = TRUE) #データ間の相関を表示:plot_corrコマンド #相関係数を表示:labelオプション #同データ間の相関を表示:diagonalオプション plot_corr(data = TestData, vrb = "all", square = TRUE, rotate = FALSE, label = TRUE, diagonal = FALSE)
出力例
・plot_patternコマンド

・plot_fluxコマンド

・plot_corrコマンド

少しでも、あなたの解析が楽になりますように!!