Rで解析:データ特性を丸ごと確認!「tabplot」パッケージ

Rの解析に役に立つ記事
スポンサーリンク

データを丸ごとグラフで表現してくれる「tabplot」パッケージを紹介します。量的データだけでなく質的データも対応しています。また、出力されるグラフにはデータ数やラベルも表示されます。非常に便利なパッケージです。

データをグラフで表現するのは労力のかかる作業です。しかし、記述統計では見落としがちなデータの特性が浮かび上がることもあるので重要な作業です。データ解析の第一歩は記述統計ならびにグラフによる確認です。

パッケージのバージョンは1.4.1。実行コマンドはwindows 11のR version 4.1.2で確認しています。

スポンサーリンク

パッケージのインストール

下記コマンドを実行してください。

#パッケージのインストール
if(!require("devtools", quietly = TRUE)){
  install.packages("devtools");require("devtools")
}
install_github("mtennekes/tabplot")

実行コマンド

詳細はコマンド、パッケージヘルプを確認してください。

#パッケージの読み込み
library("tabplot")
#tidyverseパッケージがなければインストール
if(!require("tidyverse", quietly = TRUE)){
  install.packages("tidyverse");require("tidyverse")
}

###データ例の作成#####
set.seed(1234)
n <- 10000
TestData1 <- tibble(Data1 = sample(1:5, n, replace = TRUE),
                    Group = sample(c(paste0("Group", 1:5), NA), n, replace = TRUE),
                    Text = sample(c(LETTERS[10:24], NA), n, replace = TRUE),
                    Data2 = runif(n), Data3 = 1:n, Data4 = rnorm(n))
TestData2 <- tibble(Data1 = sample(1:5, n, replace = TRUE),
                    Group = sample(c(paste0("Group", 1:5), NA), n, replace = TRUE),
                    Text = sample(c(LETTERS[10:24], NA), n, replace = TRUE),
                    Data2 = runif(n), Data3 = 1:n, Data4 = rnorm(n))
########

#データの表示:tableplotコマンド
#一番初めのデータの降順で表示されます
tableplot(TestData1)

#表示するデータを選択:selectオプション
tableplot(TestData1, select = c(Data1, Text, Data3))

#表示するデータを構成割合で指定:from,toオプション
tableplot(TestData1, from = 10, to = 20)

#表示するデータを条件で選択:subsetオプション
#orは|,andは&で指定
tableplot(TestData1, subset = Text == c("K", "P") & Group == "Group3")

#2つのデータの違いを比較
Tp1 <- tableplot(TestData1, plot = FALSE)
Tp2 <- tableplot(TestData2, plot = FALSE)
plot(Tp1 - Tp2)

#プロット色を変更:numPals,palsオプション
#パッケージ付属のカラーパレットを使用します
#numPals:量的データの色
#palse:質的データの色,listで指定します
tableplot(TestData1, numPals = "PRGn", pals = list(Group = "Set8", Text = "Set6"))

#パッケージ付属のカラーパレット
tablePalettes()

出力例

・tableplotコマンド

・selectオプション

・from,toオプション

・subsetオプション

・2つのデータの違いを比較

・numPals、palsオプションを適応

・パッケージ付属のカラーパレット


少しでも、あなたの解析が楽になりますように!!

タイトルとURLをコピーしました