Rで解析:データを要約する手法。主成分分析!PCA!「pcaBootPlot」パッケージの紹介

Rの解析に役に立つ記事
スポンサーリンク

主成分分析は多数変数のデータをできるだけ少ないデータの損失で、特徴を集約し分析をおこなう手法です。例えば、都市間の距離データを要約し、都市の位置関係を示した図を見たことはないでしょうか。

Rには主成分分析を実行するコマンドとして”prcomp”と”princomp”があります。
これらのコマンドでも十分に主成分分析をおこなえますが、変数の設定や図の出力は初心者には面倒です。

そんな、図の出力をデータをから出力してくれる「pcaBootPlot」パッケージがリリースされましたので紹介します。主成分分析を学習したい方は導入をオススメします。

主成分分析を利用した高度な解析や仕組み、ブートストラップ法はウェブで検索すると多くのサイトが解説してくれます。ぜひ、多数変数を要約しデータの特徴を示す主成分分析を解析に活用いただければと思います。

パッケージのバージョンは0.2.3。windows11のR version 4.2.2で確認しています。


スポンサーリンク

パッケージのインストール

下記コマンドを実行してください。

#パッケージのインストール
devtools::install_github("StatQuest/pcaBootPlot")

実行コマンドの紹介

下記コマンドを実行してください。詳細はパッケージHELPを参照ください。

#パッケージの読み込み
library("pcaBootPlot")

#データ例の作成
TestData <- data.frame(Group = paste0("Test", 1:100),
                       data1 = sample(1:1000, 100, replace = TRUE),
                       data2 = sample(1:500, 100, replace = TRUE),
                       data3 = sample(500:1000, 100, replace = TRUE))

#PCAプロットコマンド
#pdf.filenameオプション:作業ディレクトリにプロットした図をPDFで出力します, 初期設定はNULLでPDFに出力しません
#ブートストラップオプション:num.boot.samples;初期設定は100です
pcaBootPlot(TestData, log2.transform = FALSE, pdf.filename = "TEST.pdf")

出力例

PCAPlot

少しでも、あなたの解析が楽になりますように!!

タイトルとURLをコピーしました