Rで解析:個体の性質でグループを分けてみませんか?判別分析「PPtreeViz」パッケージ

Rの解析に役に立つ記事
スポンサーリンク

各個体が有する「性質(変量)」からグループ分けのルールを決めて、未知の個体が所属するグループを推定し、収集したデータの特徴を探る方法の一つに判別分析(パターン分析)があります。

例えば、判別分析は「花の特徴から、すでに知られているどの種類に所属するか」、「企業の財務成績から、信用各付けを推定」、「著者名のない小説の単語出現傾向などから著者を推定」、「ウェブで購入につながる行動パターンの推定」などに利用されています。

有用な判別分析ですが、加工せずにプレゼン資料で使える図を出力するRパッケージはあまり見かけませんでした。そこで、そんな問題を解決できる、「PPtreeViz」パッケージを紹介します。

パッケージバージョンは2.4.0。R version 4.2.2で確認しています。

スポンサーリンク

参考図書の紹介

判別分析は傾向の推定に非常に有用な手法です。下記、本はRを使用しながら基礎理論を紹介しています。手軽な価格なのでオススメです。

パッケージのインストール

下記、コマンドを実行してください。

install.packages("PPtreeViz")

実行コマンド

詳細はコマンド内コメントならびにパッケージのヘルプを確認してください。
なお、分類ルールには「PPmethod」オプションを使用し、”LDA”, “PDA”, “Lr”, “GINI”, “ENTROPY”のアルゴリズムが利用できます。また、参考データはRに付属のirisデータを使用しています。

#パッケージの読み込み
library("PPtreeViz")

#参考データの読み込み
data(iris)

#参考1
Huberplot(iris[,1:2], iris[,5], PPmethod = "LDA")

#参考2
LDAindex(iris[,5],as.matrix(iris[,1:4]))

#参考3
Tree.result <- PPTreeclass(Species~., data = iris, PPmethod = "LDA")
Tree.result
plot(Tree.result)

#参考4
Tree.result <- PPTreeclass(Species~., data = iris, PPmethod = "LDA")
Tree.result
PPclassNodeViz(Tree.result,1,1)

出力例

参考1

参考1

参考3

参考2

参考4

参考3

少しでも、あなたの解析が楽になりますように!!

タイトルとURLをコピーしました