各個体が有する「性質(変量)」からグループ分けのルールを決めて、未知の個体が所属するグループを推定し、収集したデータの特徴を探る方法の一つに判別分析(パターン分析)があります。
例えば、判別分析は「花の特徴から、すでに知られているどの種類に所属するか」、「企業の財務成績から、信用各付けを推定」、「著者名のない小説の単語出現傾向などから著者を推定」、「ウェブで購入につながる行動パターンの推定」などに利用されています。
有用な判別分析ですが、加工せずにプレゼン資料で使える図を出力するRパッケージはあまり見かけませんでした。そこで、そんな問題を解決できる、「PPtreeViz」パッケージを紹介します。
パッケージバージョンは2.4.0。R version 4.2.2で確認しています。
参考図書の紹介
判別分析は傾向の推定に非常に有用な手法です。下記、本はRを使用しながら基礎理論を紹介しています。手軽な価格なのでオススメです。
パッケージのインストール
下記、コマンドを実行してください。
install.packages("PPtreeViz")
実行コマンド
詳細はコマンド内コメントならびにパッケージのヘルプを確認してください。
なお、分類ルールには「PPmethod」オプションを使用し、”LDA”, “PDA”, “Lr”, “GINI”, “ENTROPY”のアルゴリズムが利用できます。また、参考データはRに付属のirisデータを使用しています。
#パッケージの読み込み library("PPtreeViz") #参考データの読み込み data(iris) #参考1 Huberplot(iris[,1:2], iris[,5], PPmethod = "LDA") #参考2 LDAindex(iris[,5],as.matrix(iris[,1:4])) #参考3 Tree.result <- PPTreeclass(Species~., data = iris, PPmethod = "LDA") Tree.result plot(Tree.result) #参考4 Tree.result <- PPTreeclass(Species~., data = iris, PPmethod = "LDA") Tree.result PPclassNodeViz(Tree.result,1,1)
出力例
参考1
参考3
参考4
少しでも、あなたの解析が楽になりますように!!