Rで解析:タグクラウド作成「tagcloud」パッケージの紹介

Rの解析に役に立つ記事
スポンサーリンク

別名「ワードクラウド」と紹介されることもある「タグクラウド」の作成が可能な「tagcloud」パッケージを紹介します。本パッケージは、他のタグクラウド作成パッケージよりもコマンドが単純かと思います。

参考までに、2015年1月から6月に「からだにいいもの」への検索キーワードをGoogle Analyticsより取得しタグクラウドで表現するコマンドを紹介します。意外とアニメでの検索流入が多いです。アニメからRが広がらないか模索しています。

Google Analyticsとの連携は下記「目次」を参考ください。
https://www.karada-good.net/rgoogleanalyticsindex/

「tagcloud」パッケージのバージョンは0.6。R version 3.2.0でコマンドを確認しています。

スポンサーリンク

実行コマンドに必要なパッケージのインストール

下記コマンドを実行してください。

#パッケージのインストール
install.packages(c("RGoogleAnalytics", "tagcloud"))

実行コマンドの紹介

詳細はコメント、過去記事ならびに各パッケージヘルプを確認してください。

#パッケージの読み込み
library("RGoogleAnalytics")
library("tagcloud")

###GoogleAnalyticsへのアクセス設定#####
#クライアントIDを設定
client.id <- "クライアントID"

#クライアントシークレットを設定
client.secret <- "クライアントシークレット"

#クライアントIDおよびシークレットのトークンを取得
oauth_token <- Auth(client.id, client.secret)

#プロファイルidを表示
GetProfiles(oauth_token)

#データを取得するプロファイルidを設定
TableID <- "ga:プロファイルid"

###取得年,月を設定#####
year <- 2015 #取得したい年を設定
month <- 1:6 #取得したい月を開始:終了で設定
########

#繰返し用
###取得年,月のベクトルを作成#####
StartDate <- as.Date(paste(year, "-", formatC(head(month, 1), width = 2, flag="0"), "-01", sep = ""))
EndDate <- as.Date(paste(year, "-", formatC(tail(month, 1), width = 2, flag="0"), "-01", sep = ""))
########

##キーワードに対するセッションあたりのページビュー数を取得#####
Dimensions <- c("ga:keyword")
Metrics <- c("ga:pageviewsPerSession")

#取得パラメータの設定
query.list <- Init(start.date = as.character(StartDate),
                      end.date = as.character(EndDate),
                      dimensions = Dimensions,
                      metrics = Metrics,
                      max.results = 10000,
                      table.id = TableID)

#取得パラメーターを処理
query <- QueryBuilder(query.list)

#データの取得
AccessData <- GetReportData(query, oauth_token)

#キーワードに対するセッションあたりのページビュー数Top100を抽出
AccessData <- head(AccessData[order(AccessData[, 2], decreasing = TRUE),], 100)

#色の設定
#キーワードに対するセッションあたりのページビュー数を基準
#少から多い順に色を指定
palf <- colorRampPalette(c("red", "#a87963", "gray", "#4b61ba"))
colors <- smoothPalette(AccessData[, 2], palfunc = palf)

#Macでの日本語文字化防止
par(family = "HiraKakuProN-W3")

#普通にプロット
#algorithmオプション:"oval","fill","snake","random","list","clist"
#初期値は"oval"です。
tagcloud(AccessData[, 1], weights = AccessData[, 2],
         col = colors, order = "size", algorithm = "oval")

#algorithmオプション:"clist"を設定
#キーワードに対するセッションあたりのページビュー数Top20
tagcloud(AccessData[, 1][1:20], weights = AccessData[, 2][1:20],
         col = colors[1:20], order = "size", algorithm = "clist")

出力例

・普通にプロット

tagFig1

・algorithmオプション:”clist”を設定

tagFig2

少しでも、あなたのウェブや実験の解析が楽になりますように!!

タイトルとURLをコピーしました