別名「ワードクラウド」と紹介されることもある「タグクラウド」の作成が可能な「tagcloud」パッケージを紹介します。本パッケージは、他のタグクラウド作成パッケージよりもコマンドが単純かと思います。
参考までに、2015年1月から6月に「からだにいいもの」への検索キーワードをGoogle Analyticsより取得しタグクラウドで表現するコマンドを紹介します。意外とアニメでの検索流入が多いです。アニメからRが広がらないか模索しています。
Google Analyticsとの連携は下記「目次」を参考ください。
https://www.karada-good.net/rgoogleanalyticsindex/
「tagcloud」パッケージのバージョンは0.6。R version 3.2.0でコマンドを確認しています。
実行コマンドに必要なパッケージのインストール
下記コマンドを実行してください。
#パッケージのインストール install.packages(c("RGoogleAnalytics", "tagcloud"))
実行コマンドの紹介
詳細はコメント、過去記事ならびに各パッケージヘルプを確認してください。
#パッケージの読み込み library("RGoogleAnalytics") library("tagcloud") ###GoogleAnalyticsへのアクセス設定##### #クライアントIDを設定 client.id <- "クライアントID" #クライアントシークレットを設定 client.secret <- "クライアントシークレット" #クライアントIDおよびシークレットのトークンを取得 oauth_token <- Auth(client.id, client.secret) #プロファイルidを表示 GetProfiles(oauth_token) #データを取得するプロファイルidを設定 TableID <- "ga:プロファイルid" ###取得年,月を設定##### year <- 2015 #取得したい年を設定 month <- 1:6 #取得したい月を開始:終了で設定 ######## #繰返し用 ###取得年,月のベクトルを作成##### StartDate <- as.Date(paste(year, "-", formatC(head(month, 1), width = 2, flag="0"), "-01", sep = "")) EndDate <- as.Date(paste(year, "-", formatC(tail(month, 1), width = 2, flag="0"), "-01", sep = "")) ######## ##キーワードに対するセッションあたりのページビュー数を取得##### Dimensions <- c("ga:keyword") Metrics <- c("ga:pageviewsPerSession") #取得パラメータの設定 query.list <- Init(start.date = as.character(StartDate), end.date = as.character(EndDate), dimensions = Dimensions, metrics = Metrics, max.results = 10000, table.id = TableID) #取得パラメーターを処理 query <- QueryBuilder(query.list) #データの取得 AccessData <- GetReportData(query, oauth_token) #キーワードに対するセッションあたりのページビュー数Top100を抽出 AccessData <- head(AccessData[order(AccessData[, 2], decreasing = TRUE),], 100) #色の設定 #キーワードに対するセッションあたりのページビュー数を基準 #少から多い順に色を指定 palf <- colorRampPalette(c("red", "#a87963", "gray", "#4b61ba")) colors <- smoothPalette(AccessData[, 2], palfunc = palf) #Macでの日本語文字化防止 par(family = "HiraKakuProN-W3") #普通にプロット #algorithmオプション:"oval","fill","snake","random","list","clist" #初期値は"oval"です。 tagcloud(AccessData[, 1], weights = AccessData[, 2], col = colors, order = "size", algorithm = "oval") #algorithmオプション:"clist"を設定 #キーワードに対するセッションあたりのページビュー数Top20 tagcloud(AccessData[, 1][1:20], weights = AccessData[, 2][1:20], col = colors[1:20], order = "size", algorithm = "clist")
出力例
・普通にプロット
・algorithmオプション:”clist”を設定
少しでも、あなたのウェブや実験の解析が楽になりますように!!