データフレームからis.elementを使用し素早くデータを抽出する方法です。is.elementの簡易型は%in%です。
データの準備
適当な項目が思いつきませんでしたので、政府統計の総合窓口より平成23年社会生活基本調査スポーツの表21「スポーツの種類」を使用しています。
政府統計の総合窓口は多くの統計情報が公開されています。
http://www.e-stat.go.jp/SG1/estat/eStatTopPortal.do
「スポーツの種類」から総数に示されている項目名だけを抜き出し、オリジナルのDATA1と抜き出す項目名のDATA2を作成しました。
コマンド
###ライブラリーの読み込み##### #XLConnectパッケージがなければインストール if(!require("XLConnect", quietly = TRUE)){ install.packages("XLConnect");require("XLConnect") } library("tcltk") ##### ###データの読み込み##### ###DATA1##### sheetSelect <- 1 #読み込むシート番号を入力 selectABook <- paste(as.character(tkgetOpenFile(title = "DATA1ファイルを選択",filetypes = '{"xlsxファイル" {".xlsx"}}',initialfile = "*.xlsx")), sep = "", collapse =" ") MasterAnaData <- loadWorkbook(selectABook) Data1 <- readWorksheet(MasterAnaData, sheet = sheetSelect) ###DATA2##### sheetSelect <- 1 #読み込むシート番号を入力 selectABook <- paste(as.character(tkgetOpenFile(title = "DATA2ファイルを選択",filetypes = '{"xlsxファイル" {".xlsx"}}',initialfile = "*.xlsx")), sep = "", collapse =" ") MasterAnaData <- loadWorkbook(selectABook) Data2 <- readWorksheet(MasterAnaData, sheet = sheetSelect) ###データの抽出##### NewData <- subset(Data1, Data1[, 1] %in% Data2[, 1]) #抽出 ###データの確認##### NewData 項目 回数 9 ゴルフ(練習場を含む) 9 10 柔道 10 11 剣道 11 16 スキー・スノーボード 16 17 登山・ハイキング 17 18 サイクリング 18 19 ジョギング・マラソン 19
少しでも、ウェブや実験の解析が楽になりますように!!