Rで解析:データをデータベースで管理!「filehash」パッケージ

Rの解析に役に立つ記事
スポンサーリンク

異なるデータを保存するクラスにlistがあります。listは非常に便利なデータ形式ですが、操作がわかりにくい点もあります。「filehash」パッケージは異なる形式のデータをデータベースとして簡単に管理できるのでオススメです。

作成したデータベースはファイルとして保存が可能です。コマンド操作がシンプルで使いやすく、大規模データの管理に役に立つのではと思います。

パッケージのバージョンは2.3。R version 3.2.1でコマンドを確認しています。


スポンサーリンク

パッケージのインストール

下記コマンドを実行してください。

#パッケージのインストール
install.packages("filehash")

実行コマンド

詳細はコマンド、パッケージヘルプを確認してください。

#パッケージの読み込み
library("filehash")

#データベースの作成:dbCreateコマンド
#作業フォルダにデータベースファイルが作成されます
dbCreate("Testdb")

#データベースを読み込んで初期化:dbInitコマンド
#データベースを編集するのに必要です
Testdb <- dbInit("Testdb")

#データの書き込み:dbInsertコマンド
dbInsert(Testdb, "Group1", sample(1:1000, 300, replace = TRUE))
dbInsert(Testdb, "Group2", sample(LETTERS, 30, replace = TRUE))
dbInsert(Testdb, "Group3", sample(1:1000, 300, replace = TRUE))

#キーを元にデータを取り出す:dbFetchコマンド
value <- dbFetch(Testdb, "Group1")
mean(value)
[1] 502.16

#データベースのキーを表示:dbListコマンド
dbList(Testdb)
[1] "Group1" "Group2" "Group3"

#データをキーで削除:dbDeleteコマンド
dbDelete(db, "Group2")
dbList(Testdb)
[1] "Group1" "Group3"

#複数キーに対する計算方法
sapply(Testdb[c("Group1", "Group3")], mean)
Group1   Group3 
502.1600 520.8633

少しでも、あなたのウェブや実験の解析が楽になりますように!!

タイトルとURLをコピーしました