各データのクラスやタイプだけでなく要約やTop/Bottom 5を表示するパッケージの紹介です。ふらっと、散歩に行きましたが、この時期、北海道は最高です。
出力されるデータの要約を「作業フォルダにCSVで保存する」コマンドと合わせて紹介します。ファイルはエクセルなどで読み込んでみてください。
また、札幌大通り公園では、明日9月11日(金)から10月4日(日)まで「さっぽろオータムフェスト2015」が開催されます。北海道市町村の名物料理とワインなどが集結します。札幌を訪れる方は要チェックです。美味しい食べ物を横に置き、美しい街並みの札幌で思索するのもアリかと思います。残念ながら私は散歩の時期がちょっと早かったようです。
さっぽろオータムフェスト2015
http://www.sapporo-autumnfest.jp/
パッケージのバージョン0.1.0。実行コマンドはR version 3.2.2で確認しています。
パッケージのインストール
下記コマンドを実行してください。
#パッケージのインストール install.packages("profilr")
実行コマンドの紹介
使い方は非常に簡単です。
#パッケージの読み込み library("profilr") ###データ例の作成##### n <- 100 TestData <- data.frame(Group = sample(paste0("Group", 1:5), n, replace = TRUE), Data1 = sample(1:10, n, replace = TRUE), Data2 = runif(n)) ##### #データの要約,Top/Bottom 5を表示:profileコマンド DataPro <- profile(TestData) DataPro #データの要約 .column_name .column_class .column_type .count_elements .count_uniques .percent_uniques .count_NULLs .percent_NULLs 1 Group factor integer 100 5 0.05 0 0 2 Data1 integer integer 100 10 0.10 0 0 3 Data2 numeric double 100 100 1.00 0 0 .count_NAs .percent_NAs .count_zeroes .percent_zeros .mean_value .sd_value .q0_value .q25_value .q50_value 1 0 0 0 0 NA NA Group1 NA NA 2 0 0 0 0 5.9700000 2.9351750 1 3.0000000 6.0000000 3 0 0 0 0 0.5394982 0.2736481 0.00828328402712941 0.3297626 0.5526151 .q75_value .q100_value 1 NA Group5 2 8.0000000 10 3 0.7556116 0.992955713532865 #Top/Bottom 5 .top_5_values 1 (1) Group2 [21]\n (1) Group4 [21]\n (1) Group5 [21]\n (4) Group1 [19]\n (5) Group3 [18]\n 2 (1) 10 [17]\n (2) 5 [13]\n (2) 8 [13]\n (4) 6 [11]\n (5) 2 [9]\n 3 (1) 0.00828328402712941 [1]\n (1) 0.0252241331618279 [1]\n (1) 0.031874967738986 [1]\n (1) 0.0403659413568676 [1]\n (1) 0.0674886098131537 [1]\n .bottom_5_values 1 (5) Group3 [18]\n (4) Group1 [19]\n (1) Group5 [21]\n (1) Group4 [21]\n (1) Group2 [21]\n 2 (10) 4 [5]\n (9) 9 [7]\n (7) 7 [8]\n (7) 1 [8]\n (5) 3 [9]\n 3 (1) 0.992955713532865 [1]\n (1) 0.979553350480273 [1]\n (1) 0.971928166225553 [1]\n (1) 0.963768856832758 [1]\n (1) 0.949774149339646 [1]\n #作業フォルダにファイルを保存 write.csv(DataPro, "データプロファイル.csv")
csvファイル内容
エクセルで内容を表示。
少しでも、あなたのウェブや実験の解析が楽になりますように。