Rで解析：データ操作に便利なコマンド「datawizard」パッケージ

データ操作に便利なコマンドが数多く収録されているパッケージの紹介です。データ抽出、データ結合、列名の変更、long型やwide型への変換、データの記述統計などのコマンドが収録されています。

パッケージバージョンは0.3.0。実行コマンドはwindows 11のR version 4.1.2で確認しています。

パッケージのインストール

下記、コマンドを実行してください。

#&#12497;&#12483;&#12465;&#12540;&#12472;&#12398;&#12452;&#12531;&#12473;&#12488;&#12540;&#12523;
install.packages("datawizard")

実行コマンド

詳細はコメント、パッケージのヘルプを確認してください。

#&#12497;&#12483;&#12465;&#12540;&#12472;&#12398;&#35501;&#12415;&#36796;&#12415;
library("datawizard")

###&#12487;&#12540;&#12479;&#20363;&#12398;&#20316;&#25104;#####
#tidyverse&#12497;&#12483;&#12465;&#12540;&#12472;&#12364;&#12394;&#12369;&#12428;&#12400;&#12452;&#12531;&#12473;&#12488;&#12540;&#12523;
if(!require("tidyverse", quietly = TRUE)){
  install.packages("tidyverse");require("tidyverse")
}
set.seed(1234)
n <- 100
TestData <- tibble(Group = sample(paste0("Group", 1:4), n,
                                  replace = TRUE),
                   ID = sample(LETTERS[1:5], n, replace = TRUE),
                   X_num_Data = sample(c(1:30), n, replace = TRUE),
                   Y_num_Data = sample(c(51:100), n, replace = TRUE))
########

#&#26465;&#20214;&#12395;&#21512;&#12358;&#12487;&#12540;&#12479;&#34892;&#30058;&#21495;&#12434;&#21462;&#24471;:data_match&#12467;&#12510;&#12531;&#12489;
#&#26465;&#20214;&#12434;&#25351;&#23450;:to&#12458;&#12503;&#12471;&#12519;&#12531;;datafreame/tibble&#24418;&#24335;&#12391;&#25351;&#23450;
GetRows <- data_match(x = TestData,
                      to = tibble(ID = c("A", "C"), X_num_Data = 10))
#&#30906;&#35469;
GetRows
[1]  4 38 66
#&#12487;&#12540;&#12479;&#25277;&#20986;
TestData[GetRows,]
# A tibble: 3 x 4
#  Group  ID    X_num_Data Y_num_Data
#  <chr>  <chr>      <int>      <int>
#1 Group2 C             10         87
#2 Group2 A             10         85
#3 Group1 C             10         58

#&#21015;&#21517;&#12398;&#20808;&#38957;&#12395;&#25991;&#23383;&#12434;&#20184;&#19982;:data_addprefix&#12467;&#12510;&#12531;&#12489;
head(data_addprefix(TestData, pattern = "KARADA_"), 3)
# A tibble: 3 x 4
#  KARADA_Group KARADA_ID KARADA_X_num_Data KARADA_Y_num_Data
#  <chr>        <chr>                 <int>             <int>
#1 Group4       D                         8                81
#2 Group4       A                         8                89
#3 Group2       E                        22                88

#&#21015;&#21517;&#12398;&#26368;&#24460;&#23614;&#12395;&#25991;&#23383;&#12434;&#20184;&#19982;:data_addsuffix&#12467;&#12510;&#12531;&#12489;
head(data_addsuffix(TestData, pattern = "_KARADA"), 3)
# A tibble: 3 x 4
#  Group_KARADA ID_KARADA X_num_Data_KARADA Y_num_Data_KARADA
#  <chr>        <chr>                 <int>             <int>
#1 Group4       D                         8                81
#2 Group4       A                         8                89
#3 Group2       E                        22                88

#&#12497;&#12479;&#12540;&#12531;&#21512;&#12358;&#21015;&#21517;&#12434;&#21462;&#24471;:data_findcols&#12467;&#12510;&#12531;&#12489;
#pattern,starts_with,ends_with&#12364;&#20351;&#29992;&#21487;&#33021;
data_findcols(TestData, pattern = "\\_num")
[1] "X_num_Data" "Y_num_Data"

#&#21015;&#12398;&#21066;&#38500;:data_remove&#12467;&#12510;&#12531;&#12489;
head(data_remove(TestData, pattern = "ID"), 3)
# A tibble: 3 x 3
#  Group  X_num_Data Y_num_Data
#  <chr>       <int>      <int>
#1 Group4          8         81
#2 Group4          8         89
#3 Group2         22         88

#&#21015;&#21517;&#12398;&#22793;&#26356;:data_rename&#12467;&#12510;&#12531;&#12489;
head(data_rename(TestData, c("Group", "ID"),
                 c("KARADA", "GOOD")), 3)
# A tibble: 3 x 4
#  KARADA GOOD  X_num_Data Y_num_Data
#  <chr>  <chr>      <int>      <int>
#1 Group4 D              8         81
#2 Group4 A              8         89
#3 Group2 E             22         88

###&#21015;&#21517;&#12398;&#19968;&#25324;&#28040;&#21435;#####
head(data_rename(TestData, NULL), 3)
# A tibble: 3 x 4
#  `1`    `2`     `3`   `4`
#  <chr>  <chr> <int> <int>
#1 Group4 D         8    81
#2 Group4 A         8    89
#3 Group2 E        22    88

#&#21015;&#12398;&#20006;&#12403;&#26367;&#12360;:data_reorder&#12467;&#12510;&#12531;&#12489;
#&#21015;&#21517;&#12434;&#38291;&#36949;&#12387;&#12390;&#12418;&#12456;&#12521;&#12540;&#12364;&#20986;&#12394;&#12356;,&#28961;&#35222;&#12373;&#12428;&#12427;
head(data_reorder(TestData, c("ID", "X_Num_Data")), 3)
# A tibble: 3 x 4
#  ID    Group  X_num_Data Y_num_Data
#  <chr> <chr>       <int>      <int>
#1 D     Group4          8         81
#2 A     Group4          8         89
#3 E     Group2         22         88

#&#12487;&#12540;&#12479;&#12501;&#12524;&#12540;&#12512;&#12398;&#32080;&#21512;:data_merge&#12467;&#12510;&#12531;&#12489;
#&#32080;&#21512;&#26041;&#24335;:join&#12458;&#12503;&#12471;&#12519;&#12531;;"full","left","right",
#"inner","anti","semi","bind"
TestData_2 <- data_rename(TestData, NULL)
data_merge(x = TestData, y = TestData_2, join = "bind")
###&#36884;&#20013;&#12434;&#25244;&#31883;#####
#     Group ID X_num_Data Y_num_Data      1 2  3  4
#99  Group2    C          5         68   <NA> <NA> NA  NA
#100 Group4    A         19         72   <NA> <NA> NA  NA
#101   <NA> <NA>         NA         NA Group4    D  8  81
#102   <NA> <NA>         NA         NA Group4    A  8  89
########

#&#12487;&#12540;&#12479;&#12434;long&#22411;&#12395;&#22793;&#25563;:data_to_long&#12467;&#12510;&#12531;&#12489;
#&#23550;&#35937;&#31684;&#22258;:cols&#12458;&#12503;&#12471;&#12519;&#12531;
#&#22793;&#25563;&#24460;&#12398;&#21015;&#21517;:colnames_to&#12458;&#12503;&#12471;&#12519;&#12531;
#&#36820;&#36996;&#24460;&#12398;&#20516;&#21015;&#21517;:values_to&#12458;&#12503;&#12471;&#12519;&#12531;
#&#36820;&#36996;&#21069;&#12398;&#34892;&#30058;&#21495;:rows_to&#12458;&#12503;&#12471;&#12519;&#12531;;NULL&#12391;&#38750;&#34920;&#31034;
head(data_to_long(TestData, cols = c(3, 4),
                  colnames_to = "Names",
                  values_to = "Values",
                  rows_to = NULL), 3)
# A tibble: 3 x 4
# Group  ID    Names      Values
# <chr>  <chr> <chr>       <int>
#1 Group4 D     X_num_Data      8
#2 Group4 D     Y_num_Data     81
#3 Group4 A     X_num_Data      8

#&#12487;&#12540;&#12479;&#12434;wide&#22411;&#12395;&#22793;&#25563;:data_to_wide&#12467;&#12510;&#12531;&#12489;
LongData <- data_to_long(TestData, cols = c(3, 4),
                         colnames_to = "Names",
                         values_to = "Values",
                         rows_to = NULL)
head(data_to_wide(LongData,
                  colnames_from = "Names",
                  values_from = "Values",
                  rows_from = NULL), 3)
# A tibble: 3 x 4
#  Group  ID    Values_X_num_Data Values_Y_num_Data
#  <chr>  <chr>             <int>             <int>
#1 Group4 D                     8                81
#2 Group4 A                     8                89
#3 Group2 E                    22                88

#&#12487;&#12540;&#12479;&#12398;&#35352;&#36848;&#32113;&#35336;:describe_distribution&#12467;&#12510;&#12531;&#12489;
describe_distribution(TestData)
#Variable   | Mean | SD | IQR | Min | Max | Skewness | Kurtosis |   n | n_Missing
#--------------------------------------------------------------------------------
#X_num_Data |   15 |  9 |  16 |   1 |  30 |     0.10 |     -1.3 | 100 |         0
#Y_num_Data |   76 | 14 |  24 |  52 | 100 |     0.16 |     -1.2 | 100 |         0

少しでも、あなたの解析が楽になりますように！！