Rでコマンド:意外に役に立つ文字列操作に関するコマンド

Rの解析に役に立つ記事
スポンサーリンク

意外に役に立つ文字列操作に関するコマンドの紹介です。テキストマイニングの役に立てばと思います。重複数を文字の最後に付与する「make.unique」コマンドなどは役に立つと思います。

実行コマンドはR version 4.2.2で確認しています。

スポンサーリンク

実行コマンド

詳細はコメント、コマンドのヘルプを確認してください。

#文字の重複数を表示:make.uniqueコマンド
x <- c("あ", "あ", "い", "う", "う", "う", "え", "お", "お", "う")
make.unique(x)
[1] "あ"   "あ.1" "い"   "う"   "う.1" "う.2" "え"   "お"   "お.1" "う.3"

#文字の重複を除く:uniqueコマンド
#数字も適応可能です
unique(x)
[1] "あ" "い" "う" "え" "お"

#文字列を指定幅に体裁を整える:strtrimコマンド
x <- c("aaaaa", "bbbbb", "ccc")
strtrim(x, c(2, 3, 1))
[1] "aa"  "bbb" "c" 

#oldで設定した文字列をnewで指定した文字列で置換:chartrコマンド
x <- "あいうえお"
chartr(old = "いえ", new = "bc", x)
[1] "あbうcお"

少しでも、あなたの解析が楽になりますように!!

タイトルとURLをコピーしました