Rで解析:factorの操作!因子について

Rの解析に役に立つ記事
スポンサーリンク

Rでデータを操作しているとclassがfactorのベクトルやデータフレームのデータができることがあります。操作に慣れていないと因子と呼ばれるfactorの扱いが厄介になることがあります。そこで、factorに関するコマンドを紹介します。因子は使いこなすとグラフを作成する際に軸の順番が入れ替わらない等、非常に便利です。Rでデータを操作していてエラーが起きた場合はclass(データ)で確認することが問題解決の近道です。

スポンサーリンク

コマンド

詳細はコメントを確認いただくか、ヘルプを参照ください。

#データ例の作成
Data <- LETTERS[c(5, 9, 12, 1, 4, 9, 22, 4, 5)]

#データの因子化。levelには基準となる配列を指定
LT <- factor(Data , levels = LETTERS)

#確認
LT
[1] E I L A D I V D E
Levels: A B C D E F G H I J K L M N O P Q R S T U V W X Y 

#データ例の文字列が基準となる配列で何番目か確認
as.integer(LT)
[1]  5  9 12  1  4  9 22  4  5

#データ例で基準となる配列を簡略化表示
factor(LT)
[1] E I L A D I V D E
Levels: A D E I L V

#使用されていないlevelの削除
LT[, drop = TRUE]
[1] E I L A D I V D E
Levels: A D E I L V

#levelの変更
levels(LT) <- letters

#確認
LT
[1] e i l a d i v d e
Levels: a b c d e f g h i j k l m n o p q r s t u v w x y z

少しでも、あなたの解析が楽になりますように!!

タイトルとURLをコピーしました