Rで解析:2つのファイル内容の比較に便利です。「diffr」パッケージ

Rの解析に役に立つ記事
スポンサーリンク

2つのファイル内容の比較に便利なパッケージの紹介です。テキストファイルをダイアログで選択し内容を比較する実行コマンドを紹介します。なお、出力はhtmlファイルで出力されます。

日本語の文字化けを防止するためfileEncodingに”cp932″を指定していますが、環境により文字化けが改善されない場合”Shift_JIS”などを設定してみてください。

比較に用いたファイルの内容は下記画像の通りです。

faile内容

パッケージバージョンは0.1。実行コマンドはR version 4.2.2で確認しています。

スポンサーリンク

パッケージのインストール

下記、コマンドを実行してください。

#パッケージのインストール
install.packages("diffr")

実行コマンド

詳細はコメント、パッケージのヘルプを確認してください。

#パッケージの読み込み
library("diffr")
library("tcltk")

#ファイルの読み込み
#ファイル1
file1 <- read.table(as.character(tkgetOpenFile(title = "テキストファイルを選択",
                                               filetypes = '{"テキストファイル" {".txt"}}',
                                               initialfile = c("*.txt"))), fileEncoding = "cp932")
Tempfile1 <- tempfile()
writeLines(paste(file1[, 1], sep = "", collapse = "\n"), con = Tempfile1)

#ファイル2
file2 <- read.table(as.character(tkgetOpenFile(title = "テキストファイルを選択",
                                               filetypes = '{"テキストファイル" {".txt"}}',
                                               initialfile = c("*.txt"))), fileEncoding = "cp932")
Tempfile2 <- tempfile()
writeLines(paste(file2[, 1], sep = "", collapse = "\n"), con = Tempfile2)

#ファイルの比較
diffr(Tempfile1, Tempfile2, before = "f1", after = "f2")

出力例

見にくい場合はこちらのリンクを試してください。


少しでも、あなたの解析が楽になりますように!!

タイトルとURLをコピーしました