Rで解析するなら、ぜひ持っていてほしい書籍を紹介します。なお、書籍の表紙がわかるようにAmazonアソシエイトリンクを表示しています。
随時、更新しています。価格は掲載時です。また、御殿入り書籍は下部で紹介しています。
最近読んだ本:
書籍名:Rが生産性を高める〜データ分析ワークフロー効率化の実践
著 者:igjit, atusy, hanaori
価 格:3,190
発売日:2022/1
出版社:技術評論社
コメント:22.01.30
丁寧にRを生産性よく使うノウハウが紹介されている書籍です。一通り読むことでデータ解析に必要なコードの記述だけでなく、おすすめのパッケージも紹介されているので生産性が高まると思います。書籍名に負けない内容です。特筆する点としてR MarkdownやGoogleのサービスと連携する方法が記述されています。R MarkdownやGoogleのサービスと連携は古い情報も多いですが、最新の情報が掲載されているので参考になると思います。かなりお勧めの書籍です。
書籍名:RとShinyで作るWebアプリケーション
著 者:梅津 雄一, 中野 貴広
価 格:3,762
発売日:2018/11
出版社:シーアンドアール研究所
コメント
RとShinyに関する情報は検索すると多く得ることができますが、発展的にではなく基礎を学ぼうとすると情報は意外と少ないと思います。本書はShiny操作に必要な基礎から発展的は使い方が説明されています。特にUI操作でお困りな方へお勧めの書籍だと思います。
勝手にランキング
第1位
書籍名:Rとグラフで実感する生命科学のための統計入門
著 者:石井 一夫
価 格:4,212
発売日:2017/03
出版社:羊土社
コメント
ネットにあふれるデータ分析で役に立つコツや手法の意味を理解し、それをRでどのように再現するか。意外と難しいことだと考えます。本書はそんな問題解決に役立つと考えます。本書の特徴として、各項目の先頭に「生物学的な意義、研究との接点」とあり、例えば「箱ヒゲ図」では「ばらつきのある生物学的な観測地をわかりやすく表現するための統計学的グラフです。箱ヒゲ図は、標本のばらつきを容易に外観することができますので品質管理の分野でさかんに用いられます。生物学分野では、マイクロアレイや次世代シーケンサーの品質評価で頻用されます。」と端的な説明があることです。この項目を読むだけでも自分がRでやりたいことが見つかると考えます。Rで解析の最初の一歩に最適な書籍です。
第2位
書籍名:R言語徹底解説
著 者:Hadley Wickham (著)、石田 基広 (翻訳)、市川 太祐 (翻訳)、高柳 慎一 (翻訳)、福島 真太朗 (翻訳)
価 格:5,832
発売日:2016/02
出版社:共立出版
コメント
Rの中級者以上を想定しているようですが、Rの入門者にも御殿入りした「Rプログラミングマニュアル」と合わせてオススメしたい本書です。
なぜか、Rの上手な利用は「自身の目的を達成するパッケージを使いこなす・探すこと」とどこかで見ました。その通りだと思います。しかし、パッケージで処理するデータ形式を用意するにはRの基本的な概念と処理コマンドを知る必要があります。パッケージヘルプのコマンドをコピペするのも良いですが、処理内容を正しく理解することは作業時間の短縮、結果の解釈に信頼性が高まるのではないでしょうか。
本書は約500ページのボリュームです。まずは、第1部 基本編:2 データ構造、3 データ抽出の計46ページ、第2部 関数型プログラミング:11 汎関数の計34ページ、第4部 パフォーマンス:17 コードの最適化の計28ページ、合計108ページの確認がオススメです。なお、文章が少し硬く、難解に感じるかもしれません。
第3位
書籍名:Rによるやさしい統計学
著 者:山田 剛志、杉澤 武俊、村井 潤一郎
価 格:2,916
発売日:2008/01
出版社:オーム社
コメント
上司、クライアント含め難しい計算式より導かれた結果よりも、結果から得られる成果の説明を求められることが多いと思います。ウェブ解析には難しく専門的な統計学は必要ないかもしれません。でも、統計学の基本を押さえ、更にステップアップを考えている方にお勧めな書籍です。
第4位
書籍名:Rによる画像表現とGUI操作
著 者:竹澤 邦夫
価 格:4,356
発売日:2010/07
出版社:カットシステム
コメント
Rは数値や文字列の操作だけではなく、グラフィックの作成でも非常に有用なソフトです。ただ、グラフィックに関するコマンド(関数)も多岐に渡るため、まずはどのようなことがRで出来るのか、グラフィックを出力できるのかを把握する必要があると思います。本書はそんな大雑把な目的を果たす内容が紹介されています。
第5位
書籍名:ggplot2 グラフィックスのためのRプログラミング
著 者:H. ウィッカム(著)、石田 基広(翻訳)、石田 和枝(翻訳)
価 格:4,320
発売日:2012/02
出版社:丸善出版
コメント
図の作成にお勧めの「ggplot2」ライブラリの解説書です。ggplot2は非常に多くの図を作成することが出来ます。ggplot2はレイヤーの概念が取られているので融通が効く作業ができるのが特徴です。ggplot2に関してはオフィシャルサイトやインターネットで情報を集めることが出来ますが、多くは英語のため取っ付きにくい所もあります。本ブログでも「ggplot2」ライブラリを紹介していますので、ぜひご覧ください。
第6位
書籍名:Rによる統計解析
著 者:青木 繁伸
価 格:4,104
発売日:2009/04
出版社:オーム社
コメント
Rと統計学のステップアップには欠かせない良書だと思います。先にご紹介した「Rによるやさしい統計学」より、更に実践的な内容が記述されています。多変量解析やANOVAなどの解説があり目を通しておくと良いかもしれません。ただし、他の書籍と比べ少し固い感じがしますが、読む価値は非常に高いと思います。
第7位
書籍名:Rで学ぶ日本語テキストマイニング
著 者:石田 基広、小林 雄一郎
価 格:2,808
発売日:2013/10
出版社:ひつじ書房
コメント
テキストマイニングに使用するソフトウェアは高価で難しいイメージがあります。そう感じている方にオススメの入門書です。本ブログでも紹介している「RMeCab」パッケージを作成した石田先生の著書です。
第8位
書籍名:実践でわかる!Rによる統計遺伝学
著 者:アンドレア・S. フォルクス (著), Andrea S. Foulkes (原著),
西山 毅 (翻訳), 菱田 朝陽 (翻訳), 中杤 昌弘 (翻訳),
室谷 健太 (翻訳), 平川 晃弘 (翻訳)
価 格:5,184
発売日:2016/01
出版社:丸善出版
コメント
ハロタイプ解析、GWASや機械学習などをRで解析できるようにコードも記述されています。本書でRの使い方も学ぶことができますが、ブラックボックスになりがちな統計モデルと統計遺伝学の基本概念をきっちり学びたい方へオススメです。非常に読み応えがあります。限定された分野の本なのでランキングは低いですが、この分野に携わる研究者にとってはランキング1位でもおかしくない内容です。
第9位
書籍名:共分散構造分析 R編―構造方程式モデリング
著 者:豊田 秀樹 編著
価 格:3,672
発売日:2014/04
出版社:東京図書
コメント
共分散構造分析に使用するソフトウェアは高価です。でも、Rを使えば用意するのは理論だけ。理論を学びしっかりと活用したい方へオススメの入門書です。応用研究例も紹介されていますので、非常にためになります。
第10位
書籍名:統計学入門 (基礎統計学)
著 者:東京大学教養学部統計学教室 (編集)
価 格:3,024
発売日:1991/07
出版社:東京大学出版会
コメント
やはり、東大が出版しているだけあって初心者には難しいかもしれません。でも、統計学をきちんと学び実務につなげるために目は通しておいたほうが良いと思います。
御殿入り書籍
書籍名:Rプログラミングマニュアル(第2版)―Rバージョン3対応
著 者:間瀬 茂 先生
価 格:4,536
発売日:2014/05
出版社:数理工学社
コメント
Rの操作で困った時に開く決定版です。手に入るのであれば絶対に手元に置くのが良いです。2007年に出版された第1版よりお世話になっている良書です。書籍名がプログラミングマニュアルと若干敷居が高く感じられると思いますが、プログラムの作法に特化した本ではなく、あくまでRの基本的なコマンド(関数)の紹介となります。本書があればRの操作については他の書籍は必要ないくらいです。既にRを使いこなしている方も、ぜひ手元に置いていただきたいです。
22.01.22に追記_紹介からRに関する多くの書籍が出版されました。COVID-19がこれだけ長引くと、インパクトのある発想よりも基礎がかなり重要な時代だと思います。そのため、最近は本書はRを理解するうえで歴史的な良書だと思います。
2022現在でもRでも問題なく通用する内容です。やはり、分野を問わず基礎は不変で大変重要だと思います。
書籍名:みんなのR 第2版 単行本(ソフトカバー)
著 者:Jared P. Lander, 高柳 慎一, 津田 真樹, 牧山 幸史, 松村 杏子, 簑田 高志
価 格:4,576
発売日:2018/12
出版社:マイナビ出版
コメント
「わかりやすい、みんなの「教科書」として活用できる」こと、読み進めることで「データの分析は、データを図で表現することから始まる」重要性を理解できることがあげられます。本書を繰り返し読むことで、Rに関する多くの作法が身につくと思います。既にRを使いこなしている方にも、オススメしたい書籍の一つです。
書籍名:ドキュメント・プレゼンテーション生成 (シリーズ Useful R 9)
著 者:高橋 康介
価 格:3,672
発売日:2014/06
出版社:共立出版
コメント
Rでマークダウンを考えている方にオススメの本書です。マークダウンに関する情報はウェブで公開されていますが、基本を学ぶには書籍が一番と感じさせてくれる良書です。また、マークダウンはRStudioを利用するのが楽ですが、いくつかのパッケージとの連携を考えるとknitrパッケージの利用が楽な場合があります。本書のポイントは、knitrのチャンク設定やカスタマイズ方法などがきちんと解説されているところです。一通り読むことで応用が可能です。手元に置いておくと、レポート作業の役に立つこと間違いなしです。
少しでも、あなたの解析が楽になりますように!!