#JapanR で話題だった「データサイエンティスト養成読本R活用編(通称"Julia入門本")」を読みました #JuliaAC
この記事はJulia Advent Calendarの12日目の記事です。
昨日12/12に発売された、データサイエンティスト養成読本 R活用編をいただきましたので、読ませていただきました。
シリーズ第一冊目の「データサイエンティスト養成読本」と比較するとよりRに特化した内容になっています。
- 里さん、酒巻さんによる心構え的な話や基礎となる統計知識でざっと外観したあとで、
- 市川さんのRでのモダンな集計方法
- 福島さんの時系列分析の基礎
- 安倍さんによる.NET FrameworkからRを使う話
- 和田さんによるH2Oやparallelの話
- @soramiさん、西薗さんによるJuliaの話
が展開されています。
表紙を見ていただくとわかりますが、「Julia入門」の文字がでかでかと掲げられています。凄い。 日本の商業誌ではJuliaについて書かれた本は、おそらくはじめてだろうとのことです1 。
話としては、Juliaの出来た歴史的な経緯と基礎的な使い方が記されています。Juliaってなんだろう?という人には外観をしる上で取っ付き易い文章になっていると思います。特に本文中にでてくるJohn Myles White2 やStefan Karpinskiなど、コアなコミッターの情報がちりばめられているのはJuliaというググらビリティの低い名前から情報を収集する重要な緒となると思います。
ここで興味をもった人は、Julia Advent Calendarの記事を色々読まれると良いのではないでしょうか。
Julia以外で特に興味深かったのは、市川さんによるdplyrやtidyr, pipeRの話です。特に、dplyrのSQLっぽい集計処理やpipeRでのメソッドチェーンっぽい処理を見ていると、「それ、Ruby(Active Record)でできるんやで」と一周回ってきた感覚になりました3 。
本書は割りと濃い話が多いので、Rの入門書を読んだけど、もっとモダンな書き方をしたい!応用したい!という人にオススメです。また、Rの人たちが使い始めているJuliaってどんな言語だろう?と興味が湧いた方にもオススメです。
薄い本は既に出ています http://yomichi.hateblo.jp/entry/2014/01/05/160714 ↩︎
入門機械学習やバンディットアルゴリズム入門の著者としても知られる ↩︎
もちろん、Rで処理できるけど速度が速いことが売りですが ↩︎