「新米探偵、データ分析に挑む」
石田基広先生から、期待の新刊「新米探偵、データ分析に挑む」 をご恵贈いただきましたので、ご紹介します。
今回は探偵モノなので、読み始めてまずNHK教育 を思い出しました。登場人物が皆特徴があってイメージが浮かんできますね。映像化を期待してしまうなぁ。後述する通り内容はかなり充実しているんですが、難しくはなく、ストーリーにひかれてどんどん読み進められます。
操作面ではRstudio の四則演算から始まり、はじめてデータ処理をする読者にもやさしいと思います。その一方で、FILE 02からtidy dataの考え方も説明していて、Rstudioの操作だけではなく、実践的なデータ操作の作法まで学べます。Rのパッケージもggplot2によるグラフィックス、dplyr を使ったパイプ処理を全面的に取り入れているので、いわゆるコンピュータープログラミングに接したことがない人でも、直感的にデータ処理を記述できる方法で学んでいくことができると思います。
理論面でも、教科書的な統計学を非常に丁寧に、Rを使ったシミュレーションを実際にやってみることを通じて説明しているので、検定の概念でつまずく、ということがなくなるでしょう。母集団と標本との関係も直感的に説明されているのはさすがです。
そして、ライトな内容かと思うと後半ではテキストマイニング(他の本では読めない、特に充実した内容です)、時系列分析、ロジスティック回帰までできるようになるので、極めて実践的です。この本を読めば、例えば医学研究のデータマネージャーとしては即戦力になれるんじゃないかなぁと思います。