タイトル最強―『統計学が最強の学問である』

日本語を学ぶ外国人にとって、「は」と「が」の使い分けは意外に難しいらしい。

いずれも間違いではないが、「が」の方が「他ではなく」という一層強調したニュアンスを持っている。では、この本は「統計学が」というタイトルに相応しいものになっているか。著者の西内啓は、東大医学部、同大学院を経て、現在コンサルティング業に従事している。この経歴からは、多数の実証研究に裏打ちされた大局観のある内容が期待されるが、さてどうか。

「第1章 なぜ統計学が最強の学問なのか?」では、統計の理論体系がいかに実務で有用であるか、ITの発達でいかに強力なデータ解析ができるようになったかを示している。俗っぽい言葉だが、統計関連の職業が「これからの10年で最もセクシーな職業」という言葉で紹介されている。

続く「第2章 サンプリングが情報コストを激減させる」では、全量調査にかかる莫大なコストを、いかにして標本調査によって小さくできるかが示されている。標本数をどれだけにするかは、費用対効果の判断である。昨今のコンピュータの発達により全量調査のコストは小さくなっているものの、どこで線を引くべきかという点が示される。

「第3章 誤差と因果関係が統計学のキモである」では、二つの集団の相違を比較するためのツールとして、「カイ二乗検定」と「p値」が紹介される。これは初歩ではあるが、統計的な考え方に馴染んでいない人には有益であろう。

これは良くできた入門書になのか、と思ってさらに読み進むと、読者の期待は微妙に裏切られていく。「第4章 「ランダム化」という最強の武器」「第5章 ランダム化ができなかったらどうするか?」は、さまざまな分析の方法を示しているが、体系的に理論を示すというよりも、仮想敵に対して批判しているようだ。だが、著者の戦う相手が具体的にイメージされてこない。

だが、次の「第6章 統計家たちの仁義なき戦い」まで進むと、ようやく著者が誰と戦っているのかがはっきりと示される。「社会調査法vs疫学・生物統計学」であると。著者によれば、正確さを追求する社会調査のプロたちに対して、「妥当な判断」を求める疫学・生物統計家であると。そして、疾病によってバタバタと人が死んでいくような状況では、正確さばかりを期する社会調査的なアプローチではダメで、ともかく意味のありそうな要因(因子)を見つけようとする生物統計的なアプローチが優れていると。個人的には、とても乱暴な議論のように見えるし、悪名高い「文系/理系」の二項対立を思わせる不毛な立論だと思う。

「終章 巨人の肩に立つ方法」は、ビジネスニーズへの対応として、おそらくは編集者からの提案で付けられたものではないかと想像するが、実に内容の乏しいものだった。Googleでの検索とか、想定する読者層がおかしい。むしろ「ベイジアンの事前確率」のあたりを掘り下げた方が、読者に有益ではないかと思う。特にビジネス書として読まれることを念頭に置くと、実務の現場では不確実性の下で意思決定するのが当然なので、事前確率の考え方を紹介して、生々しい事例の一つでも示せば良かったのではないかと思う。

ということで、「統計学が」と大見得を切った割には、羊頭狗肉な感じがする本だった。では「結局何が最強だったのか」と聞かれれば「タイトル最強」と答えざるを得ない。残念ながら、後世に残る入門書にはなり得ていない。これで「25万部突破」というのは何だかなあという感じである。

統計学が最強の学問である

統計学が最強の学問である