琥珀色の戯言

3000冊以上の【書評】と500作以上の【映画感想】を、ちゃんと読んで、観て書いてきたブログです。話題になったあの本や映画の感想が、たぶんあります。新書、ノンフィクション、インターネット関連本が多め。

【読書感想】統計学が最強の学問である ☆☆☆☆☆


統計学が最強の学問である

統計学が最強の学問である

統計学が最強の学問である

統計学が最強の学問である

あえて断言しよう。あらゆる学問のなかで統計学が最強の学問であると。
どんな権威やロジックも吹き飛ばして正解を導き出す統計学の影響は、現代社会で強まる一方である。
ビッグデータ」などの言葉が流行ることもそうした状況の現れだが、はたしてどれだけの人が、その本当の魅力とパワフルさを知っているだろうか。


本書では最新の事例と研究結果をもとに、基礎知識を押さえたうえで統計学の主要6分野
◎社会調査法
◎疫学・生物統計学
◎心理統計学
データマイニング
テキストマイニング
計量経済学
を横断的に解説するという、今までにない切り口で統計学の世界を案内する。


ビッグデータ」なんて言葉をけっこう耳にするようになりました。
統計学」に関しては、医学論文を書くときに必要で、僕も多少かじったことはあるのですが(本当に「かじった程度」です)、正直、めんどくさいというか、避けて通れるものなら通りたい、という感じではあります。
 でも、いまの時代、「統計学」の基礎くらいは知っておかないと、いろんな「データ」に騙されてしまうのもまた事実なのです。

 
 この本は、統計学の専門家である著者が、「素人向け」に統計学について書いており、具体的な例や興味深い話も多く、非常に読みやすいんですよね。

 たとえば、フィッシャーさんという天才が、ほとんど独力で(!)つくりあげた「ランダム化比較実験」に関しては、こんなふうに紹介されています。

 たとえばフィッシャーが1935年に著した『実験計画法』という世界ではじめてランダム化実験を体系立てた名著には、ミルクティにうるさい婦人の話が登場する。
 1920年代末のイギリスにて、陽射しの強いある夏の午後、何人からの英国紳士と婦人たちが屋外のテーブルで紅茶を楽しんでいたときのことだった。その場にいたある婦人はミルクティについて「紅茶を先に入れたミルクティ」か「ミルクを先に入れたミルクティ」か、味が全然違うからすぐにわかると言ったらしい。この一見どうでもよさそうな婦人の主張ですら、科学的に実証できるというのがランダム化比較実験の力なのである。
 その場にいた紳士たちのほとんどは、婦人の主張を笑い飛ばした。彼らが学んだ科学的知識に基づけば、紅茶とミルクが一度混ざってしまえば何ら化学的性質の違いなどない。
 だが、その場にいた1人の小柄で、分厚い眼鏡をかけ髭を生やした男だけが、婦人の説明を面白がって「その命題をテストしてみようじゃないか」と提案したそうだ。この男こそが、現代統計学の父、ロナルド・A・フィッシャーである。

 彼が実際にどのような方法を使って、「テスト」したのか、ぜひこの本を読んでみていただきたいのです。
 いまでは常識とされている統計学的な手法が使われるようになってから、まだ100年も経っておらず、それがこのフィッシャーさんというひとりの人間によって、ほとんど編み出されたというのは、驚くべきことです。
 ちなみに、この「ミルクティの実験」の結果も非常に興味深いものでした。
 

 これまで、統計学に関しては、理系の研究者が実務で使うような「数式がたくさん書かれている入門書」はあったのですが、こんなふうに「統計学という概念」「統計学で何がわかるのか?」について書かれた本をはじめて読みました。
 これを一冊読んでも、論文で使えるような「実際の統計計算」ができるようにはなりません。
 でも、学術論文を書かなければならないような人を除けば、「有意差があるかどうかの検定のしかた」を理解していなくても、「4人のうち1人にあてはまること」と「1000人のうち250人にあてはまること」は「同じ」なのか?を知っておけば、十分ではあるんですよね。
 しかしながら、そういう「統計の素人向けの啓蒙書」みたいなものは、これまであまり出ていなかったのです。
 知らない人は、マスメディアに出ているデータを鵜呑みにしていて、知っていなければならない人は、数式満載の「入門書」で学んでいた。そういう「棲み分け」で、事足りていたのです。


 ところが、これだけコンピュータが普及したことによって、さまざまなデータが世間に氾濫するようになりました。
 なかには、世間の人々をミスリードするような「実験データ」をあえて「証拠」として提示する人もいるのです。
 自分で論文を書くことがなくても、いいかげんな「データ」に騙されないようにする、というのは、「オレオレ詐欺に騙されないようにする」のと同じくらい大事なことなのに、「本当に意味がある、信用していいデータなのか?」を教えてくれる人は、本当に少ない。
 

 この本のなかで、著者は、「社会のなかで、統計をどう役立てればいいのか?」についても平易に述べています。

 データ解析において重要なのは、「果たしてその解析はかけたコスト以上の利益を自社にもたらすような判断につながるだろうか?」という観点だ。
 顧客の性別や年代、居住地域の構成を見ると何%ずつでした、あるいはアンケートの回答結果を見ると「とてもそう思う」と答えた人が何%いました、といったデータの集計を「解析結果」として示されることはしばしばある。コンサルタントだとかマーケターだとか名乗る人々の中にも、適当なアンケートをとってキレイな集計グラフを作ることのみを生業にしているんじゃないかという人すらいる。
 だが、果たしてこれらの結果に「何となく現状を把握した気になる」という以上の意味はあるだろうか? その結果を報告したあなたの上司やクライアントは、「ふ〜ん」と言う以上に何かリアクションのしようがあるだろうか?


 「ふ〜ん」以上のリアクションをするとは、すなわち、「ビジネスにおける具体的な行動に繋がる」ということである。そしてそうした具体的な行動を引き出すためには、少なくとも以下の「3つの問い」に対して答えられなければならない。


【問1】何かの要因が変化すれば利益は向上するのか?
【問2】そうした変化を起こすような行動は実際に可能なのか?
【問3】変化を起こす行動が可能だとしてそのコストは利益を上回るのか?


 この3つの問いに答えられた時点ではじめて「行動を起こすことで利益を向上される」という見通しが立つのであり、そうでなければわざわざ統計解析に従って新たなアクションを取ろうとする意味はない。

 これを考えると、世の中には、けっこう「無駄、無意味な統計」があふれている、という気がしますね。
 

 「ある程度統計学の知識がある人」にとっては、「すでに知っている、常識的な内容」ではないかと思います。
 でも、これまでは「統計に興味がない人、自分の人生に関係ないと思っていた人」と「仕事で統計を扱わなければならなかった人」の間にあった大きな溝を埋めてくれる本って、あんまりなかったんですよね。
 世の中には、こんなに「統計」が溢れているのに。

 では私たちは、どうすれば最善を尽くすことができるのだろうか?
 そのヒントになるのは、アメリカの医療においてこうした「最善」が大きな成功を収めた事例である、100K Livesキャンペーンの中に存在しているかもしれない。10万人の命と名付けられたこのキャンペーンは、2004年から2006年にかけてアメリカ全体の入院死亡率を5%低下させ、年間12万人も死亡を減らした。
 そのために行ったことはごくシンプルなものである。心停止/呼吸停止のリスクのある患者に緊急対応チームの派遣、急性心筋梗塞に対するエビデンスに基づいた治療の徹底、投薬内容確認の徹底、手洗いの徹底による院内感染の防止といった「やるべきだとわかりきった目標」を全米の病院で徹底するようにしただけだ。それで実際に10万人以上の命が救われたのである。
 100K Livesキャンペーンの10万人という数字の背後には『To Err is Human』というInstitute of Medicine(米国医学研究所)が出版した報告書が存在している。この冒頭でアメリカ人は毎年約10万人が医療ミスで亡くなっている、というショッキングな推計が公表されており、「だったらわかりきったミスをなくせばいい」と100K Livesは立ちあがったのだ。
 最善が何か、自分1人の頭で考えていても「がむしゃらに頑張る」といった程度のアイディアしか生まれないかもしれない。だが世の中にはいろいろな分野で「最善が何か」を明らかにすることだけに命をかけている人たちがいる。無責任な評論家が偽物の「最善」を世に広める一方で、彼らが辿りついた真実の多くは、文献データベースの中に大量に蓄積はされていても、あまり我々の目には触れることはない。
 おそらく我々がすべきことの多くが、すでに文献やデータの上では明らかなのである。だがそれを現実のものとして実行するまでのギャップが我々を「最善」から遠ざけているのではないかと思う。
 やるべきことが明らかななのであれば、私たちがすべきことはいかに速くそうした真実を探し当て、理解し、自らが実践するとともに、その知恵を周りに普及していくことだろう。統計学の素晴らしいところはこうした「最善」への道を最も速く確実に示してくれるところではないかと思う。

 「統計」というのは、「もうすでに多くの人が知っているはずなのに、つい腰が重くなってしまう、『最善』への取り組み」を後押ししてくれるものなのかもしれません。
 世界が驚くような、意外な統計結果なんて、そうそう出るものではないから。
 自分は「論理的」だと主張したい人は、この本に書いてあることくらいは、理解しておくべきではないかと思うのです。
(ただし、この本も後半はけっこう難しいな、と思うところもありました)
 「論理的」なつもりでも、それを実践するとなると、そこにはまた壁があるものなんですよね。
 
 
 世の中には、「ネットで副作用が出た人の経験談を読んだ」とか「隣のおばさんが効いたと言っていた」というような理由で、もっときちんとしたデータがネットで検索しただけで得られるようなものを「良い」あるいは「悪い」と判断してしまう人って、けっこう多いんですよ。

 
 現代社会を生きるうえで、必要最低限な「データの読み方」を知るうえで、現時点では最良の入門書のひとつだと思います。
 「自分は文系だから、関係ないんじゃない?」って言う人にこそ、ぜひ、読んでおいていただきたい本です。
 2〜3時間で読めるし「統計学をつくってきた人たちの物語」としても、かなり面白いですよ。

 

アクセスカウンター