ビッグデータ幻想にとらわれる前に読んでほしい本

話題になっているので、「統計学が最強の学問である」という本を読んでみました。

西内 啓¥ 1,680


まず、この本は、「初心者向け」かつ「統計というモノの見方に興味がある人」かつ「ロジックはロジックとして受け入れる許容を持つ人」向けです。

とはいえ、「この本を本当に読んでほしい人には、手に取って読んでもらえないだろうなぁ」と感じつつ…。(笑)

以下は、私なりのレビューになります。


私と統計学との直接の接点は、サラリーマン時代、私がCRM(カスタマーリレーションシップマネジメント)の部署にいたとき、コールセンターやWebから集まったデータから、有意な施策に転換できないかを研究する部署にいたときです。
つまり、CRM経由でDBM(データベースマーケティング)に片足突っ込まされた感じです。(笑)

その当時は、DWH(データウェアハウス)やデータマイニングという言葉が主流で、他にもBI(ビジネスインテリジェンス)も流行ってましたね。
そして、今の流行は「ビッグデータ」でしょうか…。

私はどちらかというと、データを集める&Webマーケティング活動に活かす担当で、データを解析する担当は、私の同僚(たしか大学で統計学をかじっていたはず)がメイン担当でした。
私は統計学の専門家ではないので、自分でやったのは、単純な回帰分析や、SPSSを使ったコンジョイント分析くらいですね。

ただ、当時から、なかなか統計学の言葉が難しく、私を含めた他の同僚、もちろん上司にも、なかなか理解が進まず、解析担当の同僚は日々どう解析結果を伝えるかで頭を悩ませていたなぁと、懐かしく思い出していました。
統計学を知らない人からすると、まるで魔法か、違う言語をしゃべる人のように、統計結果や誤差範囲を説明されるわけですから。

と同時に、「ロジック的には答えが出ているのに、なかなか周りに理解されない。あるいは、賛同を得られない」理由も、本著を読んでみてわかりました。

そのまず1つ目が、統計学に対する日本人の理解の低さです。
これは私の妻がこの本を読んだ感想ですが、
「まるで、相棒の杉下右京さんや、ガリレオの湯川教授から、ずっと説教されているみたい」
とのこと。(笑)
つまり、なんかいろいろ言ってて正しそうだし、正論なんだろうけどよく理解できない、または感情的に何となく反発したくなる、ということのようです。(まぁ、妻は好意的に読んではいたようですが)

それは、Amazonのレビューにも表れています。
Amazon.co.jp: カスタマーレビュー: 統計学が最強の学問である
とても良いという人がいる反面、まったく人を馬鹿にしている、何が伝えたいのか分からなかった、という感想の多いこと、多いこと。

このカスタマーレビューを読みながら、先の参議院選のとき、「出口調査で、投票が終わった瞬間に当確発表だなんで、デキレースだ!」というツイートをみて、「そういえば、日本人って統計学的な勉強って、義務教育中に習ってなかったなぁ…」なんてことを思ったのを、思い出していました。
学校で習うのって、せいぜい確率(並び替え・順列)くらいですもんね。(それでも挫折した経験を持つ人は多いと思います ^^;)

2つ目は、統計学の専門家側の態度の問題。
この著者は比較的若い研究者だと思いますが、なるべく初学者にもわかりやすく(といっても挫折する人多そうですが…)伝えようと苦心されているなぁ、頑張ってるなぁと思いましたが、レビューを見ると、専門家や仕事で統計に携わっている人からの批判的な声の多いこと、多いこと。
ただでさえ、理解されにくい分野だという自己認識と、様々な分野での有効性が出しやすい分野だという自負があるのなら、一般にわかりやすく広めようという努力を頭から馬鹿にするのはどうか、という思いがしました。
(もちろん、私もこの本を読んでて「んん!?そんなこと言い切っちゃって大丈夫?」と思う言い回しは感じましたが… ^^;;)
統計家なら統計家らしく、統計学について一般の人にも理解が進むような、実行可能で最速で最善な対応策をロジックで示してほしいな、と感じました。

そして3つ目、これが最大の難関ですが、「それでも自分の道を行く」という人には効かなそうであること。
具体的にいえば、

会社役員「データではそうかもしんねぇけど、俺は俺のカンと良いと思ったことを信じるぜ」
タバコ喫煙者「確かにそうかもしんねぇけど、俺はタバコが好きなんだよ。今さら辞められるか」
PTA「子供に悪いと思うものは、ゲームでもマンガでも禁止!相関関係が見いだせないなんて、そんなデータ信じられないわ!」

となったら、たぶん、その人達は止められないだろうな、ということです。
それが「客観的に正しいか、正しくないか」ではなく、その人の持つ「信念・正義・価値観」に関わるとなれば、なかなか変えられるものではないので…。

おそらくそれに対処する直接的な対応策は、統計学ではなく、ほかの学問なんだと思うのですが(笑)、簡単に解決できるものでもないだろうな、と。


以上、3つのことを感じました。

が、先にも書きましたが、最後まで我慢して読める人には、今までと違った目線を得ることができて、今後のビジネスで役に立つ本だと思います。


さて、私の専門分野でもあるITに限っていうと、「ビッグデータ狂想曲」という項で、

・「データをビッグなまま解析することが、どれだけの価値を生むのかどうか、果たして投資するコストに見合うだけのベネフィットが得られるのかどうか、わかっていてやっているのか?」
・質問「何がわかるかもわからないのに、なんでそんなに投資したんですか?」
 回答「何かはわかりそうな気がした。一応の現状把握にはつながった。」(もやっとした回答)
・データに基づいて、正しい経営判断を行う上で、そんな多額の投資は必要ない。


という項目が、私の実務経験から感じていた「ビッグデータ」というバズワードに対する見解とほぼ一緒で、よくぞ言ってくれた、という感じです。

(もちろん、Hadoopなどの要素技術による大規模データの解析が身近になったことと、解析できる範囲が広がったことは否定するものではありませんよ。私が言いたいのは、「で、それで何に活用したいの?それって費用対効果や方法論として意味あるの?」の部分をきちんと事前に用意できてますか、という点においてです。)

おっと、あんまり書くとベンダーの皆さんに嫌われるので書きませんが(^^;)、もし、ビッグデータに興味があって多大な幻想を持っておられる経営者・IT担当者の皆さんがいたとしたら、ぜひ事前に読んでおいてほしい本です。

スポンサーリンク
ITコンサルタント日記_本文_336x280
ITコンサルタント日記_本文_336x280

フォローする

こんな記事も読まれています