書肆じんたろ

読書は著者との対話、知りたいことのseek & find、ひとときの別世界。 真理には到達できないのに人々はそれを求め続ける。世界が何であるかの認識に近づくだけなのに。正しいことより善いことのほうがいいときもある。大切なのは知への愛なのか、痴への愛なのか。

カテゴリ: ビジネス数学



『データドリブン思考』の河本薫氏が2013年に書いた本。
もし、あなたが分析者ならば、最近やったデータ分析を思い出して、「分析結果にどこまで責任を取れるか?」と自問自答してみてください。そこで答えに躊躇するようならば、どこかに甘さがあります。
データ分析者が、自らに自問自答すべき第一の問いがそれ。
問いの2。その数字から何がわかったか?
問いの3。意思決定にどのように使えるのか?
問いの4。ビジネスにどれくらい役に立ったか?

その四つの問いが大事だという。

また、データ分析が成功するには、四つの壁を乗り越えないといけないとも書いている。
「データの壁」「分析の壁」「KKDの壁」「費用対効果の壁」。
データが得られるかどうかがまず第一の壁なのだが、分析の壁は分析をやってみなければわからない。
問題はKKDの壁。勘と経験と度胸の頭文字でKKDなのだが、現場の者はそれでやっているので、データ分析を用いることに消極的なのが常。どうやって使ってもらえるかがカギとなる。
費用対効果の壁とは、100万円の利益を得るために、データ分に200万円掛けていては意味がないということ。

役に立つデータ分析者のマインドを理解するにはよい本だと思う。



細かなデータが出てくるわけでもないけれど、これはデータ分析の本なのだろう。

河本氏が作った思考の流れフロー図がある。
解消したい問題
    ↓
解決したい課題
    ↓
意思決定プロセスの課題
    ↓
データ分析で何を解くか
例えばスーパーで生鮮食料品が売れ残ると廃棄ロスがでる、かといって足りないと販売の機会ロスになり、それで利益が減っているとする。
その場合、このフローに当てはめるとこうなる。
解消したい問題:商品廃棄の提言や売上げアップ
    ↓
解決したい課題:売れ残りや売れきりの抑制
    ↓
意思決定プロセスの課題:商品の仕入れ量を過不足ないように決める意思決定の精度向上
    ↓
データ分析で何を解くか:販売量の予測
ここでのポイントは、何を問題、課題だと捉えるか。意思決定とは何なのかを定めることなのだろう。

河本氏は、問題と課題をこう定義する。

「問題」とは、目標と現状の間にあるギャップのこと。
「課題」とは、目標と現状とのギャップを埋めるためにやるべきこと。
すなわち、「問題」を解消するためにやるべきこと。
しかし、実際にはこの簡単な構造の整理ができないケースによく出会う。

また、意思決定プロセスの3段階モジュールというのを考えている。
STEP①:選択肢の投入 (例)通信講座の見込み客へDMを送る場合の顧客すべて

STEP②:手掛かりの付与(例)通信講座で契約してくれる確率
      ↑
  ここでデータ分析を役立てる。
  縦軸に契約確率、横軸に模試結果の偏差値とかを取って過去のデータから回帰分析するとする。

STEP③:選択(決定) (例)契約確率30%以上

暗黙知を形式知に変えて意思決定するプロセスとはこういうものだということだ。

この本で、一番面白かったのは第三章「データドリブンの企業に変革する」だ。

ここでは経営者視点で、現実に出会う社員の意識の壁、組織の縦割りの壁、経営者自身の恣意の壁の問題などが書かれている。

ホフテッドという人が国ごとに不確実性回避指数を評価したらしい。
53の国・地域のうち、不確実性を最も避けたがるのがギリシアで、次いで、ポルトガル、グアテマラ、ベルギー、サルバドール、日本という順番になっています。
先進国のなかで、ベルギーと日本が不確実性を最も避けたがるというのはどういうことだろうか?
河本氏はこのことを、仕組みを変革するのではなく、とりあえず今を乗り切るための対症療法的な対応に終始している批判として指摘している。
経営者の恣意的な思考の壁がこういうものに左右させることだ。根本解決をせずに、対症療法に終始する。

また、課題を設定すると言っても、抽象的な課題設定になることが多いので、全体最適のためには適切なKPI設定が必要だと言う。
例として、営業部と配送部が対立しているケースを取り上げている。トラックが空いている時間帯に外部に貸すほうがよいので営業部に時間を融通して欲しいという配送部。この会社の仕事が優先なので営業部の計画通りやるべきという営業部。
ここで、営業部のKPIを仮想配送料金、配送部のKPIをトラック稼働率とすれば、全体利益は最大化するほうに進むことになる解決策を提示する。営業部は仮想配送料金を少しでも抑制するために、外部受託利益の大きい曜日や時間帯の配送を減らし、外部受託利益の小さい曜日や時間帯の配送を増やすようになる。配送部は営業部からの配送要求がない空きトラックの稼働率を最大化するようになるというシナリオだ。
具体的に問題を解決するKPI。
これを考えるのが難しいのだろう。

実際に現場で様々な体験をしている河本氏もアメリカ留学中に苦い経験をしている。
1998年から河本氏は、二年間ローレンスバークレー研究所に留学していた。そのときに石炭業界のコンサルタントが、今の電力のIT消費8%、これからIT産業の興隆で10年後にはITの電力消費が50%を占めるようになるというレポートを出し、それで石炭火力をもっと作ろうと主張していた。
研究所では気候変動の問題もあったので、このデタラメな報告を事実で批判した。河本氏は第三者評価にも耐えられるようにすべてのデータを公開していた。河本氏らのレポートはIPCC報告書にも引用された。
しかし、帰国後、河本氏のレポートは無駄になったことがわかる。
当時のブッシュ政権は石炭産業にも支持されていた。それで研究所にクレームがあり、河本氏らのレポートを無視して政府のレポートが作られたとのこと。

しかし、河野氏は、データ分析者はそのデータに責任が持てるかどうか。
それが大事だと言っている。



コンパクトだけれども密度の濃い本。



クリシンや定量分析の授業がライブコンサートのように蘇ってくる。

ここまで授業のケースを出していいんだろうかと思わず心配してしまう。けれど、ライブコンサートとしてのクラスの臨場感やそこでの発見はまた別の楽しみなのだろう。それとも授業ではもう新しいケースに差し替えられているのだろうか。



Quick and Dirty

Apple to Apple



などの説明がさらりと1、2行で書かれているのも驚きだ。

クリシンや定量分析の授業を受けた者にとっては、そのことばの奥深さが本の端々に凝縮されている感じがする。





「どこまでがよい解釈でどこからが論理の飛躍になるのか」

「理解と共感は違う」



これらは日頃痛感する。

定量分析の授業の後、仕事で散布図や近似曲線もよく使うようになった。散布図で相関データを楕円で囲んでグルーピングすることや近似直線と回帰式を出した後でR2をルートで開いて相関係数として表示したり、わかりやすくするための「ひと手間」も心掛けている。



この本の各章のケースもおもしろい。ケースのわりには登場人物の細かな感情なども書き込まれていて、ビジネス書なのにちょっと文学的でぐっとくる。



Excelの使い方がよくわからず悩むことがある。

もし機会があれば、定量分析の実践編としてグロービス編集のダイヤモンド社のテキストを定量分析とExcelの使い方がわかる本として書き換えてほしい。


このページのトップヘ