スポンサーリンク
こんにちは、北爪です。
本日は、データ解析初心者がよくハマる落とし穴「相関と因果関係は異なる」ということについて話をした!こちらの
運営者
相関と因果関係は異なるという話をします。
のがっち
よろしくお願いします。
運営者
まず1回目は相関と因果は異なるというお話です。
のがっち
よく聞きますね。
運営者
例えば小学生の身長がx軸あったとします。そしてy軸に数学のスコアがあったとします。
のがっち
ほうほう。
運営者
そしてこのデータを見ると、身長が高ければ高いほど数学の点数も高いという傾向が得られたとします。
のがっち
なるほど。じゃあ「身長を伸ばせば数学の点数も伸びる」と結論付けられますね。
運営者
っていう風になっちゃダメだと(笑)
のがっち
あれ、ダメなんですか?(笑)
運営者
このデータの対象は小学生です。小学校1年生と小学校6年生がいますので、当然1年生は身長が低いし、(同じテストを受ければ)数学のスコアも低い。1年生に比べて6年生は身長が高いし、数学のスコアも高い。なので相関はあっても因果はないんですよ。
のがっち
なるほどね。
運営者
このようなことがめちゃくちゃ世にはありふれてる。
のがっち
この場合は隠れた因数っていうのがありますね。
運営者
そうですね。
運営者
それがここでいう学年ですね。
のがっち
学年とか年齢が隠れた因数ですね。
運営者
そこのデータだけ見ていると傾向があるように見えてしまう。こういうデータって本当にありふれていて、例えば、「石油の価格が下がるとチューリップの価格が上がる」とかも、相関を取ろうと思えば取れてしまう。
のがっち
うん。
運営者
よくマーケティングとかをやっていると、「この施策を打つと売上が伸びる」という相関があるけど、「第三の因子を見逃していませんか?」「相関と因果を勘違いしていませんか?」みたいなことが良くある。
のがっち
確かに。
運営者
「そんなこと知ってる」って思うと思うんですけども、実際にデータを見ると勘違いすることが良くあるんです。
のがっち
まあね、そりゃあるだろうね。
運営者
この話をした数日後とかに友達がtwitterで、ある研究論文を引用してツイートしていたんですよ。「腕立て伏せが30回以上できる40歳の成人男性が、10年後に心臓病を患うか患わないか」みたいなのの相関データを医学論文で出していましたと。
のがっち
ありそうだね。
運営者
で、もちろん腕立て伏せを30回以上できる人の方が10年後に心臓病にもかかってないわけですよ。それでその結果を見て、「みんな腕立て伏せをやろう」と友達がツイートしていたりするんですよ
のがっち
なるほど。それはちょっと短絡的すぎるよね。
運営者
で、これも、第三の因子があるでしょと。
のがっち
そもそも腕立て伏せが30回以上できるということは。
運営者
「そういう人というのは健康に気を遣っている人であり、食べ物にも気を遣っている人である」というのが良くある。ここで「そりゃそうだろう」って思ってもこのミスよくするんですよね。ほんとに。
のがっち
うん。
運営者
『ファスト&スロー』という有名な本がありましたけれども、人間の脳ってやっぱり、すぐに結論を出してしまう脳と、ゆっくり考えて結論を出す脳、つまりファーストの脳とスローの脳があって、「スローの脳はめちゃめちゃエネルギーを使うから、人間は得てしてファーストの脳ばっかりを使うよ」という話です。
のがっち
そうですね。(多くのことを)本能的に考えてしまい、エネルギーを使うような論理的な思考はしたくないと。
運営者
そう、論理的な思考ばかりを使うと生命に関わるから。そりゃあファーストな方でパッパッて処理していく方が生物学的に正しいからそうしてしまうんですけどね。
のがっち
まあね。でもここで僕がちょっと言いたいのはですね、何でもかんでも生物学的な話、「遺伝子化学的にそうなんですよ」みたいな話は、それはそれで危険なんですよ。
運営者
そうなんですか?
のがっち
基本的には大体のことは遺伝子化学的に説明できるんでけどもね。例えば、「なぜ人間は甘いものを食べようとするのか? それは、人間は甘いものを蓄えれば飢餓時代に生き延びられるからだ。」といった例です。
運営者
うん。
のがっち
いや、「でも別にそれだけじゃないじゃん」みたいな。「ただ単に甘いものうまいじゃん」っていう。何でもかんでも進化遺伝学的な説明を付けようとする人が世の中にはいるんですよ。
運営者
あー。
のがっち
そうするとすごいそれっぽい説明になるから頭よく見える。
運営者
(笑)
のがっち
人間ってやっぱりそうなんですよ。
運営者
でも人間が(進化遺伝学的に)甘いものを取りたがるっていうのは一理あるでしょ?
のがっち
うん、一理ある。
運営者
でも(のがっちが言いたいのは)「それに第三の因子はないんですか?」と言うことですよね。単純に味が美味しいとかそういうのもあるし。
のがっち
はい、生物学的な説明が全てではないってことですね。進化遺伝学的な説明がその場で最も適切な説明なのかという問題もある。
運営者
うん。
のがっち
「それっぽく聞こえるけども本当にその考え方でいいですか?」という。
運営者
でも進化遺伝学っていうのはかなり力を付けている学問ですよね。コンピューターが発達してきて、人間が「人間性って何なんだろう?」みたいなことを振り返って考えたときに、『サピエンス全史』でも言われていますけども、本来人間って20万年のホモ・サピエンスっていう歴史からすごい影響を受けていますよね。
のがっち
はい。
運営者
そんなところから、進化生物学の勢いたるや今や、すごいものがありますよね。
のがっち
そうですね。AIとかが発達してく中で「人間って何なんだろう?」っていう、そういう思考にみんな向かっているんじゃないですか?「そもそも人間って何なんだろう?」というところから考えていくことによって「AI的な仕事は何か?」とか、「今後どうやって生きていけばいいのか?」っていうことを考えていくきっかけになればいいですね。
運営者
そうですね。なので、進化生物学的な話で説明したがる人が増えているっていうことでBさんは今警笛を鳴らしたということですね(笑)
のがっち
そうですね(笑)
運営者
なるほどね。まあ話はそれてしまいましたけど、「相関と因果は異なる」という話でした。ここで、ある記事をご紹介したいと思います。まさに、「日本の政府は相関と因果を考えられていないよね」というお話をしたいと思います。
のがっち
考えられていないんですか?
運営者
考えられえていないんです。東洋経済オンラインにある、デイビット・アトキンソンさんというイギリス人で元ゴールドマンサックスのすごいエコノミストの方のインタビュー記事をご紹介したいと思います。
のがっち
この方はいろんな本書いてるよね。
運営者
いやー、アトキンソンさんは凄いんですよ。もうホントにデータ解析っていうのをずっとやってきた人です。プロ中のプロです。
のがっち
あの聖也さんが、プロ中のプロと認めました(笑)
運営者
この人の本大好きなんですよ。日本人の勝算は素晴らしい本です。
のがっち
読んでみますわ。
運営者
話脱線しちゃうけど、1990年とかのバブルが崩壊した時に、「日本の不良債権をこれだけ持っていますよ」っていうのをゴールドマンサックスのレポートで書いて、日本中を大騒ぎさせた人なんですよ。それまで日本の銀行は「不良債権なんて持っていない」っていう説明をずっと続けていたんですけど、「いやいや、おかしいだろ」と。「これだけ不動産の価格が下がっているんだから、銀行が持っている不良債権は絶対あるはずだ」と言って、調べてデータを見ていって、レポートをバンって出したら大騒ぎになって、それで実際、その通り合ってたっていう。アナリストの鑑みたいな感じでしょ?
のがっち
実際には倒産とか相次いだわけですからね。
運営者
そうですね。それで実際レポート出した時は、「デイビット・アトキンソンはCIAの手先だ」とか、そういういろんな根も葉もない噂を流されたりしたんですって。
のがっち
日本をおとしめるために。
運営者
でもちゃんとデータを見て事実を見て、正しいレポートを出したっていう人なんですよね。
のがっち
ほうほう。
運営者
そんな人の東洋経済オンラインの記事です。今よく日本は生産性が低い国だなんて言われますよね。
のがっち
まあ言われますね。
運営者
じゃあこの生産性を改善するために日本政府がやったこと、これは働き方改革です。
のがっち
まあね、いま一大ブームですからね。
運営者
有給休暇を増やして残業を減らして、働きやすい環境を作って生産性を上げようと。
のがっち
そうですね。
運営者
「これで生産性が上がるのだ」と思っちゃうのが、これが相関と因果がごっちゃになっているというお話です。
のがっち
そもそも相関と因果というか、「そこに本当に因果関係あるの?」って感じはするけどね。
運営者
生産性の高い先進国では女性活躍が進んでいるっていう事実がありますと。一方、生産性の低い日本では、女性活躍が諸外国と比較して進んでいない。
のがっち
だから、女性が社会進出すれば生産性が上がると。
運営者
そうそう、そのためには働きやすい環境が必要だよねと。だから働き方改革を実施したんですね。
のがっち
なるほどね、横軸が女性の社会進出、縦軸が生産性。まあこれがまさに小学生の身長と数学の成績の関係と似たようなもんだと。
運営者
そうです。そのような状況なんですけれども、「いやいや、これも第三の因子があるんです」と。じゃあこの場合の第三の因子は何かって言うと、産業構造です。
のがっち
また難しい言葉を使うね。
運営者
アメリカの労働者の50%は大企業に勤めているんだそうです。
のがっち
マジっすか?
運営者
らしいです。それだけ大企業が強いってことです。
のがっち
アップルとかが強いってこと?
運営者
まあアップルとかは強いんじゃないですか?(笑)
のがっち
IBMとかマクドナルドとかスターバックスとかが強いってこと?
運営者
まあまあ、そういうことになりますね。(笑)
のがっち
ほー。
運営者
一方日本は、大企業に勤めている人の割合はどれくらいだと思いますか?
のがっち
そんなにいないよね。20%くらいじゃないですか?
運営者
おー、正しい。正解は16%くらいなんですよ。
のがっち
ほう。
運営者
まあこれだけ、産業構造に大きな開きがあるんですね。
のがっち
ほー、じゃあトヨタとかが強いって言ってもそんなもんってことか。
運営者
そうですね。労働人口全体で見ると、結局大企業に勤めているのは全体の16%しかいない。で、これが大きな要因なんですけれども、大企業であればあるほど福利厚生は整っています。それだけ資産が多くて余裕があるので、1人が育休とかを取るにしても、他に仕事を埋める人がいます。システマチックになっていますからね、大企業の仕事は。中小企業の仕事っていうのはその人が抜けたらもう仕事が回らないっていう仕事ですよ。もちろん福利厚生は整っていない場合が多いです。
のがっち
比較するとそうでしょうね。
運営者
なので、有給休暇を取っていなかったり育休を取っていなかったり、働く環境があまり整っていないから生産性が低いんじゃないんですよ。諸外国と比べて大企業の割合が低い産業構造だから、当然働きやすい環境を得ている人が少ないんですよ。
のがっち
ほうほう。じゃあ大企業で働く人を増やせばいいっていうことなんですか?
運営者
デイビット・アトキンソンさんの意見はそうです。
のがっち
ふーん。
運営者
1964年にですね、ある法律ができたんです。それが中小企業基本法という法律で、これは中小企業救済法と言われたほど、小さい企業に手厚い優遇策を示したものだそうです。
のがっち
ちょっと具体的な方法がわからないからなんとも言えないな。
運営者
この記事によると、従業員数が製造業では300人未満、小売業では50人未満で中小企業と定義して、優遇措置。税なのかな? まあわからないですけど優遇措置があって、それを目当てに従業員50人未満の企業が爆発的に増えてしまった。
のがっち
50人未満だったら優遇措置を受けられる。だから49人ばっかりだよきっと。
運営者
そうそう。なのでこの優遇に甘えられる中傷企業の壁がどんどんできて、ほかの先進国と比べて小さな企業で働く労働者の比率が多い。
のがっち
なるほど。
運営者
という非効率な産業構造を生み出した。
のがっち
なるほど、49人企業ばっかりなわけだ。
運営者
そうなんです。というわけでですね、政府の施策で「相関と因果を間違えて施策を打っているよ」というお話でした。
のがっち
ありがとうございました。
運営者
ありがとうございました。
ABOUT ME
予測モデルを作るとはどういうことか!
全体像を解説した動画を公開しています。データを確認し、前処理し、予測モデルを作るまでの一連の動作が気になる方はこちらからどうぞ!
また株式会社piponでは医薬業界の企業様向けにDXの成功事例を集めた医薬DX事例集をe-bookとしてご提供しております。
ご興味ある方がいらっしゃいましたらこちらのフォームよりご連絡頂けると嬉しいです。