インキュベ日記

書評2700冊・漫画評4000冊・DVD評400枚の「質より量」な記録サイト(稀に質も重視)

中室牧子+津川友介『原因と結果の経済学』

「原因と結果」の経済学―――データから真実を見抜く思考法

「原因と結果」の経済学―――データから真実を見抜く思考法

著者のひとりである中室牧子が書いた『「学力」の経済学』が面白かったので本書も買ってみたのだが、面白かった。
incubator.hatenablog.com

「因果推論」というキーワードが、本書のテーマである。因果推論でググってみたものの、端的な説明をしているページがほとんど見つからなかったため、本書を読んだわたしなりの理解ということで、本書の言葉だけでなくわたしの言葉も使いながら説明する。

要は、相関関係と因果関係は違うよということである。

「Aである結果、Bである」これは因果関係である。

雨が強く振っているほど、道ゆく人が傘を差す割合は増える。この「雨が降っている」という現象と「傘を差す」という行為、これは(言うまでもなく)明白な因果関係であろう。雨が原因で、傘を差すという結果がもたらされている。この原因と結果の関係が「因果関係」である。

一方、「Aであるほど、Bである」これは相関関係である。

Aが増えたという事実とBが増えたという事実に統計的な相関関係があるものでも、直接的にAが増えた結果としてBが増えたのかどうかわからないことはよくあるものだ。しかし論理的に説明されると、あるいは大袈裟に説明されると、我々は因果関係があるように誤解してしまうことがある。そしてその誤解を、議論のプロや詐欺師たちは自覚的に(あるいは無自覚に)利用しているのである。マスコミや政治家の扇情的・扇動的な物言いを思い出していただきたい。

AとBに何らかの因果関係があるように見える時、そこに原因と結果という明白な因果関係があるのか、単なる相関関係(あるいは無関係)であるかどうかを適切に判断するための方法論、それが「因果推論」である。本書によれば、ある種の統計データが因果関係なのかどうかを見分けるためのチェックポイントは3つあるそうだ。すなわち、「まったくの偶然ではないか?」「第3の変数は存在していないか?」「逆の因果関係は存在していないか?」の3つである。

1つ目のチェックポイント:まったくの偶然である可能性

これは文字通り、因果関係どころか、何の関係もない、見せかけの相関関係である。

「地球温暖化が進むと、海賊の数が減る」と誰かが主張したら、この人はなんておかしなことを言っているのだろうと思うかもしれないが、図表1-2を見ると、実際、地球温暖化が進むのに合わせて、海賊の数が減っている。
 しかし、常識的には「地球温暖化が進んだから海賊が減った」とは考えにくい。一見この2つのあいだに関係があるように見えるのは、「まったくの偶然」だからである。このように、単なる偶然に過ぎないのだが、2つの変数がよく似た動きをすることを「見せかけの相関」と呼ぶ。
 米軍の情報アナリストのタイラー・ヴィーゲンが執筆した『見せかけの相関』には、「まったくの偶然」の例が数多く紹介されている。たとえば、「ニコラス・ケイジの年間映画出演本数」と「プールの溺死者数」(図表1-3)、「ミス・アメリカの年齢」と「暖房器具による死亡者数」(図表1-4)や、「商店街における総収入」と「アメリカでのコンピュータサイエンス博士号取得者数」(図表1-5)のあいだには、それぞれ強い相関関係があることが示されている。
 言葉にするとあまりにもバカげた関係だが、2つの変数をグラフにしてみると驚くほどきれいな相関関係が見てとれる。まさに「風が吹けば桶屋が儲かる」といったところだが、こうした「まったくの偶然」によって表れる相関関係が意外にも多いということを心に留めておかねばならない。

2つ目のチェックポイント:第3の変数の可能性

本書が特に問題視している「第3の変数」とは、原因と結果の両方に影響を与えるものであり、専門用語で「交絡因子」と呼ぶそうだ。これは(特に統計に知らない方は)熟読するに値する話である。

例えば本書では「体力がある子どもは学力が高い」という通説(わたしは聞いたことがないのだが)について、「親の教育熱心さ」という第3の変数の存在をほのめかしている。教育熱心な親は、子供にスポーツを習わせ、食事にも気をつけ、勉強するように仕向けるから、体力も学力も高い傾向にあるだろう。しかしこの場合、子供の学力を上げているのは体力ではない、というものだ。

これは面白いと思ったので、わたしもひとつ事例を考えてみたい。

例えば、よく「親の年収が高いほど、子供の偏差値は高くなる傾向にある」と言われることがある。実際、東大の合格者について親の年収を調査すると確かに高いらしい。わたしとしてはこれが事実かどうかを確かめる術を持たないのだが、とりあえずここでは確かに相関関係にあるという前提に立っても良い。しかし「親の高年収」を原因として「子供の高偏差値」という結果がもたらされているかどうかは、また別問題である。

わたしが考えた第3の変数は、遺伝である。顔の違い、体つきの違い、体力の違いは結構な割合で遺伝する。最近ではADHDやLDなども遺伝の可能性が取り沙汰されている。そんな中、(差別的だという風潮から大きく取り上げられることはないものの)知的能力に遺伝の影響がゼロであると考えるのは、論理的にかえって不自然であろう。つまり親の頭の良さが親の高年収を生み出し、同時に、親の頭の良さが子供の頭の良さ(=子供の高偏差値)を生み出している。つまり実際には親の頭の良さが子供に遺伝しているだけ、という仮説である。これは交絡因子と呼べるであろう。

さて、念のため言い訳めいたことも書いておくが、これはあくまでも交絡因子を考える知的遊戯の一環であり、仮説である。なお本書を書いた中室牧子が書いた『「学力」の経済学』でも、学力は遺伝することが示唆されている。わたし個人としても、遺伝の影響がゼロだとは思えない。ただし結局は先天的なものよりも、環境や本人の努力の方が「学力」という結果に与える影響は大きいと直感的に考える人間の一人である。それにそもそも頭の良さという概念そのものが多面的に捉えられるべきである。

閑話休題。「親の年収が高いほど、子供の偏差値は高くなる傾向にある」という命題に対して、もうひとつ、第3の変数を考えてみた。それは「教育費」である。さて……これはどう考えるべきなのか。交絡因子ではないよね。でも「親の年収」と「教育費」は必ずしもイコールではない。「親の年収」と「子供の偏差値」の中間にある、そしてより直接的に子供の偏差値に影響を与える原因と捉えたら良いのかな。

うーん、面白い。第3の変数についてはもう少し掘り下げてみたいなあ。

最後のチェックポイント:逆の因果関係の可能性

これも(概念としては以前から知っていたが)改めて考えるとけっこう面白い。

すぐには事例を考えつかなかったので、本書を引用してみる。

たとえば、警察官と犯罪の関係について考えてみよう。警察官の人数の多い地域では、犯罪の発生件数も多い傾向がある。しかし、警察官が多いということが原因で、犯罪の発生件数が多いという結果を引き起こしたと考えるのにはやや無理がある(警察官→犯罪)。
 むしろ、犯罪が多い危険な地域だから、多くの警察官を配置していると考えた方が理にかなっている(犯罪→警察官)。このように原因と思っていたものが実は結果で、結果であると思っていたものが実は原因である状態のことを「逆の因果関係」と呼ぶ。

まとめ

本書の冒頭に書かれた因果推論の初歩の初歩だけを簡単にまとめてみたが、けっこう面白いなー。

巻末には「因果推論をもっと知りたい人のためのブックガイド」が解説付きで載っている。入門書は最初の2冊。

計量経済学の第一歩 -- 実証分析のススメ (有斐閣ストゥディア)

計量経済学の第一歩 -- 実証分析のススメ (有斐閣ストゥディア)

岩波データサイエンス Vol.3

岩波データサイエンス Vol.3

Causal Inference for Statistics, Social, and Biomedical Sciences: An Introduction

Causal Inference for Statistics, Social, and Biomedical Sciences: An Introduction

Experimental and Quasi-Experimental Designs for Generalized Causal Inference

Experimental and Quasi-Experimental Designs for Generalized Causal Inference

調査観察データの統計科学―因果推論・選択バイアス・データ融合 (シリーズ確率と情報の科学)

調査観察データの統計科学―因果推論・選択バイアス・データ融合 (シリーズ確率と情報の科学)

「ほとんど無害」な計量経済学―応用経済学のための実証分析ガイド

「ほとんど無害」な計量経済学―応用経済学のための実証分析ガイド

  • 作者: ヨシュア・アングリスト,ヨーン・シュテファン・ピスケ,大森義明,田中隆一,野口晴子,小原美紀
  • 出版社/メーカー: エヌティティ出版
  • 発売日: 2013/05/31
  • メディア: 単行本
  • この商品を含むブログ (1件) を見る
新しい計量経済学 データで因果関係に迫る

新しい計量経済学 データで因果関係に迫る

Mastering 'Metrics: The Path from Cause to Effect

Mastering 'Metrics: The Path from Cause to Effect

Rによるやさしい統計学

Rによるやさしい統計学

Stataによるデータ分析入門 第2版 経済分析の基礎からパネル・データ分析まで

Stataによるデータ分析入門 第2版 経済分析の基礎からパネル・データ分析まで

SPSSによる応用多変量解析

SPSSによる応用多変量解析