栗原伸一+丸山敦史『統計学図鑑』

しばらく前に買って「積ん読」していた本。

さて、この手の本はきちんと目次を書くだけでも便利だなと最近思っており、本書もかなり長くなったが目次をちくちく書き記しておく。序章・コラム・付録等は除く。

  1. 記述統計学
    1. いろいろな平均
    2. データのバラツキ① 分位数と分散
    3. データのバラツキ② 変動係数
    4. 変数の関連性① 相関係数
    5. 変数の関連性② 順位相関
  2. 確率分布
    1. 確率と確率分布
    2. 確率が等しい分布 一様分布
    3. コイン投げの分布 二項分布
    4. つり鐘型の分布 正規分布
    5. 尺度のない分布 標準正規分布
    6. データの位置を知る シグマ区間
    7. 分布のかたち 歪度と尖度
    8. まれにしか起こらないことの分布 ポアソン分布
    9. 複数のデータを同時に扱う X^2分布
    10. X^2値の比 F分布
    11. 正規分布の代わりに使う t分布
  3. 推測統計学
    1. 標本から母集団の特徴をとらえる 推測統計学
    2. 母数をうまくいいあてる 不偏推定
    3. 制約されないデータの数 自由度
    4. 標本統計量の分布① 平均の分布
    5. 標本統計量の分布② 比率の分布
    6. 標本統計量の分布③ 分散の分布
    7. 標本統計量の分布④ 相関係数の分布
    8. 真の値からのズレ 系統誤差と偶然誤差
    9. 標本平均に関する2つの定理 大数の法則と中心極限定理
  4. 信頼区間の推定
    1. 幅を持たせた推定① 母平均の信頼区間
    2. 幅を持たせた推定② 母比率の信頼区間
    3. 幅を持たせた推定③ 母分散の信頼区間
    4. 幅を持たせた推定④ 母相関係数の信頼区間
    5. シミュレーションで母数を推定する ブートストラップ法
  5. 仮説検定
    1. 差があるかどうかを判定する 仮説検定
    2. 2つの仮説 帰無仮説と対立仮説
    3. 仮説検定の手順
    4. 特定の値(母平均)と標本平均の検定
    5. 仮説検定における2つの間違い 第一種の過誤と第二種の過誤
    6. 特定の値(母比率)と標本比率の検定
    7. 特定の値(母分散)と標本分散の検定
    8. 本当に相関関係はあるのか? 無相関の検定
    9. 平均の差の検定① 対応のない2群の場合
    10. 平均の差の検定② 対応のある2群の場合
    11. 比率の差の検定 対応のない2群の場合
    12. 劣っていないことを検証する 非劣性試験
  6. 分散分析と多重比較
    1. 実験で効果を確かめる 一元配置分散分析
    2. 多群の等分散の検定 Bartlett検定
    3. 個体差を考慮する 対応のある一元配置分散分析
    4. 交互作用を見つけ出す 二元配置分散分析
    5. 検定を繰り返してはいけません 多重性
    6. 繰り返せる検定(多重比較法)① Bonferroni法とScheffe法
    7. 繰り返せる検定(多重比較法)② Tukey法とTukey-Kramer法
    8. 繰り返せる検定(多重比較法)③ Dunnett法
  7. ノンパラメトリック手法
    1. 分布によらない検定 ノンパラメトリック手法
    2. 質的データの検定 独立性の検定(ピアソンのX^2検定)
    3. 2×2分割表の検定 フィッシャーの正確確率検定
    4. 対応のない2群の順序データの検定 マン・ホイットニーのU検定
    5. 対応のある2群の順序データの検定 符号検定
    6. 対応のある2群の量的データのノンパラ検定 ウィルコクソンの符号付き順位検定
    7. 対応のない多群の順序データの検定 クラスカル・ウォルス検定
    8. 対応のある多群の順序データの検定 フリードマン検定
  8. 実験計画法
    1. フィッシャーの3原則① 反復
    2. フィッシャーの3原則② 無作為化 
    3. フィッシャーの3原則③ 局所管理
    4. いろいろな実験配置
    5. 実験を間引いて実施する 直交計画法
    6. 直交計画法の応用① 品質工学(パラメータ設計)
    7. 直交計画法の応用② コンジョイント分析
    8. 直交計画法の応用③ 検出力分析
  9. 回帰分析
    1. 原因と結果の関係を探る 回帰分析
    2. データに数式をあてはめる 最小2乗法
    3. 回帰線の精度を評価する 決定係数
    4. 回帰線の傾きを検定する t検定
    5. 分析の適切さを検討する 残差分析
    6. 原因が複数あるときの回帰分析 重回帰分析
    7. 説明変数間の問題 多重共線性
    8. 有効な説明変数を選ぶ 変数選択法
    9. 質の違いを説明する変数① 切片ダミー
    10. 質の違いを説明する変数② 傾きダミー
    11. 2値変数の回帰分析 プロビット分析
    12. イベント発生までの時間を分析する① 生存曲線
    13. イベント発生までの時間を分析する② 生存曲線の比較
    14. イベント発生までの時間を分析する③ Cox比例ハザード回帰
  10. 多変量解析
    1. 情報を集約する 主成分分析
    2. 潜在的な要因を発見する 因子分析
    3. 因果構造を記述する 構造方程式モデリング(SEM)
    4. 個体を分類する クラスター分析
    5. 質的データの関連性を分析する コレスポンデンス分析
  11. ベイズ統計学とビッグデータ
    1. 知識や経験を活かせる統計学 ベイズ統計学
    2. 万能の式 ベイズの定理
    3. 結果から遡って原因を探る 事後確率
    4. 新たなデータでより正確に ベイズ更新
    5. ビッグデータの分析① ビッグデータとは
    6. ビッグデータの分析② アソシエーション分析
    7. ビッグデータの分析③ トレンド予測とSNS分析

かなり長くなったが、こうやって目次をちくちく書き記しながら思ったのが、本書が「図鑑」と銘打たれている意図は何だろう、ということだ。わたしが本書を買ったのは「図鑑」という言葉から、「図版入りで取っつきやすい入門書」という意味だと思ったからなのだが、いざ中身を見ると、類書(いわゆる統計学の入門書)と比べても、かなり幅広いところまで網羅されているように思う。特に検定は「正直カイ二乗検定とt検定ぐらいしか覚えてなかったけど、そんなに手法あったんだ」というぐらい多い。その分、基本概念を突っ込んで理解するのはあまり十分ではないように思った。

なお、中身のイラストは正直「ふーん」という感じだが、この本の目次は秀逸で、目次だけ眺めたら、どんなことがどのレベルまで書かれているか大体わかるようになっている。