Chi-squared / t-test / Regression / 信頼区間の全範囲
マレーシア IB 校(MKIS / GIS / ISKL / Sayfol / Cempaka / Nexus 等)に通う DP 1-2 の AI HL 受講生徒と、社会科学・心理学・データサイエンス系の進路を目指す生徒・保護者のための徹底ガイド。仮説検定・推測統計章で 7 を取るための 8 章構成で、記述統計の復習から正規分布、仮説検定の枠組み(H₀ / H₁ / α / p 値 / Type I・II 誤差)、Chi-squared 検定(独立性・適合度)、t 検定(1 標本・2 標本・独立・対応)、線形回帰と相関、Paper 3 過去問傾向まで網羅。GDC(TI-Nspire / TI-84 / Casio fx-CG50)の操作手順、30 日演習プラン、よくあるミスと対策まで一気通貫で整理します。
AI HL の仮説検定・推測統計章は Paper 1 / 2 / 3 を合わせて出題比率約 30-35%。AI HL の最大の得点源かつ最大の失点源です。p 値の解釈、Type I/II 誤差の定義、Chi-squared 独立性 vs 適合度の判別、t 検定の使い分けの 4 つを徹底訓練すれば、仮説検定章は Grade 7 の最も安定した得点源になります。逆に『in context の結論を書かない』『GDC の操作ミス』『一方検定 vs 両側検定の取り違え』を放置すると Grade 6 が確定します。
本記事は AI HL 仮説検定・推測統計章の全範囲を 8 章に分けて整理し、最後に Paper 3 過去問傾向と 30 日演習プランを掲載します。GDC(TI-Nspire / TI-84 / Casio fx-CG50)の操作手順も並列で解説するため、機種別の差分も把握できます。
AI HL の Statistics 章は Topic 4: Statistics and Probability として整理され、SL 共通内容に HL 専用の仮説検定・推測統計を加えた構成。出題比率は Paper 1 / 2 / 3 を合わせて約 30-35% で、AI HL の最大トピックグループ。Calculus 章(約 20-25%)よりも比重が高いことが AI HL の特徴です。
| トピック | SL での扱い | HL での扱い | 出題比率 |
|---|---|---|---|
| Descriptive Statistics(記述統計) | 平均 / 中央値 / 最頻値 / 範囲 / IQR / SD | SL 内容 + 標準誤差 / 効果量 | AI HL 約 6-8% |
| Probability Distributions(確率分布) | Binomial / Normal / Discrete RV | SL 内容 + Poisson Distribution | AI HL 約 6-8% |
| Statistical Inference(推測統計) | 扱わない | 信頼区間 / 標準誤差 / 中心極限定理 | AI HL 約 4-6% |
| Hypothesis Testing(仮説検定) | Chi-squared 基本のみ | Chi-squared 独立性・適合度 / t 検定 / Type I・II 誤差 | AI HL 約 10-12% |
| Linear Regression(線形回帰) | 回帰直線 / Pearson r | SL 内容 + 残差分析 / 決定係数 r² | AI HL 約 6-8% |
| HL Extension(Spearman / Linear Combinations) | 扱わない | Spearman ρ / 線形結合の分布 | AI HL 約 3-5% |
重要:AI HL 受講生徒は SL 範囲(記述統計 / Binomial / Normal Distribution / 基本 Chi-squared)を完全に理解した上で、HL Extension(t 検定 / 信頼区間 / Type I・II 誤差 / Poisson / Spearman)に進む必要があります。社会科学・心理学・データサイエンス志望者にとっては大学進学後の統計基礎力に直結するため、本気で取り組む価値の高い章です。
記述統計はすべての推測統計の基礎。AI HL Paper 1 / 2 で頻出し、Paper 3 では『複数群の記述統計から仮説を立てる』という形で必ず出題されます。中央値・四分位範囲・標準偏差・Box plot の 4 つを完全に運用できることが前提です。
平均は外れ値に弱い、中央値は外れ値に強い、最頻値は離散データに有用。歪度のあるデータでは中央値が代表値として優れる。
中央 50% のデータのばらつき。外れ値の影響を受けにくい散布度の指標。1.5 × IQR ルールで外れ値判定。
平均からの典型的なばらつき。標本 SD は n-1 で割り(Bessel 補正)、母 SD は n で割る。GDC で 1 ボタン計算。
データの分布を視覚化。歪度の判定、外れ値の特定、複数群の比較に最適。AI HL Paper 1 で必ず描けるように訓練。
Normal Distribution は AI HL Paper 2 / 3 の頻出トピック。標準化 z = (X − μ) / σ により標準正規分布 N(0, 1²) に変換し、GDC または標準正規分布表で確率を計算します。仮説検定(特に t 検定)の理論的基盤としても重要。
X ~ N(μ, σ²) を Z ~ N(0, 1²) に変換。たとえば X ~ N(70, 10²) で P(X < 85) → z = 1.5 → P(Z < 1.5) ≈ 0.9332。
正規分布では μ±σ に約 68%、μ±2σ に約 95%、μ±3σ に約 99.7% のデータが含まれる。Paper 1 の概算問題で必須。
TI-Nspire:menu > Statistics > Distributions > Normal Cdf。引数は『Lower Bound, Upper Bound, μ, σ』。Paper 2 / 3 で頻出。
左側累積確率 Area から x 値を逆算。『上位 5%』なら Area = 0.95、『下位 10%』なら Area = 0.10 を入力。
仮説検定は AI HL の核心トピック。帰無仮説 H₀ vs 対立仮説 H₁ の設定、有意水準 α、p 値、Type I/II 誤差の概念を完全に理解することが、Chi-squared / t 検定の全ての応用問題の前提になります。
| H₀ が真 | H₀ が偽 | |
|---|---|---|
| H₀ 棄却 | Type I 誤差(α) | 正しい判断(power = 1 − β) |
| H₀ 棄却失敗 | 正しい判断(1 − α) | Type II 誤差(β) |
α を下げると β が上がるトレードオフ。Type II を減らす方法は『サンプルサイズ n を増やす』『α を緩める』『効果量を大きくする』の 3 つです。
H₀ は『差がない / 関連がない / 効果がない』とする慣性の仮説、H₁ は『差がある / 関連がある / 効果がある』とする新規の主張。例:『男女で身長差があるか』なら H₀: μ_男 = μ_女、H₁: μ_男 ≠ μ_女(両側検定)。『新薬が血圧を下げるか』なら H₀: μ_新 = μ_旧、H₁: μ_新 < μ_旧(一方検定)。問題文に『differ / different / 異なる』があれば両側、『lower / higher / 下げる / 上回る』があれば一方検定と判定します。
α は『Type I 誤差(誤って H₀ を棄却する確率)の上限』として研究者が事前設定する値で、通常 0.05 または 0.01 を使用。p 値は『H₀ のもとで観測データ以上に極端な結果が得られる確率』で、検定計算後に GDC が出力します。判定:p < α なら H₀ 棄却 + H₁ 採択、p ≥ α なら H₀ 棄却失敗(採択ではない)。Paper 2 / 3 で必ず『in context の結論』を文章で書くことが採点基準上必須です。
p 値による判断と並行して、棄却域(臨界値より外側の領域)からも判断可能。例:α = 0.05 の両側検定で z 統計量を使う場合、棄却域は |z| > 1.96。AI HL では χ² や t 値の棄却域も同様に Critical Value Table から読み取ります。GDC で計算した検定統計量が棄却域に入れば H₀ 棄却、入らなければ棄却失敗。p 値方式と棄却域方式は数学的に同値で、結論は必ず一致します。
Type I 誤差(α 誤差):H₀ が真なのに棄却してしまう(偽陽性)。Type II 誤差(β 誤差):H₀ が偽なのに棄却しない(偽陰性)。両者にはトレードオフがあり、α を下げると β が上がります。検出力 power = 1 − β。Type II を減らすには『サンプルサイズ n を増やす』『α を緩める』『効果量を大きくする』の 3 方法。Paper 3 で頻出の Reflection 論点です。
両側検定(two-tailed):H₁ で『≠』を使う場合。例:『有意差があるか』。一方検定(one-tailed):H₁ で『>』または『<』を使う場合。例:『新薬は旧薬より効果が高いか』。同じデータで両側 p 値は一方 p 値の 2 倍。問題文に方向性(『増加』『下げる』『上回る』)が示されているなら一方、単に『差があるか』なら両側を選択。GDC では『Alternate Hypothesis』で選択します。
Chi-squared は AI HL の Paper 1 / 2 / 3 で最頻出の検定。独立性検定と適合度検定の 2 種類があり、目的によって使い分けます。観測値 O と期待値 E の差を集計する点は共通ですが、E の計算方法が大きく異なります。
2 つのカテゴリ変数の関連性を Contingency Table で検定。例:『性別と進路選択』の関連。E は行・列の周辺度数から計算:E = (行合計 × 列合計) / 全体合計。
1 つの変数のデータが特定の理論分布に従うか検定。例:『サイコロが公平か』『データが正規分布か』。E は仮定する理論分布から計算。k = カテゴリ数、m = 推定パラメータ数。
各セルの観測値 O と期待値 E の差の 2 乗を E で割って合計。χ² が大きいほど O と E の乖離が大きく、H₀(独立 / 適合)を棄却する根拠が強い。
GDC で χ² 値と p 値を計算し、p < α なら『有意な関連性がある / 適合しない』、p ≥ α なら『関連性があるとする十分な証拠がない / 適合する』と結論。
問題:マレーシア IB 校 200 名の生徒を性別 × 進路選択(理系 / 文系)で集計したところ、男子 60 理系 + 40 文系、女子 50 理系 + 50 文系だった。性別と進路に関連性があるか α = 0.05 で検定せよ。
解答:H₀: 性別と進路は独立、H₁: 関連性がある。観測度数 O = [[60, 40], [50, 50]]。期待度数 E = [[55, 45], [55, 45]](周辺度数から計算)。χ² = (60-55)²/55 + (40-45)²/45 + (50-55)²/55 + (50-45)²/45 ≈ 2.02。df = (2-1)(2-1) = 1。p ≈ 0.155 > 0.05 のため H₀ 棄却失敗。
結論(in context):有意水準 5% で、マレーシア IB 校の性別と進路選択に関連性があるとする十分な証拠は得られなかった。
t 検定は AI HL のみのトピック。母分散 σ² が未知のときに標本平均を使って母平均 μ を検定する手法で、1 標本・2 標本(独立・対応)の 3 タイプを使い分けます。サンプルサイズが小さい場合(n < 30)でも正規性を仮定すれば適用可能。
1 つの標本の平均が仮定値 μ₀ と異なるか検定。例:『お菓子の重量が表示量 50g に一致するか』。df = n − 1。
2 つの独立な標本の平均差を検定。例:『男女の身長差』『新薬 vs プラセボ』。Welch 補正(Pooled=No)が推奨。
同一個体の前後比較。例:『ダイエット前後の体重』。差 d = X1 - X2 を計算し、d̄ について 1 標本 t と同じ手順。
2 標本独立では Welch 補正による df の近似公式(Satterthwaite)が使われ、GDC が自動計算。Paper 3 で df の解釈が問われる。
問題:MKIS 男子 25 名の DP1 数学 Mock 平均 72(SD 8)、女子 25 名の平均 75(SD 9)。性別で平均スコアに差があるか α = 0.05 で検定せよ。
解答:H₀: μ_男 = μ_女、H₁: μ_男 ≠ μ_女(両側)。GDC で 2-Sample t Test(Pooled=No)。SE = √(8²/25 + 9²/25) ≈ 2.41。t = (72-75)/2.41 ≈ -1.25。df ≈ 47.4。p ≈ 0.218 > 0.05。H₀ 棄却失敗。
結論(in context):有意水準 5% で、MKIS の DP1 数学 Mock スコアに男女差があるとする十分な証拠は得られなかった。サンプルサイズを増やすことで検出力が改善する可能性がある。
線形回帰は AI HL Paper 2 / 3 の頻出トピック。最小二乗法による回帰直線 y = mx + c、Pearson 相関係数 r、決定係数 r² を使って 2 変数の関連を分析します。社会科学・経済学・データサイエンス志望者には大学進学後の統計基礎力として最重要。
観測値 yᵢ と予測値 ŷᵢ の差(残差)の 2 乗和を最小化する m, c を求める。GDC で 1 ボタン計算(LinReg)。Paper 1 で式の意味を問われる。
線形関連の強さ。r = +1 完全正の線形、r = -1 完全負の線形、r ≈ 0 線形関連なし(非線形関連はあり得る)。|r| > 0.7 で強い相関の目安。
回帰直線で説明される y の分散の割合。r² = 0.85 なら『y のばらつきの 85% が x で説明される』と解釈。Paper 3 で頻出の Reflection 論点。
残差プロットがランダムなら線形モデル妥当、パターン(U 字 / 拡散)があれば非線形モデルや変換が必要。Paper 3 でモデル妥当性議論に使用。
AI HL 仮説検定・推測統計章を 30 日で総ざらいするプラン。DP 2 の最終試験前 1 ヶ月、または DP 1 終了時の夏休み集中演習に最適。1 日 1.5-2 時間の確保が前提。
中央値・四分位範囲・標準偏差・Box plot・ヒストグラムの計算と図示。Day 4-7 で正規分布の標準化 z + GDC の normalCdf / invNorm 完全習熟。Day 7 で MCQ 形式の自己テスト(30 問 / 60 分)で記述統計 + Normal の弱点ピックアップ。
帰無仮説 H₀ vs 対立仮説 H₁ の立て方、有意水準 α、p 値、Type I/II 誤差を集中学習。Day 11-14 で Chi-squared 独立性検定 + 適合度検定。GDC の χ² 2-way Test / χ² GOF を 1 日 5 回操作。Day 14 で章末テスト(自校 Mock 過去問流用可)。
1 標本 t 検定 → 2 標本 t 検定(独立 / 対応)の手順習得。Day 18-21 で線形回帰:最小二乗法 / Pearson 相関係数 r / 決定係数 r² の計算と解釈。残差分析 + 予測区間。Day 21 で章末テスト + Paper 2 形式の演習 3 セット。
Day 22-25:信頼区間の構築 + 標準誤差 + 中心極限定理。Day 26-27:Spearman ρ + Poisson Distribution + 線形結合の分布。Day 28-30:過去問 Paper 2 + Paper 3 の Statistics セクション 3 セット(時間計測)+ 採点 + 弱点ピックアップ + 復習。
AI HL Paper 3 は 60 分で 2 問の長文 Modelling 問題。Statistics 章は AI HL の最重要トピック群のため、ほぼ毎年いずれかの問題で仮説検定 / 回帰が出題されます。
2 つのマレーシア IB 校の数学スコアを 2 標本 t 検定で比較。Part a, b で記述統計、Part c で t 検定、Part d で 95% 信頼区間の構築、Part e で Cohen's d 効果量の議論。
Contingency Table(性別 × 進路選択)の χ² 独立性検定。Part c で α = 0.05 vs α = 0.01 の判定の違いを議論、Part d で Type I/II 誤差の定義と Type II を減らす方法を論述。
気温とアイスクリーム売上の散布図から線形回帰モデルを構築。Part c で残差分析、Part d で外挿予測の妥当性、Part e で r² の解釈と限界考察を論述。
サイコロが公平か Chi-squared 適合度検定で判定。Part b で観測度数 vs 期待度数を計算、Part c で n を 100 → 500 に増やした場合の検出力変化、Part d で『検定の限界』を Reflection。
AI HL 仮説検定・推測統計章で Paper 1 / 2 / 3 のいずれにも頻出する 10 公式。試験 1 週間前に毎日 1 周することで Paper 1(No GDC)の計算速度と公式の正確性が大幅に向上します。
| 名称 | 公式 | 用途 |
|---|---|---|
| 標本平均 | x̄ = (1/n) × Σ xᵢ | 標本の中心傾向の指標 |
| 標本分散・SD | s² = Σ(xᵢ − x̄)² / (n − 1) | 標本のばらつき。SD は √(s²) |
| Normal 標準化 | Z = (X − μ) / σ | 正規分布を標準正規分布に変換 |
| Chi-squared 統計量 | χ² = Σ (O − E)² / E | 観測値と期待値の差を集計 |
| 自由度(独立性検定) | df = (r − 1)(c − 1) | Contingency Table の独立性検定 |
| 自由度(適合度検定) | df = k − 1 − m | k = カテゴリ数、m = 推定パラメータ数 |
| 1 標本 t 統計量 | t = (x̄ − μ₀) / (s/√n) | 標本平均と仮説値の差の検定 |
| Pearson 相関係数 | r = Sxy / √(Sxx × Syy) | 線形関連の強さ(-1 ~ +1) |
| 決定係数 | r² = (Pearson r)² | 回帰直線で説明される分散の割合 |
| 信頼区間(95%) | x̄ ± t × (s/√n) | 母平均 μ の区間推定 |
南数塾は AI HL 仮説検定・推測統計章の全範囲(記述統計 / Normal / 仮説検定 / Chi-squared / t 検定 / 線形回帰 / HL Extension)に対応した個別指導を提供します。
※ 本記事は 2026 年 5 月時点の IB Diploma Programme 公式シラバス(First Exam 2021、AI HL)と公開情報を基に整理しています。Paper 3 出題傾向は過去 4 年分の May / November Session を基にした傾向分析で、必ずしも今後の出題を保証するものではありません。GDC の操作手順は機種・OS バージョンにより異なる場合があるため、自分の機種のマニュアルも併せて確認してください。
お子様の現在の Grade、弱点トピック、志望大学(社会科学・心理学・データサイエンス系)をもとに、AI HL 仮説検定・推測統計章を 30-60 日で底上げする個別カリキュラムをご提案します。無料体験授業 + 三者面談(生徒・保護者・講師)で診断します。
無料相談に申し込む