3 分布関数を用いた区間推定
f-denshi.com  最終更新日:  

母集団の推定したい母数θに対して,a≦θ≦b となる確率が,

P(a≦θ≦b)=1−α    ・・・・[1]

で与えられるとき,区間[a,b]を信頼度(信頼係数)1−α,または100(1-α)%の信頼区間という。また,a,bはそれぞれ,下側信頼限界上側信頼限界と呼ぶ。そして,信頼区間を求めることを区間推定という。

1.母平均の区間推定

[1] まず,推定したい母数が母平均μである場合を考える。母集団N(μ,σ2)から無作為抽出された1組の標本

x1,x2,・・・,xn

が得られたとき,標準化した標本平均X~,

X~−μ
σ/
n

が標準正規分布N(0,1)に従う[#]ことから,条件[1]は,

P −zα/2 X~−μ ≦zα/2 =1−α
σ/
n

となる。ここで,−zα/2からzα/2までN(0,1)を積分した値が1−αとなる(右上図)ようにzα/2は定められる。エクセルを利用するときは=NORM.S.INV(α/2)と入力すればよい。この不等式のところをμについて解くと,

X~−zα/2 σ ≦μ≦X~+zα/2 σ
n
n

が得られる。ここで,X~の実現値x~を代入してえられる区間,

x~−zα/2 σ , x~+zα/2 σ
n
n

が信頼区間となる。

[2] 母集団の平均の信頼区間を求める方法を母分散が未知の場合も含めて下表にまとめる。母分散が未知のときは,統計推定量,

T= X~−μ0    [母分散が未知] 
s/√n

を考えると,これが自由度n-1のt分布に従う[#]ことを思い出し,すぐ上で示した母分散既知の場合と同様な手順で信頼区間を導けばよい。

- 標本 母数 標本値データ 標本分布 100(1-α)%の信頼区間
推定 情報
(a) N(μ,σ2)から
無作為抽出された
1組の標本値

 x1,x2,・・・,xn
μ 母分散
既知
σ2
x~
xi
n
N(0,1)
x~−zα/2 σ ≦μ≦x~+zα/2 σ
n
n
(b) 母分散
未知
x~
xi
 , s2
(xi−x~)2
n n−1
t(n-1)
x~−tα/2(n-1) s ≦μ≦x~+tα/2(n-1) s
n
n
注意  (xi-x~)2 = (n-1)s2=nS2  ⇔  S s
n-1
n

[3] 具体例を通して上表の使い方を確認する。

問題3

ジロー君の捕獲した9匹のサーモンから推定される80%信頼区間を母分散が既知の場合とそうでない場合とで求めてみよう。ただし,x~=50.7,σ=1.6,s2=1.62 とする。

分散が分かっている場合は(a)標準正規分布を用いる。

x~−z0.1 σ ≦μ≦x~+z0.1 σ
n
n

数値を代入して,計算を実行すれば,

50.7−1.282 1.6 ≦μ≦+1.282 1.6
9
9
50.02≦μ≦51.38

となる。

[4] 次に母分散が不明な場合は(b)自由度8のt分布を用いて,

x~−t0.1(8) s ≦μ≦x~+t0.1(8) s
n
n
50.7−1.397 1.6 ≦μ≦+1.397 1.6
9
9
49.95≦μ≦51.45

ここで,エクセル関数,”=T.INV(0.1,8)”=-1.39681531 という計算値を用いた。母分散が不明の場合は,80%信頼区間は既知の場合に比べて広くとらなければないないことが分かる。

以上,ジロー君のサーモン牧場のまとめ

-  分散既知 問題1  分散不明 問題2
帰無仮説 μ0=50.0
対立仮説 μ>μ0
標本数 9
標本平均 x~ 50.7
不偏分散 s2 1.62
母分散 1.62 不明
分布 標準正規分布 t分布
有意点α=0.1 1.282 1.397
統計量実現値 1.3125 1.3125
検定結果α=0.1 棄却 採択
80%信頼区間 問題3 50.02≦μ≦51.38 49.95≦μ≦51.45

この信頼区間を求める手順は,点推定の(両側)検定と同じような手順であるが,相補的な関係ではない。点推定では(推定した)母平均を中心におく正規分布の周辺を棄却域として着目するが,区間推定では,標本平均(実現値)を中心とする正規分布の中心領域を信頼区間として着目している。下図参照。




2.分散の区間推定

[1] 母集団から無作為抽出された1組の標本

x1,x2,・・・,xn

が得られ,母平均が不明の場合,統計量,

(n-1)s  , s2 (Xi−X~)2
σ2 n−1

が自由度n-1のカイ二乗分布に従う[#]ことから,母分散の100(1-α)%の信頼区間は,

P χ21−α/2(n)≦ (n-1)s2 ≦χ2α/2(n) =1−α
σ2

を満たす範囲として定義される。ここで,χ21−α/2(n)からχ2α/2(n)まで自由度nのカイ二乗分布を積分した値が1−αとなるようにχ2α/2(n)は定められる。エクセル関数を利用するときは=CHISQ.INV.RT(α/2,n)などと入力すればよい。この不等式をσ2について解くと,

(n-1)s2 ≦σ2 (n-1)s2       [μが未知]
χ2α/2(n-1) χ21−α/2(n-1)

となる。

μが既知の場合は,上記の扱いにおいて,s→S0,(n−1)→n,χ2α/2(n-1)→χ2α/2(n-1) とすればよい。母平均が既知の場合も合わせて以下の表にまとめておく。

- 標本 母数 標本値データ 標本分布 100(1-α)%の信頼区間
推定 情報
(c) N(μ,σ2)から
無作為抽出された
1組の標本値

 x1,x2,・・・,xn
σ 母平均
既知μ
S02
(xi−μ)2
n
自由度n
χ2(n)
nS02 ≦σ2 nS02
χ2α/2(n) χ21−α/2(n)
(d) 母平均
未知
x~
xi
 , S2
(xi−x~)2
n n
自由度n-1
χ2(n-1)
nS2 ≦σ2 nS2
χ2α/2(n-1) χ21−α/2(n-1)
(n-1)s2 ≦σ2 (n-1)s2
χ2α/2(n-1) χ21−α/2(n-1)


具体的な問題を解いてみよう。

問題4

ジロー君の捕獲した9匹のサーモンサイズの不偏分散2=1.62 から80%信頼区間を求めよ。母平均は不明とする。

(d)に基づいてて計算する。すなわち,自由度8のカイ二乗分布を利用する

P χ20.9(8)≦ 8・s2 ≦χ20.1(8) =0.8  (=1−α)
σ2

不等式の部分をσ2 について解くと,

8・s2 ≦σ2 8・s2
χ20.1(8) χ20.9(8)

ここに数値を代入すれば良いが,エクセル関数を用いれば,

χ20.1(8)=13.3616
χ20.9(8)=3.4895

であるから,2=1.62も代入して,

(9-1)×1.62 ≦σ2 (9-1)×1.62
13.3616 3.4896
1.53≦σ2≦5.87
∴  1.24≦σ≦2.42   80%信頼区間

となる。



なお,2=1.322 ならば,80%信頼区間は,1.02≦σ≦2.00 となる。





[目次]


- 標本 母数 標本値データ 標本分布 100(1-α)%の信頼区間
推定 情報
(a) N(μ,σ2)から
無作為抽出された
1組の標本値

 x1,x2,・・・,xn
μ 母分散
既知σ
2
x~
xi
n
N(0,1)
x~−zα/2 σ ≦μ≦x~+zα/2 σ
n
n
(b) 母分散
未知
x~
xi
 , s2
(xi−x~)2
n n−1
t(n-1)
x~−tα/2(n-1) s ≦μ≦x~+tα/2(n-1) s
n
n
(c) σ 母平均
既知μ
S02
(xi−μ)2
n
自由度n
χ2(n)
nS02 ≦σ2 nS02
χ2α/2(n) χ21−α/2(n)
(d) 母平均
未知
x~
xi
 , S2
(xi−x~)2
n n
自由度n-1
χ2(n-1)
nS2 ≦σ2 nS2
χ2α/2(n-1) χ21−α/2(n-1)
(n-1)s2 ≦σ2 (n-1)s2
χ2α/2(n-1) χ21−α/2(n-1)