10  ポアソン分布と指数分布
f-denshi.com  最終更新日:11/09/05 (仮)

1.ポアッソン分布

[1] 「長時間平均だとτ時間に1回起こる事象(言い換えると単位時間に平均 1/τ=λ回起きる事象)を,t (>0)時間観測したときにk回発生する確率」はポアッソン分布と呼ばれる次の確率(密度)関数(1)で与えられる。

ポアッソン分布の確率密度関数

(1) f(k,t)= (t/τ)k ・e-(t/τ)  ,ただし,期待値<k> = t/τ
k!

もしくは,1/τ=λ,t=1 とおいて,

(2) P(X=k)= λk ・e  ( ≡Po(λ) )
k!

ただし,平均値<k> =λ,分散=λを満たす。 

なお,(2)は「単位時間中に事象が起きる平均回数がλ(= 1/τ)であるとき、単位時間中(t=1)にその事象がk回起きる確率」と解釈しなおす必要がある。

例えば,1年間に平均3つのコップを割ってしまうジロー君が,1年間で2つ以下しかコップを割らないで済ませる確率は,

 P(X=0)+P(X=1)+P(X=2)= 30 ・e-3 31 ・e-3 32 ・e-3≒ 0.423
0! 1! 2!

と計算される。

[2] さて,最初に,ポアソン分布が2項分布からの極限操作によって得られる分布であることを示しておく。

時間tを十分大きなnで等分に分割すれば,一つひとつの時間区間では事象が1回起こるかまったく起こらないかの2通りでしかないようにすることができる(これは仮定であってポアソン分布の成立条件)。そこで,一つの区間で事象の起こる確率をp,起こらない確率をq (=1−p) とすると,n個の区間(=時間 t の間)でk回現象が起こる確率は次の2項分布,

Pn(k)=nCk pkqn-k  [2項分布の確率密度関数]

で与えられ,その期待値<k>はすでに求めたように,

<k> = np  ( = t/τ)    ∴ p =<k>/n 

となる[#]。ポアソン分布はここで,分割数n→∞の極限,

P(k)≡ Pn(k)   

を計算したものとなっているのだが,それを示すには確率母関数[#]を利用する。すなわち,

φ(x) = P(k)xk Pn(k)xk
    = nCk pkqn-kxk nCk (xp)kqn-k
    = (xp+q)n (1+p(x−1))n  ↓ p =<k>/n  
    = 1+ <k>(x−1) n
n
    =e<k>(x-1)  ← 指数関数の極限を用いた定義より
    =e-<k>e<k>x  ↓ テーラー展開
    =e-<k> <k>k xk   
k!
[3] これを再び確率母関数の定義:φ(x)= P(k)xk と比較すれば,
P(k) = e-<k> <k>k  , ただし,<k>=t/τ
k!

である(=ポアソン分布である)ことがわかる。以上がポアソン分布の導出である。

[4] 次にポアソン分布の平均値,分散を計算する。確率母関数:φ(x)=e<k>(x-1) を微分してx=1とおき,

φ'(1)= x=1 =<k>
dx

二度,微分してx=1とおき,

φ"(1)= d2φ x=1 =<k>2    (= <k2>−<k>)
dx2

これより,分散は[#]

φ"(1)+φ'(1)−{φ'(1)}2= <k>  

いま,単位時間当たりについて起きる事象の回数として考えるならば,t=1として,

<k>=1/τ=λ  [平均値=分散]

である。

[5] なお,別解として,積率母関数[#]

M(t)=E(etX)= etk λk e   
k!
  =e (λet)k  =exp(-λ)・exp(λet) 
k!
  =exp(-λ(1−et))

から平均値,分散を求めることもできるが,これは演習とする。


.指数分布

[1] ポアソン分布は決まった時間内に事象の起きる確率(分布)であるが,一方,事象の起きる時間間隔の分布を考えることもできる。

もし,時刻 0からt の間に0回事象が起こる確率は,ポアソン分布(1)において,1/τ=λ,k=0とおいて,

f(0,t)=e-λt   生存確率 (λは単位時間中に事象が起きる平均回数)

で与えられる。また,これは「生存している確率」を表すと考えることができ,tを連続確率変数とする累積分布関数とみなすことができる。すると,起点0からt時間後まで事象が起こらず,時間tで初めて事象が起きる分布関数は,上の余事象として,

F(t)=1−e-λt (死んだ!確率)

となる。初めてというのは,「人は二度死ねない」ので強調してこう書いた。つまり,ポアソン分布の元々の意味を離れて,1度しか起こらない現象をこれから考えていくのである。さらにこの分布の確率密度関数をtで微分すれば,

(3) f(t)=λe-λt  指数分布 (の確率密度関数)

となるが,このタイプの確率密度関数を持つ分布を指数分布と呼び,e(λ) と書く。たとえば,「平均1年間でコップを3つ割ってしまうジロー君」が,t年後に初めてコップを一つ割ることを表す確率密度関数は,

f(t)=3e-3t   ←ここでは t の関数と見るべき

コップを主語にすれば,平均寿命4か月のコップたちの実際の寿命の分布を与える確率密度関数いうことである。

[2] これを用いると,t年後にジロー君のコップが割れてない確率は,これをtから+∞まで積分して,

S(t)= 3e-3tdt = e-3t    (無事である確率)

で表される。つまり,コップの寿命がt以上∞までである確率が,t年後にコップが無事である確率,すなわち,コップの生存確率ということになる。一方,0からtまで(3)を積分した,

F(t)= 3e-3tdt = 1−e-3t   (割れている確率)

は,時間0-tの間にコップが割れる確率であることを確認できる。

[3] なお,指数分布の平均,分散は,

平均  1/λ
分散  1/λ2

となる。これは簡単なので各自でチェックせよ。

[4] 最後に指数分布の重要な特徴を一つ紹介しておく。

問題:
「ジロー君支配下のコップの平均寿命は1/3年である。ジロー君に尋ねたところ,最後にコップを割ったのは今からs年前ということだ。では,ジロー君が今から次にコップを割るまでの時間Tの確率分布はどのようになるか?」 

答えは,
「条件付確率:s年前にコップが生存している事象の中で,s年前を起点にt年後にコップが割れてる確率」を計算すれば,それが累積分布関数となる。

F(t)=P(T≦s+t|T>s)=P(s<T≦s+t)/P(T>s) 
  = 時刻sとs+tとの間で割れる確率
時刻sまで無事である確率 
  = (1−e-λ(s+t))−(1−e-λs) =1−e-λt
e-λs

つまり,今からいつジロー君がコップを割るのかは,以前,ジロー君の犯した過失には依存しない。ジロー君の不偏の性格を表すパラメーターλ=3 だけで決まるのだ! これを指数分布の無記憶性という。


とりあえず,ここまで。 


[目次]