3 期待値,分散,標準偏差  
f-denshi.com  最終更新日:11/06/10 

1.期待値

[1]

確率変数Xの期待値 E(X)  (または <X> と書いたり,μという記号もよく使う) は,確率関数P(X=x),または確率密度関数f(x))を用いて,

E(X)=
xP(X=x)  [離散]
xf(x)dx  [連続]

で定義する。確率変数のとり得る個数が有限ならば,期待値は必ず存在するが,加算無限であったり,連続型である場合は必ずしも存在するとは限らない[#]。立方体のサイコロの例で期待値は,

 E(X)=1× 1 +2× 1 +3 1 +4 1 +5 1 +6 1 7
6 6 6 6 6 6 2

と計算される。これはサイコロの出目の全種類の(加算)平均

X~= 1+2+3+4+5+6 7
6 2

と数値的に同じ結果を与えるが,このような計算はすべての出目の出現確率が同一の6分の1であるときだけに成立することに注意が必要である。期待値の定義式は出目に偏りのあるサイコロであってもそのまま通用する。

E(X) は確率変数(の記号)をはっきり示したいときは EX(X)とも書く。

確率変数Xの関数ψ(X)の期待値は次のように定義する。

E(ψ(X))= ψ(x)P(X=x)      離散型
E(ψ(X))= ψ(x)f(x)dx      連続型

2次元確率変数(X,Y)の関数ψ(X,Y)の期待値は自然な拡張として,

E(ψ(X,Y))= ψ(x,y)P(X=x,Y=y)     離散型
E(ψ(X,Y))= ψ(x,y)f(x,y)dxdy   連続型

となる。例えば,正四面体,立方体のサイコロの出目を確率変数X,Yとするとき,ψ(X,Y)=X2+Y,であるならば,

E(ψ(X,Y))= (x2+y)P(X=x,Y=y)
=  (12+1)(1/24)+・・・+(12+6)(1/24)
  +(22+1)(1/24)+・・・+(22+6)(1/24)
  +(32+1)(1/24)+・・・+(32+6)(1/24)
  +(42+1)(1/24)+・・・+(42+6)(1/24)
= 11

という具合に計算される。

[2] 確率変数の期待値が存在するとき,次の関係が成り立つ。

確率変数X,Y,および,定数a,b,cに対して,

公式1

(1) E(c)=c 
(2) E(X+Y)=E(X)+E(Y)  
(3) E(aX+bY)=aE(X)+bE(Y)  ,a,b は定数

は常に成り立つ。

これらの基本的な性質は繰り返し用いられる。

ほぼ自明なので証明を省略するが,正四面体と立方体のサイコロの例で確かめてみると,

 E(Y)  =1×1/6+2×1/6+ ・・・ +5×1/6+6×1/6      =7/2
 E(X)  =1×1/4+2×1/4+3×1/4+4×1/4         =5/2
 E(X+Y)=2×1/24+3×2/24+ ・・・ +9×2/24+10×1/24 =6   ←[#]をみよ

となり,確かに,E(X+Y)=E(X)+E(Y)が成り立っている。

特に,XとYが独立なときは,

E(XY)=E(X)E(Y)   ←独立なときだけ成り立つ
  

が成り立つことも確かめることができる。証明は独立の定義,P(X=x,Y=y)=P(X=x)P(Y=y) [離散型のとき] を用いれば,

 E(XY)= xyP(X=x,Y=y)= xP(X=x) yP(Y=y)=E(X)E(Y)

と計算できることで示される。連続確率変数のときも同様に変数ごとに積分を分離できることはすぐにわかるであろう。


2.分散と標準偏差

[1] 期待値のほかにも次のような計算には名前が付いている。

定義

分散      V(X)=E[(X−E(X))2]
標準偏差   SD(X)= V(X)
共分散     C(X,Y)=E[(X−E(X))(Y−E(Y)]
相関係数   Corr(X,Y)= C(X,Y)
SD(X)SD(Y)

分散はσ2,標準偏差はσという記号によってしばしば表されることはすでにご存知であろう。分散,標準偏差は集団(データ)のバラツキ具合を評価するために用いられる。

これらの定義からいくつかの簡単な公式が次のように確認できる。

まず,分散については確率変数を定数倍すると,

V(aX)=E[(aX−E(aX))2]=E[(aX−aE(X))2]
    =E[a2(X−E(X))2]=a2E[(X−E(X))2]
    =a2V(X)

が成り立つ。また,2つの確率変数 (独立でなくてもよい) の和について,

V(X+Y)=E[{(X+Y)−E(X+Y)}2]
      =E[{(X−E(X))+(Y−E(Y))}2]
      =E[(X−E(X))2+(Y−E(Y))2+2(X−E(X))(Y−E(Y))]
      =V(X)+V(Y)+2C(X,Y)
      =V(X)+V(Y)+2Corr(X,Y)SD(X)SD(Y)

と表すことができる。また,共分散については,

C(X,Y)=E[(X−E(X))(Y−E(Y))]
    =E[XY−XE(Y)−YE(X)+E(X)E(Y)]
    =E(XY)−E(X)E(Y)−E(Y)E(X)+E[E(X)E(Y)]
    =E(XY)−E(X)E(Y)                [*]

と計算を進めることができる。

途中,E(X)E(Y)が数であることから公式1の(1)を用いた。以上のまとめ,

公式2

(1) V(aX)=a2V(X)
(2) V(X+Y)=V(X)+V(Y)+2C(X,Y)
(3) C(X,Y)=E(XY)−E(X)E(Y)  

[2] なお,X の分散と平均値に関して成り立つ次の公式は大変重要。

V(X)=E((X−E(X))2)=C(X,X)
   =E(X2)−E(X)2

これはE(X)=μ,V(X)=σ2という記号を用いて,   

E(X2)=V(X)+E(X)2
    =σ2+μ2  

のように書き直しておくと便利である。

少し戻って,[*]において,XとYが独立であるという追加条件を課すと,先程示したように,E(XY)=E(X)E(Y) なので,公式(3)より,

C(X,Y)=0

とすることができ,

XとYが独立なとき,

   C(X,Y)=0
   V(X±Y)=V(X)+V(Y) 

が成り立つ。この結果より,X,Yが独立に同じ平均値μと分散σ2 を持つ分布に従うならば,

E(X+Y)=E(X)+E(Y)=2μ
V(X+Y)=V(X)+V(Y)=2σ2

これは一般化できて,

n個の確率変数,X1,・・・,Xn が互いに独立で同じμ,σ2をもつとき,

E(X1+・・・+Xn)=nμ
V(X1+・・・+Xn)=nσ2

が成り立つ。

[3] 2次元確率変数の平均値については,

X X1 に対して,  
X2
E(X )= E(X1) と定義する。
E(X2)

2つの変数に対する分散,共分散,

V(X1)  =C(X1,X1)=E((X1−E(X1))2)       =σ11
V(X2)  =C(X2,X2)=E((X2−E(X2))2)       =σ22
C(X1,X2)=C(X2,X1)=E((X1−E(X1))(X2−E(X2))=σ12=σ21 =C(X2,X1)

に対して次の共分散行列を定義する。

σ σ11 σ12
σ21 σ22

これは,

σ=E((X−E(X)) t(X−E(X))

とも書くことができる(各自確認)。この表記で,X を多次元ベクトルとみなし,多次元化することができるが,ここら辺の技巧表現は後ほど具体例を通して少しずつ慣れていくこととする。 とりあえず,ここでは眺めておくだけでよい。


3,条件付期待値と分散

[1] 条件付期待値と条件付分散は条件付確率[#]を用いて次のように定義する。

条件付平均

E(X|Y=y)≡EX|Y(X|Y=y)= xP(X=x|Y=y)    離散型
E(X|Y=y)≡EX|Y(X|Y=y)= xf1(x|y)dx      連続型

条件付分散

V(X|Y=y)= (x−E(X|Y=y))2P(X=x|Y=y)    離散
V(X|Y=y)= (x−E(X|Y=y))2f1(x|y)dx      連続型

ただし,同時確率密度関数f(x,y)[#]に対して,

f1(x|y)= f(x,y)
f2(y)
f1(x)= f(x,y)dy
f2(y)= f(x,y)dx

である。

[2] 確率変数の積の期待値に対して次の公式が成り立つ。

公式3

(1) E(XY)=E[E(XY|Y)]=E[YE(X|Y)]または,E[XE(Y|X)]

(2) E[ψ(X,Y)]=E[E(ψ(X,Y)|Y)]  =E(E(ψ(X,Y)|Y=y))

証明 (1)について

 離散確率変数のとき,P(X=x,Y=y)=P(Y=y)P(X=x|Y=y)に注意して,

E(XY)= xyP(X=x,Y=y)     
    = { xyP(X=x|Y=y)}P(Y=y) ← =EY[EX|Y(XY|Y)]
    = y xP(X=x|Y=y)P(Y=y)
    = y E(X|Y=y)P(Y=y)
    =E(YE(X|Y))           ← =EY[YEX|Y(X|Y)]

連続確率変数のとき

E(XY)= xyf(x,y)dxdy
    = {xyf1(x|y)f2(y)dxdy
    = { {xyf1(x|y)dx}f2(y)dy ← =EY[EX|Y(XY|Y)]
    = y{ {xf1(x|y)dx}f2(y)dy
     =E(YE(X|Y))          ← =EY[YEX|Y(X|Y)]

まだ,追記したいことが多少アルが,以上とりあえずここまで。

[目次]


E(XY)=E[YE(X|Y)]または,E[XE(Y|X)] の具体例 (同時に振る正四面体と立方体のサイコロ)

(x,y) xy
(1,1) , (2,1) , (3,1) , (4,1)
(1,2) , (2,2) , (3,2) , (4,2)
(1,3) , (2,3) , (3,3) , (4,3)
(1,4) , (2,4) , (3,4) , (4,4)
(1,5) , (2,5) , (3,5) , (4,5)
(1,6) , (2,6) , (3,6) , (4,6)
1  ,  2  ,  3  ,  4
2  ,  4  ,  6  ,  8
3  ,  6  ,  9  ,  12
4  ,  8  ,  12  ,  16
5  ,  10  ,  15  ,  20
6  ,  12  ,  18  ,  24

E(XY)={1+2+3+4+2+4+6+8+3+6+9+12+4+8+12+16+5+10+15+20+6+12+18+24}/24

=1{(1+2+3+4)4
+2(1+2+3+4)/4
+3(1+2+3+4)/4
+4(1+2+3+4)/4
+5(1+2+3+4)/4
+6(1+2+3+4)/4}/6

={1・E(X|Y=1)+2・E(X|Y=2)+3・E(X|Y=3)+4・E(X|Y=4)+5・E(X|Y=5)+6・E(X|Y=6)}/6

y・E(X|Y=y)/6 =E[YE(X|Y)]

=1{(1+2+3+4+5+6)/6
+2(1+2+3+4+5+6)/6
+3(1+2+3+4+5+6)/6
+4(1+2+3+4+5+6)/6}/4

={1・E(Y|X=1)+2・E(Y|X=2)+3・E(Y|X=3)+4・E(Y|X=4)}/4

x・E(Y|X=x)/4 =E[XE(Y|X)]