2項分布の正規分布近似



このページを読む前に(積率母関数)を読んでいただき、モーメント,積率母関数,キュムラント母関数について
$理解を深めてください。$


$高校の統計で、2項分布でnが大きいときは正規分布で近似できる(ド・モアブル、ラプラスの定理)$
$ことを学びますが、ここではその証明を積率母関数を使う方法で考えてみましょう。$


1  2項分布の平均と分散


$はじめに、2項分布B(n,p)の平均 \ \mu \ と分散 \ \sigma ^2 \ を積率母関数を用いて求めてみましょう。$

\begin{eqnarray*} \phi(\theta) &=&E(e^{\theta X})\\ &=&\sum _{x=0}^n e^{\theta x} \ _n C _x p^x(1-p)^{n-x}\\ &=&\sum _{x=0}^n \ _n C _x (p e^{\theta})^x (1-p)^{n-x}\\ &=&\bigl(\ p e^{\theta} + (1-p)\ \bigr)^n\\ \end{eqnarray*} $したがって$
$\qquad \phi '(\theta)=n( p e^{\theta} + 1-p )^{n-1}\ p e^{\theta} \ \ より $
$\qquad \mu =\mu _1=\phi'(0)=np$

$\qquad \phi ''(\theta)=n(n-1)( p e^{\theta} + 1-p )^{n-2}\ (p e^{\theta})^2+n( p e^{\theta} + 1-p )^{n-1}\ p e^{\theta} \ \ より$
$\qquad \mu_2 =\phi''(0)=n(n-1)p^2+np$
\begin{eqnarray*} \sigma ^2 &=&\mu _2 - \mu _1^2\\ &=&n(n-1)p^2+np-n^2p^2\\ &=&-np^2+np\\ &=&np(1-p)\\ \end{eqnarray*}
$このように、この方法による計算は比較的容易です。$


2  2項分布の正規分布近似


$確率変数Xが、2項分布B(n,p)にしたがうとき、\ \ E(X)=np,\quad \sigma ^2=np(1-p) \ \ だから$
$平均 \ 0、\ \ 分散 \ 1となるように\ \ Y=\cfrac{X-np}{\sqrt{np(1-p)}} \ \ と変換する。$

$\quad 定理 \quad n \rightarrow \infty \ \ のとき、Yの分布はN(0,1)に近づく$


$(証明)$

$Yの積率母関数を\phi_Y(\theta) とすると$
\begin{eqnarray*} \phi_Y(\theta) &=&E\bigl( \ e^{\dfrac{\theta(X-np)}{\sqrt{np(1-p)}}} \ \bigr)\\ \\ &=&E\bigl( \ e^{\dfrac{\theta X}{\sqrt{np(1-p)}}} \times e^{-\dfrac{np\theta}{\sqrt{np(1-p)}}} \ \bigr)\\ \\ &=&e^{-\sqrt{\dfrac{np}{1-p}} \Large \theta} E\bigl( \ e^{\dfrac{\theta X}{\sqrt{np(1-p)}}} \ \bigr)\\ \end{eqnarray*} $ここで、a=\dfrac{1}{\sqrt{np(1-p)}} \ \ とおくと$
\begin{eqnarray*} E\bigl(\ e^{\large a \large \theta X}\ \bigr) &=&\sum _{x=0}^n \ _n C _x p^x (1-p)^{n-x} e^{a\theta x} \\ \\ &=&\sum _{x=0}^n \ _n C _x (p e^{a\theta })^x (1-p)^{n-x} \\ \\ &=&\{p e^{a\theta }+ (1-p)\}^n \\ \end{eqnarray*} $したがって$

$\qquad \phi_Y(\theta)=e^{-\sqrt{\dfrac{np}{1-p}} \Large \theta} \bigl( \ pe^{\dfrac{\theta }{\sqrt{np(1-p)}}} +1-p\ \bigr)^n$

$キュムラント母関数をとると$

$\qquad \psi_Y(\theta)=\log \phi_Y(\theta)=-\sqrt{\dfrac{np}{1-p}} \theta + n\log \bigl\{1+p\bigl(e^{\dfrac{\theta }{\sqrt{np(1-p)}}} -1 \bigr)\bigl\}$
$ここで$
$\qquad e^t=1+\cfrac{t}{1!}+\cfrac{t^2}{2!}+\cdots +\cfrac{t^n}{n!}+\cdots \qquad とマクローリン展開できるから$

$\qquad e^{\dfrac{\theta }{\sqrt{np(1-p)}}}=1+\cfrac{\theta}{\sqrt{np(1-p)}}+\cfrac{\theta ^2}{2!np(1-p)}+\cdots $

$よって$
$\qquad \log \bigl\{1+p\bigl(e^{\dfrac{\theta }{\sqrt{np(1-p)}}} -1 \bigr)\bigl\} =\log \bigl\{1+\underbrace{p\bigl(\dfrac{\theta }{\sqrt{np(1-p)}} +\dfrac{\theta ^2 }{2!np(1-p)} + \cdots \bigr) }_{\substack{\LARGE u}}\bigl\} \hspace{5em}(1)$

$また$
$\qquad \log (1+u)=u-\cfrac{u^2}{2}+\cfrac{u^3}{3}+\cdots +(-1)^{n-1}\cfrac{u^n}{n}+\cdots \qquad とテーラー展開できるから(1)は$

$\qquad p\bigl(\dfrac{\theta }{\sqrt{np(1-p)}} +\dfrac{\theta ^2 }{2!np(1-p)} + \cdots \bigr) -\cfrac{p^2}{2}\bigl(\dfrac{\theta }{\sqrt{np(1-p)}} +\dfrac{\theta ^2 }{2!np(1-p)} + \cdots \bigr)^2+\cdots $

$よって$
\begin{eqnarray*} \psi_Y(\theta) &=&-\sqrt{\dfrac{np}{1-p}} \theta + np\bigl(\dfrac{\theta }{\sqrt{np(1-p)}} +\dfrac{\theta ^2 }{2!np(1-p)} + \cdots \bigr) -\cfrac{np^2}{2}\bigl(\dfrac{\theta }{\sqrt{np(1-p)}} +\dfrac{\theta ^2 }{2!np(1-p)} + \cdots \bigr)^2+\cdots \\ \\ &=&-\sqrt{\dfrac{np}{1-p}} \theta + \sqrt{\dfrac{np}{1-p}} \theta +\dfrac{\theta ^2 }{2!(1-p)} + \cdots -\cfrac{np^2}{2}\bigl(\dfrac{\theta ^2}{np(1-p)} + \cdots \bigr)+\cdots \\ \\ &=&\dfrac{\theta ^2 }{2(1-p)} -\cfrac{p\theta ^2}{2(1-p)} + O(\dfrac{1}{\sqrt{n}})\\ \\ &=&\dfrac{\theta ^2 }{2} + O(\dfrac{1}{\sqrt{n}})\\ \end{eqnarray*} $ここで、O(\dfrac{1}{\sqrt{n}})は\dfrac{1}{\sqrt{n}}を含む項である。$

$\qquad n \rightarrow \infty \ \ とすると \psi_Y(\theta) \rightarrow \dfrac{\theta ^2 }{2} \quad よって \phi_Y(\theta) \rightarrow e^{\dfrac{\small\theta ^2 }{\small 2}}$

$これは、N(0,1)の積率母関数だから、Yの分布はN(0,1)に近づく。$

$したがって、X の分布は \ N(np,np(1-p)) \ に近づくことになる。$



 

ページの先頭へ↑




メインメニュー に戻る