確率の定義について



1 大学入試問題の例

(1) 2017 広島大学(理系)問題3
$ 表が出る確率がp、裏が出る確率が1-pであるようなコインがある。ただし、0 < p <1 である。$
$このとき、右図のような正三角形の3頂点 A,B,Cを次の規則で移動する動点Rを考える。(以下略)$

(2) 2017 北海道大学(文系)問題3
$ 正四面体ABCDの頂点を移動する点Pがある。点Pは、1秒ごとに、隣の3頂点のいずれかに$
$等しい確率\cfrac{a}{3}で移るか、もとの頂点に確率 \ 1-a \ で留まる。$
$初め頂点Aにいた点Pが、n 秒後に頂点Aにいる確率を p_n とする。ただし、 0 < a < 1 とし、(以下略)$

(3) 2014 岡山大学(文系)問題4
$ AとBが続けて試合を行い、先に3勝した方が優勝するというゲームを考える。$
$1試合ごとにAが勝つ確率をp、Bが勝つ確率をq、引き分ける確率を1-p-q とする。(以下略)$


これらのどこに問題点があるかわかりますか。それでは順を追って考えて見ましょう。

ページの先頭へ↑


2 教科書の記述


 高校における確率は、現在は数学Aで学んでいますが、その内容は
試行 … さいころ投げや硬貨投げのように同じ状態のもとで繰り返し行うことが
     できてその結果が偶然に支配される実験や観察
事象 … 試行の結果として起こることがら
根元事象 … 1個の要素だけからなる事象
全事象 … ある試行において、起こりうる場合の全体の集合
確率 … ある試行において、ある事象の起こる割合

 これらの用語の説明の後で
 ある試行において、根元事象の個数が有限個で、各根元事象が同様に確からしい
(同じ程度に期待できる)とき、すなわち
  全事象 $U=\{w_1,w_2, \cdots w_n\}$ において
$\hspace{4em} P(w_1)=P(w_2)= \cdots =P(w_n)$ のとき
$\hspace{4em} P(A)=\cfrac{事象Aに含まれる根元事象の個数}{全事象の要素の個数} = \cfrac{n(A)}{n(U)}$
  を事象 $A$ の起こる確率という。
と定義されています。

この定義のポイントは、根元事象に関して
(1)個数が有限個であること
(2)同様に確からしいこと
という制約があることです。

$この(2)の制約により、上の入試問題の(1)(2)は教科書を逸脱しているのです。$
$また、この定義ではいわゆる「統計的確率」は確率として認知されていません。$
$もっとも、実際には章末問題などにこっそり載っているのですが、上の入試問題の(3)がこれに$
あたります。

ところが、このような出題に対して、誰も問題視していないようで、このような出題はよく見か
けます。
そこで、この座りごごちの悪さを解消するのがこの原稿の目的です。

ページの先頭へ↑


3 確率の新しい定義


また教科書に戻りますと、確率の定義の後で、性質を3つ出します。
(i) $\quad 0 \leqq P(A) \leqq 1$
(ii) $\quad P(U)=1$
 事象$A,B$が同時に起こらないとき、すなわち $A \cap B = \phi$ のとき $A$ と$B$ は 互いに排反であるという。これについて、つぎの加法定理が成り立つ。

(iii) $\quad A \cap B = \phi$ のとき $P(A \cup B)=P(A) + P(B)$

ここからが本題になります。
どの根元事象も同様に確からしいという前提のもとで、上の性質(i)(ii)(iii)から逆に
$P(A)=\cfrac{n(A)}{n(U)}$ を導くことができるのです。

$U=\{w_1,w_2,\cdots w_n\}$ とする。各根元事象は同様に確からしいことから
$A_1=\{w_1\},A_2=\{w_2\}, \cdots ,A_n=\{w_n\}$ とおくと
$\quad P(A_1)=P(A_2)= \cdots =P(A_n) \hspace{3em} (1)$
また、$U=A_1 \cup A_2 \cup \cdots \cup A_n$ で $A_1,A_2, \cdots ,A_n$ は互いに排反だから
(iii) より $P(U)=P(A_1) + P(A_2) + \cdots + P(A_n)$  証明は後述
(ii) より  $P(U)=1$ だから
$\quad P(A_1) + P(A_2) + \cdots + P(A_n) = 1 \hspace{3em} (2)$
$(1),(2)$ を解いて
$\quad P(A_1)=P(A_2)= \cdots =P(A_n)=\cfrac{1}{n}=\cfrac{1}{n(U)}$

ある事象 $A$ が $A=\{w_{i1},w_{i2},\cdots w_{ik}\}$ ならば
$P(A)=P(A_{i1})+ P(A_{i2}) + \cdots + P(A_{ik})$
$\hspace{2em} =\cfrac{1}{n}+ \cfrac{1}{n}+ \cdots + \cfrac{1}{n}$
$\hspace{2em} =\cfrac{k}{n}$
$\hspace{2em} =\cfrac{n(A)}{n(U)}$

したがって

がいえるので、2つは同値となります。

 そうであるならば、性質(i)(ii)(iii)が成りたつ量を新たに確率と定義しても何ら問題ない
ことになります。

確率の新定義

事象$A$に対して、実数$P(A)$が1つ定まり、次の条件を満たすならば、
それを事象$A$の確率という。
(i) $P(A) \geqq 0$
(ii) $P(U)=1$
(iii) $A \cap B = \phi$ のとき $P(A \cup B)=P(A) + P(B)$

 この新定義は、根元事象について何も言及していないので、「どの根元事象も同様に確からしい」
という要請はありません。
したがって、根元事象ごとに確率を与えることになりますが、逆にこのことにより、
いわゆる統計的確率も確率の仲間に入ってきます。
ですから、この定義は拡張された定義になっているのです。

具体例でもう一度考えてみましょう。

$ 1枚の硬貨を投げて表裏を調べる試行の全事象は、表が出ることをH,裏が出ることをTとすると、$
$全事象はU =\{ H,T\}です。これらの根元事象に$
$\hspace{2em}$ (i) $\quad P(H)=\cfrac{1}{2}, \quad P(T)=\cfrac{1}{2}$
のように確率を与えるのは経験的に正しいと思えるからで、それが「同様に確からしい」という
根拠になっています。
ところが
$\hspace{2em}$ (ii)$\quad P(H)=\cfrac{2}{3}, \quad P(T)=\cfrac{1}{3}$
のように確率を与えても数学的には何も問題ないというのが、この新しい定義がいっていることです。
つまり、(i),(ii)(あるいは定義を満たせば何でも)のどちらが正しいなどということを決めないのです。

 確率論は、ある試行の根元事象にどのような確率を考えるのかではなくて、与えられた確率から、
いろいろな事象の確率を求めることにあるわけです。

 だからといって、今教科書で学んでいる「同様に確からしい」ことで与えられる確率
(これは一様確率モデルといわれています)が否定されるわけではありませんし、逆に勝手な数値で
確率を定めてもたいして得るものはありません。
やはり、合理的な方法で決めることになります。

 そういうわけで、私よりずっと専門的な文科省の教科書作成担当官が決断すれば、ほとんど現行と
同じ労力で、先の大学入試問題のような確率も堂々と扱うことが可能となると思うのですが、皆さん
どう思われますか。


ページの先頭へ↑


4 統計的確率


 中学校では2年生で確率を学びますが、ある教科書では、はじめの「ことがらの起こりやすさ」
の説明で、ペットボトルのキャップを投げる例をあげています。
キャップを繰り返し投げて、表向きになる場合とそれ以外になる(裏返しあるいは橫に立つ)場合
の回数を数える実験を行って、相対度数をもとめさせたり、折れ線グラフに書かせたりしています。

 そして、「キャップを投げる実験を多数回繰り返すと、表向きになる相対度数が、ある値にかぎ
りなく近づいていくことを理解させようとしています。

 まとめとして、「結果が偶然に左右される実験や観察を行うとき、あることがらが起こると期待
される程度を数で表したものを、そのことがらの起こる確率といい、「確率が$p$であるということ
は、同じ実験や観察を多数回繰り返すとき、そのことがらの起こる相対度数が$p$にかぎりなく近づく
という意味をもっている。」と書かれています。

 まさに統計的確率そのものであり、大数の法則(後述)まで言及していることに驚いてしまいます。
その後、確率を実験や観察によらないで求める方法として、正しく作られたさいころは、どの目が出
ることも同じ程度期待できると考えられることから、各目が出る確率は $\cfrac{1}{6}$ としていますが、
これはさいころの一つの一様確率モデルということになります。
もし、さいころが多少いびつであれば等確率を考えることは逆に意味がありません。
このような場合には、実際に何度も何度もさいころを振って、各目の出る割合を調べることになるわ
けです。

 一般に、$n$回の復元試行を行って、ある事象Eが $r$ 回起こったときの
相対度数 $\cfrac{r}{n}$ を求めます。
この試行を繰り返し行って得られるこの比率の列
$\hspace{2em} \cfrac{r_1}{n_1},\quad \cfrac{r_2}{n_2},\quad \cdots ,\quad \cfrac{r_k}{n_k}$
は、ある一定の値 $p$ に安定する傾向があります。(後述 大数の法則)
そこで、この値 $p$ を事象Eの起こる統計的確率というわけです。

 統計的確率において、現実的には実験・観察を限りなく多く繰り返すことはできないので、ある
程度の回数の相対度数で統計的確率としても大きな差はありません。
 また、大量の製品から1つ選んでそれが良品か不良品かを調べることも復元試行と考えられます
から、不良品の割合は統計的確率となります。

 このような統計的確率に対して今までの各根元事象が起こる割合が同様に確からしいということ
から求められる確率を数学的確率といいます。


ページの先頭へ↑



5 大数の法則


 ある反復試行(各回の試行が他の回の試行に何も影響を与えない独立試行の繰り返し)において、
$ある事象Aが起こる確率をpとする。この試行をn回行ったとき、事象Aがr回起こったときの$
$相対度数 \ \cfrac{r}{n} \ は n が大きくなると p に近づく。$
すなわち
$ 任意の \varepsilon > 0 に対して、P(|\cfrac{r}{n}-p| < \varepsilon) \rightarrow 1 \qquad (n \rightarrow \infty)$

これが、大数の(弱)法則の1つの表現です。(証明は略します)


ページの先頭へ↑



6 連続的な量を対象にする確率



 長さや面積・体積、重さ、時間などのような連続的な量(測度という)を対象にする確率
(幾何学的確率という)は定積分で定義されます。
さらにその先には、ボレル集合族とコルモゴロフの公理がありますが、これらについてはまた
別の機会とします。


ページの先頭へ↑



メインメニュー に戻る