概率论(Probability Theory):1. 基本概念

概率论(Probability Theory):1. 基本概念

 概率论是从观察随机现象中抽象出来的数学分支。所谓随机现象,就是在给定条件下,可能出现不同结果的现象。生活中这些现象多了去了。抛个硬币、掷个骰子,转个陀螺,最终落地、停下的结果都不确定,也就是随机。对随机现象的观察,也称为随机试验。每观察一次,就是做一次随机试验。每次随机试验,都产生一个结果。为数学上的方便,我们把有确定结果的试验也归为随机试验,称为平凡的trivial)随机试验。

 概率论中第一个概念叫作样本空间(西文sample space)。对应一个随机试验,样本空间是所有可能结果的集合。集合是数学中的一个基本概念,但对我们普通人来说,集合就是一堆东西的意思。在这篇简介中我将用大写S表示样本空间。在抛硬币的随机试验中,样本空间就是正、反两个结果,用集合的符号就是S = {, }。这一前一后两个花括号就像个篮子,表示X是装着东西的篮子而不是篮子里的东西。如果我们用个老千币,两面都是正,那就是S= {}。单单一个“正”与装了“正”的篮子“{}”是不同的概念。当然随机试验不能没结果(抛硬币老不掉下来的试验坚决不做),所以样本空间这个篮子必须至少装一个结果。当然只有一个结果的样本空间一定是出于有确定结果的平凡随机试验。

 概率论中第二个概念叫作随机事件(西文 random event)或简称为事件。事件就是一部分可能结果的集合。用抛硬币为例,{}{}{, } 都是事件。如果试验结果掉在某个事件(集合)里,我们就说这个事件发生了。不管你怎么抛硬币,事件S={, }总是发生。总是发生的事件称为必然事件sure event)。为了数学上的方便,必然事件也被认为是一个随机事件。为了数学上的方便,空集{}(没装任何东西的篮子)也被认为是一个随机事件,称为不可能事件impossible event)。概率论中不可能事件或空集{} 一般用符号Ø表示。

 有些随机试验中样本空间比较大,事件太多我们顾不过来,这时我们只关心部分事件。概率论中有个概念叫事件域(西文event field),也就是在某种情况下我们所关心的事件的全体。我用大写字母F表示事件域(关心事件的全体)。在抛硬币这个试验中,S = {, }不大,我们完全可以关心所有事件:F={Ø, {}, {}, {, }},连不可能事件Ø在内共4个事件。大家看到F={Ø, {}, {}, {, }}有两层花括号,大家可以想象外层是个大筐(事件域),大筐里装了内层的几个篮子(事件),每个篮子里又装了些可能的试验结果。关于集合的学问要求不同层次的东西用筐啊、篮子的分层隔开,不然筐里又放萝卜又放装萝卜的篮子就乱套了。

 事件域是我们关心的事件的全体。对事件域我们有几个要求:如果我们关心某事件A,那我们也要关心事件A发生与否,也就是说不光关心事件A发生,也关心A反面:事件A不发生。A的反面(也称为A逆事件)用Ā表示,Ā是所有不在A中的试验结果的集合。在投硬币试验中,事件{}的反面当然就是{}了。注意{}的反面又是{}了, Ā的反面(A的反面的反面)是A。还有Ø的反面是SS的反面是Ø(必然与不可能正相反)。我们把概率论对事件域F(关心的事件)的要求具体写出来:

1.  必然事件S一定要关心;

2.  如果我们关心事件A,那我们也要关心它的反面Ā

3.  如果我们关心事件A1A2A3...,那我们也要关心其中至少之一发生的事件。

 12两个要求得知必然事件S的反面不可能事件Ø也在关心范围内。第3个要求用集合学问的话说就是:如果我们关心事件A1A2A3...,那我们也要关心他们的“并”事件,A1UA2UA3U…

 概率论中第三个概念就是概率(西文probability)自身了。直观地说:概率是随机事件的一个数值属性attribute),概率大就是可能性大(同义反复,呵呵)。就像物理中物质有质量、你我有鼻子眼睛一样,随机事件有概率,就这么简单。当然概率论,作为数学的一个分支,要文绉绉些,要说概率P是个函数,定义域是事件域F,值域是实数区间[0, 1]。大家还记得函数是什么东西吧?函数P就是一把高精度的枪,函数的定义域F就是一盒各式各样的子弹,而值域[0, 1] 就是枪靶。从定义域F任拿一颗子弹A,放到枪P里,一扣扳机,就射到值域 [0, 1] 的某一点P(A)了。当然不是随便什么F射到[0, 1]的枪都能叫做概率的,不然就没数学家什么事儿了。把概率论对概率的要求具体写出来:

1.  P(Ø) = 0 (不可能事件的概率为0);
2.  P(S) = 1 (必然事件的概率为1100%);
3. 如事件A1A2A3...,不会有两个或以上同时发生(称为互斥),则 P(A1A2A3...其中至少之一发生) =  P(A1) + P(A2) + P(A3) + …(可加性)。

我第一次听老师说概率三要点就点头称是,真是太直观了。当然太直观的东西在数学中就不能证明了,只能称为“公理”。大家如果还记得中学的平面几何,那个“平行公理”就是个“公理”。后来才听说“平行公理”只能推出欧(欧几里德)氏几何,其他数林高手不服,又搞了些“平行婆理”,推出了非欧几何,连爱因斯坦都用。按下“平行公理、婆理”不说,还是回到咱们的概率公理吧。

因为事件A与它的反面Ā不会同时发生,而且“A与它的反面Ā至少有一个发生”是必然事件S,所以根据概率公理23
     1 = P(S) = P(AĀ至少有一个发生) = P(A) + P(Ā)
移项得
     P(Ā) = 1 – P(A)
这个还是很直观,如果某事件发生的概率是30%,则它不发生的概率是100% - 30% = 70%. 

概率论把样本空间S、事件域F、概率P放在一起,组成一个三位一体的东西 (S, F, P), 称为概率空间。这么简简单单的概率空间定义引发了许多深奥理论。当然不少与概率论有关的有趣结果在这里说的“公理化”的概率论创建以前就有了。

登录后才可评论.