2.2 问题2
例2-2 有9个外形完全一样的铜球,其中有一个球的重量比其他球略轻。问称量几次就一定能够把它找出来?
解:
这次,我们设计一架有3个托盘的特殊“天平”,它不是用于称重,而是区分3个托盘上物体的重量,分出最重,次重,轻。
把9个球均分成3组,在此天平上称第1次,确定轻球在3组中之一;再将该组称一次,确定轻球在3个中之一,即找出了那个轻的球。
可以看出,在除一个轻球外所有其他球的重量一致,以及每次都均分为3组的条件下,只用一架两托盘的天平,同样能实现称量方案。
分析:
如果轻球在3个不同位置中出现的概率都相同(各为1/3),我们把从3个位置中确定其中1个的不确定性程度取作一个(新)单位。因为用这个特殊的天平,称一次就可以确定轻球在哪一个位置,消除一个(新)单位的不确定性。如果轻球在9个不同位置中出现的概率都相同(各为1/9),我们可以用这个天平称2次,就找出轻球。也就是说,问题中包含的不确定性为log3 9=2(新单位)。
思考:
从上面两个例子,我们似乎可以提出衡量信息不确定性程度的如下度量:对于共有M种可能状态的事件,假如每种状态出现的概率相同,即P=1/M,其包含的不确定性(或称为熵)为(单位)。
这种度量的结果与选取的单位有关,如果采用“普通的天平”,计算时对数的底为2;如果采用上述“特殊的天平”,计算时对数的底为3。我们也可以将对数的底取为其他数,单位也就不同,度量的结果将相差一个常量的倍数。
(如果以2为对数的底,一个单位通称为1“比特”,指(相同概率的)2中取1的不确定性。如果以3为对数的底,一个单位指(相同概率的)3中取1的不确定性。)
当然,上面的认证还有些粗糙。第一,只针对了均匀分布的事件来讨论信息的不确定性,第二,信息中包含的状态数M只取2n,(n=1,2,…)或3n,(n=1,2,…)这种特别的值。仅仅在这两个比较特殊的情况下,采用log2M(或log3M)作为度量可以看出明显的合理性。
由于可认为不确定性度量(熵)是状态数M的连续函数,对于一般的正数M,我们猜测采用log2M作为度量也许仍然是不错的选择。
但如果事件出现的概率是任意的概率分布,而不是均匀分布的情况,怎样度量事件的不确定性呢?我们再讨论下面的问题3。