软件研发效能提升之美
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

2.3.1 信息熵

人与人之间的沟通,其实质是信息流的传递。1948年,香农提出了“信息熵”的概念,解决了信息的量化度量问题,具有划时代的意义。

信息熵的公式非常简单:

公式里出现的pi是指某信息出现的概率。假设我们这本书有20万字,其中“研发效能”这四个字出现了1000次,那么它出现的概率就是1000/20万=0.5%,把所有词语出现的概率都统计出来,用上面的信息熵公式来计算,就能得到这本书的信息熵。

通过信息熵公式,我们可以推导出很多有意思的结论。比如,对于同样的内容,语音输出的信息熵比文字输出的信息熵低很多。以中文为例,《现代汉语常用字典》统计有3500多个汉字,但是在语音输出时,同样声调的汉字是区分不出来的,这样折算下来其实只有800多个“语音字符”,通过公式推导发现,符号越少,信息熵越小,故语音输出的效率不高。