密码术的圣杯
第一次世界大战见识到密码分析家一连串的胜利,并在齐玛曼电报的破译达到最高峰。自从维吉尼亚密码法在19世纪被破解后,解码专家便一路占上风。然而,就在大战末期,编码专家正感到极度绝望时,美国的科学家发展出惊人的突破。他们发现,维吉尼亚密码法可作为一种更强的新密码法的基础。事实上,这种新密码法可以提供完美的保密安全。
维吉尼亚密码法的弱点在于它的循环本质。假使钥匙单词是5个字母长,则每逢5个字母就会用到同一套密码字母集。解码专家一旦辨识出钥匙单词的长度,就能把密码文视为5个单套字母密码法的系列组合,再以频率分析法逐一破解。然而,若使用更长的钥匙单词会怎么样?
假设有一篇1000个字母的明文用维吉尼亚密码法加密,然后我们要分析它加密后的密码文。如果加密这篇明文的钥匙单词只有5个字母长,译码的最后一项步骤只需把频率分析法应用到5套200个字母长的密码文,这很简单。可是假使钥匙单词是20个字母长,最后一项步骤就得对20套50个字母的密码文做频率分析,这可就难多了。再假设钥匙单词长达1000个字母,你就得对1000套1个字母的密码文做频率分析,这是完全不可能的。换句话说,如果钥匙单词(或钥匙语)的长度跟信息相同,巴贝奇和卡西斯基所研发的密码分析技术就派不上用场了。
没人会反对使用一个跟信息等长的钥匙单词,只是编码者就得编制一个冗长的钥匙。这则信息若有数百个字母,加密钥匙就也要有数百个字母。与其凭空编造一个冗长的钥匙,不如用一首歌的歌词之类的会轻松多了。或者,编码者也可以挑出一本赏鸟书,再挑选一些鸟的名字,随意串连起来当钥匙。可是,这种偷懒取巧的钥匙有根本性的缺点。
在下面的例子里,我用维吉尼亚密码法和一个与信息等长的钥匙语来产生一段密码文。援用所有之前介绍过的密码分析法来破解都会失败。尽管如此,这则信息仍旧破解得了。
这套新的密码分析系统先假设密码文里含有一些常用的词,例如the。再来,我们把the这个词随意置放在明文的几个位置上,如下所示,然后再推测什么样的钥匙字母才能把the转化成对应的密码文。例如,我们假设the是明文的第一个单词,那么这个钥匙的前三个字母应该是什么?这个钥匙的第一个字母会把t加密成V。我们去维吉尼亚方格查看以t开头的直栏,往下找到V,再往左看得知这一行字母的第一个字母是C。重复这个程序,找出把h、e加密成H、R的钥匙单词字母,即可得出钥匙的头三个字母的候选者:CAN。这些都是根据the为明文第一个单词的假设所得出来的。我们把the放到其他几个位置去,再推测对应的钥匙字母。(请参阅表9的维吉尼亚方格,查看每个明文字母和密码文字母的关系。)
我们已经把the随意摆在明文的三个位置,而得出三个加密钥匙片段元素的假设。现在,我们怎么知道有没有哪一个the的位置是正确的?我们猜测,这把加密钥匙是由有意义的单词组成的,若是如此,这一点对我们很有利。位置错误的the很可能会衍生出一串随机组合的钥匙字母。然而如果放在正确的位置,可能就会衍生出一串有意义的钥匙字字母。例如,第一个the衍生出钥匙字母CAN,显得很有希望,因为它是一个完全合理的英文音节。所以,这个the很可能是在正确的位置。第二个the则衍生出BSJ,一个非常怪异的辅音组合,表示第二个the很可能是错误的。第三个the衍生出YPT,一个不太寻常的音节,但值得进一步推敲。如果YPT真的是钥匙的一部分,那一定是在较长的单词里。可能的候选单词只有APOCALYPTIC、CRYPT、EGYPT,以及这几个单词的衍生单词。怎么样才能确定这类单词是否是钥匙的一部分呢?我们可以把这三个候选单词轮流套进钥匙里的适当位置,导出对应的明文:
如果这些候选单词并非加密钥匙的一部分,大概只会导出一段无意义的明文。可是,如果其中一个的确是钥匙的一部分,它所导出的明文应该会有意义。APOCALYPTIC套进加密钥匙里,只得出完全无意义的明文。套用CRYPT,则得出cithe,也不是能读得出意义的明文片段。可是,套用EGYPT所得出的字母组合atthe就很有希望了,它可能代表at the(在……)两个单词。
现在,我们且暂时假设EGYPT真的是钥匙的一部分。也许这把钥匙是由国家名字组成的。若是如此,从第一个the所得出的钥匙片段CAN,很可能是CANADA的一部分。要检验这个假设,就以CANADA和EGYPT这两个假设当前提,求出更多明文字母:
看来,我们的假设蛮合理的。CANADA所导出的明文是themee,很可能是the meeting(会议)的一部分。既然我们又多推衍出一些明文字母——ting,我们也可以反推出它们对应的钥匙部分:BRAZ。它们当然是BRAZIL的开头部分啰。把CANADABRAZILEGYPT这串组合套进钥匙里,即可得出下列的解译结果:the meeting is at the ? ? ? ?(会议在?? ? ?举行)。
为了找出明文的最后一个单词——这场会议的地点,就得完成这只钥匙。最好的策略是一一检验所有可能的国家名称,看看会得出怎样的明文。钥匙的最后一段套进CUBA时,才能得出有意义的明文dock(码头):
所以,一把跟信息一样长的钥匙并不足以保证密码的安全。上述例子不安全的缘由是,加密钥匙是由有意义的单词所组成的。我们先在明文里随意插放几个the,求出对应的钥匙字母。然后,因为这些钥匙字母看起来很像是有意义的单词的一部分,我们就知道the放对地方了。接下来利用这些钥匙碎片来推测完整的钥匙单词,得到更多信息碎片,再把这些信息碎片扩展成完整的单词,如此循环下去。此种在信息和钥匙之间来来回回的分析过程之所以能成功,全因为钥匙本身有一定的结构,是由可辨识的单词组成的。然而,在1918年,编码专家开始实验没有结构的加密钥匙。结果就是一种无法破解的密码。
世界大战接近尾声时,美军密码研发部门的主管约瑟夫·茅博格少校(Major Joseph Mauborgne),引进随机钥匙的概念——钥匙的组成元素不再是可辨识的单词,而是随机组合的字母。他主张采用这类随机钥匙,配合维吉尼亚密码法,可提供空前的安全度。茅博格系统的第一步骤是编纂一本厚达数百页的密码钥匙簿,每一页都是一把好几行随机排列的字母所组成的独特钥匙。这种密码钥匙簿制成一式两份,一份给发信人,一份给收信人。加密信息时,发信人就拿第一页的钥匙,套用维吉尼亚密码法。图30列示三页密码钥匙(实际的钥匙簿每一页都会含有数百个字母),以及用第一页随机钥匙加密的信息。收信人使用相同的钥匙,逆向应用维吉尼亚密码法,就能轻易地解译这段密码文。这则信息成功发送、接收、解译后,发信人和收信人就把这一页钥匙销毁,再也不用它。要加密下一则信息时,就套用钥匙簿的下一页随机钥匙,随后亦将它销毁。因为每把钥匙都只使用一次,这套系统就被称为单次钥匙簿密码法(one-time pad cipher)。
表9:维吉尼亚方格
单次钥匙簿密码法克服了之前的所有弱点。假设如图30所示,加密好attack the valley at dawn(拂晓时进攻山谷)这则信息后,利用无线电传送出去时被敌人拦截到,落在敌方密码分析家手里。这位密码分析家尝试解译它时会碰到的第一个障碍是,随机钥匙绝对没有重复性,所以巴贝奇和卡西斯基的方法都无法破解这种单次钥匙簿密码法。接下来,他可能另寻其他途径,尝试在许多地方放进the这个试验单词,推测对应的钥匙片段,就跟我们在尝试解译前一则信息时所做的一样。他若试着把the放在信息的开头,这个位置不对,他所推衍的对应钥匙片段会是WXB,是一串没有章法的字母。他若把the放在这则信息的第7个字母,刚好放对位置了,他所得出的对应钥匙片段会是QKJ,仍是一串没有章法的字母。换句话说,这位密码分析家根本无法辨别,试验的单词到底有没有放对地方。
在绝望之际,这位密码分析家或许会考虑彻底搜查所有可能的钥匙。这段密码文有21个字母,因此他知道这把钥匙也有21个字母。这表示说,他有大约500,000,000,000,000,000,000,000,000,000把钥匙要测试。这根本超乎人力乃至机械能力的范围。而且即使他能测试所有的钥匙,还有一个更大的障碍在等着他。检测过每把可能的钥匙后,他当然会揭露正确的信息,然而在此同时,他也会得出所有错误的信息。例如,把下面这把钥匙套到同一段密码文后,可得出一则完全两样的信息:
图30:三张,亦即三种单次钥匙薄密码法的可能性钥匙。这则讯息是用第一张加密的。
若能测试所有不同的钥匙,每一则意思上说得通的21个字母的信息也都会随之出现,这位译码者将无法分辨其中何者才是正确的。如果这把钥匙是由一系列单词或词组所组成,他不会有这种难题,因为错误的信息势必对应着无意义的钥匙,正确的信息则会对应一把有意义的钥匙。
单次钥匙簿密码法的安全性全归功于钥匙的随机性。这种钥匙把随机性也注入密码文里,密码文既是随机的,也就没有特定模式、没有结构、没有密码分析家可以攀住的东西。事实上,数学可以证明密码分析家无法破解单次钥匙簿密码法所加密的信息。换句话说,单次钥匙簿密码法不单只是被视为无法破解——就像19世纪时人们对维吉尼亚密码法的错误信心——而且它是真的绝对安全。单次钥匙簿密码法可以保证秘密书写的绝对安全:它是密码术的圣杯。
编码专家终于找到一套无法破解的加密系统。然而,单次钥匙簿密码法的完美性并未终止保密法的追寻。事实上,它几乎不曾被派上场。理论上它是很完美,实际使用上则有缺陷,因为它有两项根本性的问题:第一,编造大量的随机性钥匙有实际困难。军队每天大概得收发数百则信息,每一则都有数千个字符,亦即无线电通讯员每天所需要的钥匙量,相当于数百万个随机排定的字母。供应这么多随机组合的字符串,是件不可低估的庞大工作。
早期有些编码专家相信,他们可以在打字机上随便乱打,以得出大量的随机钥匙。然而每当他们尝试这么做时,打字者总是习惯左手按一个键、右手再按一个键,如此两边轮番打出字母。这种方法或能快速编造加密钥匙,只是如此编造出来的字符串具有结构,而不再是随机的——假使打字员打了位在键盘左方的字母D,我们可以预期他下一个字母大概会来自键盘右方。加密钥匙若要有真正的随机性,那么紧跟在一个位于键盘左方的字母后面的字母,来自键盘左方的概率应该跟来自右方的概率一样高。
编码专家意识到,编造随机钥匙需要大量的时间、功夫与金钱。利用自然的物理方法,例如有真正随机特性的放射线,可以编造出最好的随机钥匙。编码专家可以在工作台上放一块放射性物质,用盖革计数器(Geiger counter,放射线测定器)侦测它的放射情况。放射线的发出,有时候是非常快速地一个紧接一个,有时候却停顿很久——每一次放射的间歇时间都是随机、无法预估的。在盖革计数器上连接一个显示器,字母集的字母以固定的速率在显示器上快速轮番出现,每侦测到放射线,就暂时冻结。冻结在显示器上的字母,就取作随机钥匙的字母。显示器继续运转,字母集的字母再次快速循环,直到下一次随机发出的放射线使它停止,冻结在显示器上的字母又再被加进钥匙里,如此不断重复下去。这种装置保证会编造出真正随机的钥匙,可是对日常的密码应用而言,它很不实际。
就算能编造足够的随机钥匙,还有第二个问题得解决:分送这些钥匙。想象一下,战场上有数百位无线电通讯员都是同一个通讯网络的成员。首先,所有成员都必须有相同的单次钥匙簿。再者,发送新钥匙簿时,必须同时发给每一名成员。最后,每名成员必须保持同步状态,才能确保在正确时刻使用正确的钥匙。真要广泛使用单次钥匙簿密码法,整个战场会到处都是信差和簿记员。此外,敌人只要截获到一组钥匙,就会危及整个通讯系统。
重复使用钥匙簿以减少编造和发放钥匙的困难,是诱人的建议,却是密码术的首恶。重复使用钥匙簿会让敌方的译码专家有机会解译出信息。(破解两则由同一把单次钥匙簿钥匙加密的密码文的技巧详述于附录G。)总之,使用单次钥匙簿密码法不可抄捷径。发信人和收信人一定得为每一则信息使用一把新的钥匙。
单次钥匙簿密码法只能供那些需要绝对安全的通讯,且又负担得起钥匙的编造与发送成本的人使用。例如,美、俄总统之间的热线就是利用单次钥匙簿密码法来防护的。
理论上很完美的单次钥匙簿密码法,却因为实用上的缺点使得茅博格的构想永远无法应用于战场上。第一次世界大战的余波与密码通讯的失利,促使密码专家继续寻找可以在下一次冲突派上用场的实用系统。幸好对编码者而言,他们没等太久,就研发出一项突破,一种可以在战场上重建安全通讯网的方法。为了加强密码,编码者被迫抛弃他们的纸笔作业方式,改为利用最新科技来加密信息。