前言
历史素有两种写法:以人为主和以事为主。所有的传记都是以人为主的;而各种专史,如战争史,则多以事为主。所谓历史是人民创造的还是英雄创造的,我个人的偏好还是以人为本。八卦的历史,读者自然喜欢,对作者也有好处,就像一战后英国首相劳合·乔治对他的耶路撒冷总督说的那样:有争执,咱们政治家才派得上用场,如果他们停下来不打了,你就失业了。
人工智能到底是什么?给一门学科界定范围很难,尤其是这门学科还在快速变化中。即使是数学这样的成熟学科,有时我们也理不清边界,而像人工智能这样朝令夕改的,更是不容易闹清楚了。人工智能的定义素无共识。在大学里,机械系、电子系、计算机系,甚至哲学系都有人干人工智能。让这些人对这门学科取得共识谈何容易。从实用主义(哲学的“实用主义”,不是日常用语“实用主义”)看,一个学科就是学科共同体共同关注的东西。有些毛边可以宽容,演变。这种外延式的定义要比从上帝视角给一个内涵式定义更为实用。
一般认为,人工智能起源于1956年在达特茅斯学院召开的夏季研讨会。国内关于达特茅斯会议和神经网络早期历史的各种段子很多源于我几年前的两篇博客,后来被《上海书评》转发。经过修订,我把它们重新编为本书的两章:“达特茅斯会议:人工智能的缘起”和“神经网络简史”。“计算机下棋”一章的大部分也在《南方周末》发表过。“自动定理证明兴衰纪”的核心内容在《中国计算机学会通讯》连载过。
明尼苏达大学的查尔斯·巴贝奇研究所一直在做计算机科学的口述历史,采访了很多对计算机科学有影响的人,其中有相当一批是人工智能学者。大部分的采访都有录音。除了翻阅各种文献外,我听了近100小时的采访录音,许多人工智能老一代革命家临终时话都说不利索,听这种东西除了兴趣,还得有体力。
图灵大概是第一个对智能做出深刻思考的智者。他1936年的文章“可计算的数”奠定了计算机科学的理论和实践基础,也把相关的哲学思考推进了一大步,以至于哲学家蒙克(Ray Monk)把他列为有史以来最伟大的十位哲学家之一。图灵1950年在哲学杂志《心》(Mind)上发表的文章“计算机与智能”是传世之作,但这篇文章没有靠谱的中文翻译,我将我的译文和一篇图灵小传附在书后作为附录。图灵小传的一个早期版本曾出现在我的《哲学评书》一书中,但新版本融入了一些近几年关于图灵研究的新成果。“人工智能”这个词组的出现和达特茅斯会议有关。但英国学术圈在1956之前和之后的很长一段时间一直在用“机器智能”的说法,这和图灵1950年的文章有关。一般认为,这篇文章是这个学科的源头。但后来发现图灵1948年在英国国家物理实验室(NPL)写过一个内部报告,题为“智能机器”,其中提到了“肉体智能”(embodied intelligence)和“无肉体智能”(disembodied intelligence)的区分。机器人学家布鲁克斯(Rodney Brooks)认为图灵1948年的报告比图灵1950年的文章更加重要,它从某种意义上预示了后来符号派和统计派之争。这段历史我也列在附录里,放在图灵小传之后,因为我觉得先读读图灵的生平也许会有助于理解他的思想。
本书每一章几乎都可单独阅读,大部分内容,对于受过高中教育的人,应该都不难懂。但第10章是个例外,这一章企图以严肃的态度探讨人工智能。我以一种浓缩的方式讲述了图灵机、丘奇-图灵论题、相似性原则和超计算。没有计算理论,很多人工智能的基础问题实在是拎不清。如果读者觉得吃力,可以跳过这一章。
我常用的一种历史研究工具是谷歌的Ngram。谷歌扫描了三千多万本书,把书中出现的词组的词频统计结果公布。以时间为横轴、词频为纵轴画一条曲线,就可看出特定的词在不同历史时间段的兴衰,从而得出某些洞察。例如,通过比较“United States are”和“United States is”在历史上出现的频率,就可看出美国人是何时开始认同美国作为一个统一的国家的。很明显,南北战争之后,“United States is”开始变得更常用。我们通过统计若干人工智能中关键词的Ngram,可以感知人工智能在不同阶段的宏观发展。我曾经写过一篇“计算历史学”(见《哲学评书》)介绍Ngram。大数据为历史学提供了有力而令人信服的工具。
科普有一种写法:用一些貌似通俗的语言去解释复杂的原理。我一直不大相信这种方法,无论作者是内行还是专业科普作家。我压根就没见过一本可以把量子力学解释清楚的科普书。即使简单如图灵机,也鲜有适当的普及读物。倒是那些讲历史和八卦的书引人入胜,安德鲁·霍奇斯的《艾伦·图灵传:如谜的解谜者》是内行写作的典范,而数学家所罗门·费佛曼的太太安妮塔·费佛曼的两本逻辑学家传记是我心目中的标杆。戴森(Freeman Dyson)一直是我喜欢的作者,他也时不时为《纽约书评》写写八卦,趣味和我接近,我总是从阅读他的文章的过程中收获良多。即使我不懂他的数学和物理的领域,也能时有洞察。我的书单上还有蒙克的所有传记,它们既高级又有趣。就像蒙克所说,历史可以帮助内行了解知识的进化并获得新的视角,同时也为外行人了解专业知识提供入门的台阶或向导。
读大科学家写的科普著作,最有意思的倒不是那些对成熟思想的通俗叙述,而是那些对不成熟看法的披露,还有不好意思写到正经学术论文里的自负和牢骚。恰因为这个原因,我也喜欢多依奇(David Deutsch)的几本书。
我们很少有机会在学科发展之初就能把学科脉络梳理清楚。过去有过几个这样的时间段,例如1900年到1950年的逻辑学,1945年到2000年的分子生物学和1950年到当下的语言学。本书除了想梳理始于20世纪40年代的人工智能的历史外,还有一个作者隐含的心愿:作为人工智能的科普。哈代曾说科学(尤其是数学和理论物理,也许还有理论计算机科学)和艺术的原创需要一等的智力,解释和欣赏(例如乐评家和书评家)是二等的智力活儿。本书假想的对象是那些有能力但又是外行的人。丘成桐曾说(大意):要想做大学问,必须先培养对学问的感情。除了科普,我还希望能帮助一小撮内行人或准内行人培养感情。我尽可能地列出了相关的参考文献供进一步学习。人工智能毕竟不是超弦理论,凭着一些智力还是可以自学的。
本书写作得到白硕、陈利人、宫力、洪涛、李维、刘江、马少平、毛德操、施水才、宣晓华和赵伟等诸位师友的帮助和指点,特此致谢。乌镇智库的同仁为本书提供了必要的数据,我的助理冰冰为我提供了多方面的支持,一并谢过。