第二版序言
约13年前,我是在非常困难的条件下撰写初版《控制论》的,以致不幸地出现了大量印刷错误和少量内容错误。对此,我一直深感遗憾。现在,我认为是时候把《控制论》的重新修订提上日程了,这不仅是因为它将成为未来某个时间段要执行的计划,而且因为它已是一门现有的学科。因此,借此机会,我想根据读者的意见对初版做一些必要的更正,与此同时,还将详述这门学科的现状,以及增补自初版问世以来出现的相关的新思维方式。
一门新学科要想真正地具有活力,就必须随着时间的推移而不断地更新它的关注点。在首次撰写《控制论》时,我表达个人观点的困难之处主要在于:统计信息和控制理论的概念对当时的主流观念来说是新奇,甚至是令人震惊的。而现在,作为通信技术工程师和自动控制设计者使用的工具,这些概念已经变得如此熟悉,以至于我担心这本书看起来是否既陈腐又平庸。反馈在工程设计和生物学领域的作用,是毋庸置疑的。对于工程师、生理学家、心理学家和社会学家来说,信息的作用以及用于测量和传递信息的技术成了一门完整的学科。在本书初版发行时,自动机还仅是一种预测,而现在它已有了自己的地位。我在本书以及另一本受欢迎的同类书籍《人有人的用处:控制论与社会》[1]中所警告的它会带来的相关社会危险也已渐渐浮现。
因此,控制论学者应去关注新的领域,将大部分精力集中到过去十年发展过程中涌现出的思想上。对简单线性反馈的研究曾经在唤醒科学家们研究控制论时起到了很重要的作用,但现在这些反馈看起来远远没有最初显现的那么简单,也远没有那么具有线性特性了。事实上,在早期电路理论中,用于电路网络系统处理的数学手段未超出电阻、电容和电感线性并列的范围。这意味着整个研究对象可以运用所传递信息的谐波分析[2],以及信息所经电路的电阻、导纳和电压比进行充分描述。
早在《控制论》出版之前人们就意识到,非线性电路的研究(如我们在许多放大器、限压器、整流器[3]等中发现的)并不完全适应这个框架。然而,由于缺乏更好的方法,人们进行了大量尝试,试图将旧的电气工程领域的线性概念推广到新型装置可以自然运转的程度。
当我在1920年左右来到麻省理工学院时就指出,处理非线性装置问题的常规模式是寻找电阻概念的直接延伸,使其涵盖线性系统[4]和非线性系统。结果使得非线性电气工程的研究进入了一种类似于托勒密天文学体系末期的状态,本轮上堆着本轮,修正后又修正,直到这个巨大的拼接结构最终因不堪自重而破裂。
正如哥白尼体系从过度紧张的托勒密体系的残骸中产生,简单自然的日心说取代复杂晦涩的托勒密地心说一样,非线性结构和系统的研究(无论从电气还是机械,自然还是人工角度)也需要一个全新且独特的起点。我曾尝试在我的《随机理论中的非线性问题》[5]一书中提出一种新方法。事实证明,当我们考虑非线性现象时,三角分析在处理线性现象中的绝对重要作用将不复存在。这在数学上有着明确清晰的理由。与许多其他物理现象一样,电路现象相对于原点的变化也具有时间上的不变性。一个物理实验,如果我们在中午12点开始,将在下午2点钟之前到达某个阶段;如果我们在中午12点15分开始,则将在下午2点15分到达同一阶段。因此,物理定律与平移群在时间上的不变性有关。
三角函数sin nt和cos nt就是对于同一平移群下的某种重要不变量。一般函数
eiwt
通过将τ的平移添加到t,从而变成
的形式。这是与前面相同的表式。因为,
换句话说,函数族
Aeiwt
和
Acos wt+Bsin wt
在平移下是不变的。
还有其他函数族在平移下是不变的。如果我考虑所谓的随机游走[6],这种游走的粒子[7]在任何时间间隔内的运动都具有这样一种分布,其分布仅取决于该时间间隔的长度,并且独立于其开始之前发生的一切分布,那么随机游走的轨迹就是所有曾经到达的点的集合。
换句话说,其他函数集也具有三角曲线的单纯平移不变性。
除了这些不变性之外,三角函数还有一个特有属性:
Aeiwt+Beiwt=(A+B)eiwt
因此这些函数形成一个极其简单的线性集。值得注意的是,该属性涉及直线性;也就是说,我们可以将给定频率的所有振荡都化为两者的线性组合。正是这种特性创造了谐波分析在处理电路线性性质方面的价值。函数
eiwt
是平移群的特性标,它给出该群的线性表示。
然而,当我们处理的函数组合不只涉及常数系数加法时——例如,当我们将两个函数相乘时——简单的三角函数不再显示此基本群性质。另一方面,随机游走中出现的随机函数确实具有某些性质,非常适合讨论它们的非线性组合。
我不打算在这里详细介绍这项工作,因为它在数学上相当复杂,而且在我的《随机理论中的非线性问题》一书中已经对其作了介绍。那本书中的材料已经在讨论特殊非线性问题中得到了广泛应用,但要实现书中制定的方案,仍有许多工作要做。它的实践意义在于,在非线性系统的研究中,适当的测试输入与其说是一组三角函数集合,不如说是具有布朗运动的特征。就电路而言,这种布朗运动函数在物理上可以通过散粒效应自然产生。这种散粒效应是电流中的一种不规则现象,产生于这样一个事实:电流不是作为电的连续流,而是作为一系列不可分割且相等的电子来承载的。因此,电流具有统计上的不规则性,其本身还具有某种均匀性,并且当它被增强到某种程度后就可以明显看出它们是由随机噪声构成的。
正如我将在第九章中展示的那样,这种随机噪声理论可以投入实际应用,不仅用于分析电路和其他非线性过程,还可以用于二者合成行为的分析。[8]方法是将随机输入的非线性仪器的输出简化为与埃尔米特多项式[9]密切相关的一系列有明确定义的正交函数[10]。非线性电路分析要解决的问题,主要是通过求平均值来确定在输入某些参数的条件下这些多项式的系数。
这个求值过程的描述相当简单。除了代表尚未分析的非线性系统的黑盒外,还有一些结构已知的物体,我将它称为白盒,它们代表所需展开式中的各种项。[11]我将相同的随机噪声分别放入黑盒和给定的白盒中。白盒在黑盒发展过程中的系数作为它们输出乘积的平均值给出。虽然这个平均值是针对整个散粒效应输入的集合,但有一个定理允许我们在一般情况下(一组概率为0的情况除外),用一段时间内的平均值来替换这个系综的平均值。为了获得这个平均值,我们需要一个乘法器,通过它得到黑盒和白盒输出的乘积,以及一个平均器,我们可以利用以下事实,即电容器两端的电势与电容器中所含的电量成正比,因此与流经电容器的电流的时间积分成正比。
不仅可以逐一确定每个白盒(构成黑盒等值表达式里的加法部分)的系数,而且还可以同时确定这些量。通过使用适当的反馈装置,甚至可以使每个白盒自动调整到与其在黑盒展开式的系数相对应的水平。通过这种方式,我们能够构建一个多重并联白盒,当它正确连接到一个黑盒并在接受相同的随机输入后,即使它的内部结构可能大不相同,它也会在运算上自动变成黑盒的可操作等价物。
这些分析综合的操作,以及将白盒自动调整为与黑盒相等的操作都可以通过其他方法实现,这种方法由阿玛·博赛[12]教授和加博尔[13]教授提出。在所有这些方法中,均经过了通过为黑盒与白盒选择适当输入并对二者进行比较,从而进行操作或学习的过程;而在其中的许多程序中,包括加博尔教授的方法所应用的程序,乘法器都发挥着重要作用。虽然有许多方法可以解决两个函数用电方式相乘的问题,但这个任务在技术上并不容易实现。一方面,一个好的乘法器必须在大振幅的范围上工作。另一方面,为了使它在高频率下能保证准确度,操作几乎必须瞬间就完成。加博尔声称他的乘法器的频率范围可以达到1000个循环。在他为伦敦大学帝国理工学院电气工程教授席位撰写的论文中,他没有明确说明他的乘法方法有效的振幅范围,也没有明确说明需要获得的准确度。我迫切想得到这些属性的明确阐述,以便我们可以对乘法器进行适当评估,从而在依赖它的其他装置中使用。
在所有这些装置中都有一个仪器,能基于过去的经验使它呈现出特定的结构或功能,这种装置引发了工程学和生物学领域中一种非常有趣的新态度。在工程学中,有类似特性的装置不仅可以用于游戏和执行其他有目的的行为,而且可以在过去经验的基础上不断提高性能。我将在本书第九章讨论其中的一些可能性。在生物学上,我们至少可以模拟某些反映生命核心现象的内容。遗传之所以成为可能,细胞之所以能繁殖,必须靠细胞中携带遗传信息的成分(所谓的基因)能够构建出与其自身类似的携带遗传信息的结构。因此,对于我们来说,拥有这样一种方法,使工程结构可以生产出具有与其自身功能相似的其他结构,将是非常令人兴奋的事。我会在第十章专门讨论这一点,特别是讨论给定频率的振荡系统如何将其他振荡系统降低到相同频率。
人们常常认为,以现有分子的形象生成任何特定类型的分子,都与在工程中使用模板的情形相仿,我们在工程中可以使用机器的功能元件为模板制作另一个类似元件。模板的图像是静态的,因此必须存在某种流程,使得基因分子可以根据它自身来制作另一个基因分子。我给出的初步建议是,可以用频率,比如说分子光谱的频率,作为携带生物物质特性的模板要件;而且基因的自组织性可能是频率自组织的一种表现,这一点留待后续讨论。
我已经对学习机进行了大致描述。接下来,我将专门安排一章来更详细地讨论这些机器和其潜力以及在使用它们时所面临的一些问题。在此,我想发表一些概括性的意见。
正如第一章将谈到的那样,学习机的概念与控制论本身一样源远流长。对于我所描述的防空预警器,即在任意给定时间内使用预警器的线性特性,取决于长期以来我们对所要预测到的时间序列系综的统计数据的熟悉程度。虽然这些特性的知识可以根据我在此处给出的原理以数学方式计算出来,但完全有可能根据已经由机器(与用于预测的机器相同)观察并自动计算得出的经验,设计一台计算机来计算这些统计数据,并确定预警器的短期特征。这可能远远超出了纯线性预警器的范畴。在卡里安普尔、马萨尼、阿库托维奇和我本人所著的多篇论文[14]中,我们已经发展了一种非线性预测的理论,它至少可以通过长期观察,以类似方式进行机械化,为短期预测提供统计基础。
线性预测理论和非线性预测理论均涉及预测拟合优度的一些准则。最简单的准则(尽管绝不是唯一可用的准则),就是使误差均方最小化。这个准则以一种特殊的形式与我用于构造非线性装置的布朗运动的泛函[15]有关,因为我创建的各种项具有某些正交性。确保这些项有限数量的部分和,就是待模拟装置的最优模拟。如果要保持误差的均方准则,则可以通过这些项来进行模拟。加博尔教授的工作也依赖于均方误差准则,但以更通用的方式,适用于通过经验获得的时间序列。
学习机的概念可以扩展到远远超出其对预警器、过滤器和其他类似装置的使用范围。这对于研究和制造跳棋这样的竞技游戏机器来说尤其重要。塞缪尔[16]和渡边[17]已经在国际商业机器公司(IBM)的实验室完成了这方面的重要工作。就过滤器和预警器的情况而言,时间序列的某些函数是根据这类可以扩展的函数创建的。这些函数可以对游戏胜利所依赖的一些重要的量进行数值评估。例如,它们包括双方棋子的数量、棋子的总活动范围、棋子的机动性,等等。在开始使用机器时,这些不同因素被赋予了暂定权重,并且由机器选择总权重取最大值的允许走法。到目前为止,机器仍然在使用僵化的走法程序,尚未成为学习机。
然而,有时机器会承担不同的任务。它试图扩展该函数(即1表示赢局,0表示输局,并且可能用表示平局),用于表示机器能够识别的不同方案的各种函数。如此一来,机器重新确定了这些方案的权重,以便能够玩更复杂的游戏。我将在第十章讨论这些机器的一些特性,但在这里我必须指出,机器在10到20个小时的学习和训练后已经足以击败它的程序员。我还计划在那一章讨论在类似机器上所做的一些工作,这些机器被设计用于证明几何定理,并在一定程度上对归纳逻辑进行了模拟。
所有这些工作都是程序设计理论和实践的一部分,麻省理工学院电子系统实验室已进行了广泛研究。在这里人们发现,除非使用一些这样的学习机,否则对严格模式化机器的编程本身就是一项非常困难的任务,而现在我们迫切需要对这种程序进行编程的机器。
既然学习机的概念适用于我们自己制造的那些机器,它同样适用于我们称之为动物的那些有生命的机器。这样,我们就有可能对生物控制论提出新的见解。在许多最近的研究工作中,我想特别推荐斯坦利-琼斯撰写的一本关于生命系统的控制论(请注意“控制论”一词的拼写)[18]的书。在这本书中,他们高度关注那些维持神经系统工作水平的反馈,以及响应特殊刺激的其他反馈。由于系统水平与特定响应的组合在很大程度上是乘法性的,它因此也是非线性的,并且涉及我们已经提到的那种性质。这个活动领域目前非常活跃,我希望它在不久的将来变得更加活跃。
到目前为止,我给出的记忆机器和自相乘机器的方法,在很大程度上(尽管不完全)依赖于那些具有高度专门化的装置,或者我们可称之为蓝图装置。同一过程的生理方面必须更多地与生物体所特有的机能相符,在生命机体中依照蓝图的过程被另一个不那么具体但是系统能自组织的过程所取代。本书第十章专门讨论了自组织过程的实例,即在脑电波[19]中形成狭窄、具有高度特异性的频率。因此,第十章在很大程度上补充了前一章在生理学方面的内容,我在前一章更多的是在蓝图的基础上讨论类似的过程。在脑波中存在这种谱线很细的频率,以及我关于它们是如何产生的、它们能做什么、它们可能用于什么医学用途的解释,在我看来,这都是生理学上重要的新突破。类似的想法可以运用在生理学的许多其他方面,并且能够对研究生命现象的基本原理做出实际贡献。在这个领域中,我刚才所提的在很大程度上只是计划,而不是已经完成的工作,但这是一个我寄予了深切厚望的计划。
□李郁荣
李郁荣(1904—1989年),广东新会人,1924一1930年在麻省理工学院电机工程系求学期间,经其博士导师布什介绍结识了数学系教授维纳,从此便与之开始了长期的合作,二人设计发明的新电网络装置,即李-维纳网络(Lee-Wiener Network)还获得了美国专利。在这个过程中,二人建立了深厚的友谊。在清华大学,李郁荣和维纳又继续合作,发明了新式继电器,为以后控制论的产生打下了基础。
无论是在初版还是目前这一版,我都没有打算让这本书成为控制论方面中所有成就的纲领。这既不是我兴趣所在,也不是我能力所及。我的目的是表达和扩充我对这门学科的想法,并展示最初引导我进入这个领域的一些想法和哲学思想,正是这些想法和哲学思想让我对这门学科的发展一直感兴趣。因此,这是一本高度个性化的书,书中的很大篇幅用于讲述我自己感兴趣的那些发展,而我自己并未研究过的领域则篇幅相对较少。
在修订这本书时,我得到了多方宝贵的帮助。我必须特别感谢麻省理工学院出版社的康斯坦斯·D.博伊德(Constance D. Boyd)小姐、东京工业大学的池原鹿夫(Shikao Ikehara)博士、麻省理工学院电子工程系的李郁荣博士和贝尔电话实验室的戈登·雷斯贝克(Gordon Raisbeck)博士提供的协助。此外,在我撰写这些新的章节时,特别是在第十章的计算中,我介绍了在脑电图研究中表现出来的自组织系统,对此我需要感谢我的学生约翰·C.科泰利(John C. Kotelly)和查尔斯·E.罗宾逊(Charles E. Robinson),尤其是马萨诸塞州综合医院的约翰·巴洛(John S. Barlows)博士给我的帮助。索引部分由詹姆斯·W.戴维斯(James W. Davis)完成。
如果没有以上人士的一丝不苟和大力支持,我可能既没有勇气,也无法准确地提供一个全新的修订版。
诺伯特·维纳
马萨诸塞州剑桥市
1961年3月
[1]Wiener N. The Human Use of Human Beings: Cybernetics and Society.Houghton Mifflin Company, Boston, 1950.
[2]谐波分析,又称调和分析,通过基本波的叠加以表示其他函数或信号。它对傅里叶级数及傅里叶变换进行扩展研究,自19世纪以来广泛应用于不同领域,如信号处理、量子力学、潮汐理论及神经科学等。——译者注
[3]整流器,电源供应器的一个构成部分,能够将交流电转换为直流电的装置或元件,还能够充当无线电讯号的侦测器,由固态二极管、真空管二极管、汞弧管构成。——译者注
[4]线性系统指的是用线性运算子组成的系统,其特性比非线性系统简单。——译者注
[5]Wiener N. Nonlinear Problems in Ranadom Theory, The Technology Press of M. I.T. and John Wiley & Sons, Inc., New York, 1958.
[6]随机游走指由一连串随机轨迹组成的数学统计模型。——译者注
[7]在物理科学中,粒子指的是占据微小局域的物体,可对其赋予多个物理或化学性质(如体积、密度或质量)。粒子的大小或数量存在巨大差异,从亚原子粒子(电子),到微观粒子(原子和分子),再到宏观粒子(粉末)和其他颗粒材料。粒子也可用于搭建更大物体的科学模型,前提条件是确定粒子的聚集程度(如人群中移动的人或运动的天体)。——译者注
[8]我在此使用术语“非线性系统”并不排除线性系统,而是将其包括在一个更大类别的系统内。利用随机噪声分析非线性系统同样适用于线性系统,并已付诸实践。——原注
[9]埃尔米特多项式是数学中一种经典的正交多项式族,主要用于概率论中的埃奇沃斯级数的表达式,在组合数学中充当阿佩尔方程的解,并在物理学中提供量子谐振子的本征态。——译者注
[10]在数学中,正交函数所属的函数空间是指具备双线性形式的向量空间。类似于有限维空间中的向量基,正交函数能够产生函数空间的无限基。——译者注
[11]术语“黑盒”和“白盒”是一种方便而形象的叫法,但它们的含义还不太确定。我将黑盒理解为这样一种装置,它是具有两个输入端和两个输出端的四端网络,它对现在和过去的输入电压执行确定的操作,但我们不一定要了解它靠什么结构执行此操作。另一方面,白盒也具有类似的网络,但它的输入和输出间有确定的关系,根据我们特定的构造计划,这种关系确保先前确定的输入输出关系。——原注
[12]Bose A. G., “Nolinear System Characterization and Optimization”IRE Transactions on Information Theory, IT-5, 30-40(1959)(Special supplement to IRE Transactions.)
[13]Gabor. D., “Electronic Inventions and Their Impact on Civilization”, Inaugural Lecture, March3, 1959. Imperial College of Science and Technology, University of London, England.
[14]Wiener, N., and P. Masani, “The Prediction theory of multivariate stochastic processes,” partⅠ, Acta Mathemation, 98:111-150(1957); part Ⅱ, ibid, 99:93-137(1958). Alsowiener, N., and E. J. Akutowicz“The Definition and Ergodic Properties of the Stochastic ad Joint of a Unitary Transformation,” Rendiconti del Circolo Matematicodi palermo, Ser.Ⅱ, Ⅵ, 205-217(1957).
[15]泛函,是以函数构成的向量空间为定义域、实数为值域的“函数”,依赖于其他一个或者多个函数确定其值的量,往往称做“函数的函数”。在泛函分析中,泛函也可以指一个从任意向量空间到标量域的映射。泛函中一类特殊途线性泛函促成了对对偶空间的研究。泛函的应用可追溯至变分法,但通常需寻找一个函数使某个特殊泛函最小化。——译者注
[16]Samuel, A. L., “Some Studies in Machine Learning, Using the Game of Checkers,” IBM Journal of Research and Development, 3, 210-229(1959).
[17]Watanabe, S., “Information Theoretical Analysis of Multivariate Correlation,” IBM Journal of Research and Development, 4, 66-82(1960).
[18]Stanley-Jones, D., and Stanley-Jones K., Kybernetics of Natural Systems, A Study in Putterns of Control, Pergamon Press, London, 1960.
[19]脑电波,由大脑活动状态下许多神经元同步形成的突触后电位相加而成,反映了脑神经细胞的电生理活动在大脑皮层或头皮表面的总体状态。——译者注