人工智能:智能制造
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

1.2 人工智能的发展

1.2.1 人工智能发展回顾

以1956年达特茅斯会议的召开这一标志性事件作为开端,人工智能(Artificial Intelligence,AI)发展至今已经过60余年。人工智能当然不是毫无思想基础和理论基础便横空出世的技术领域,它前承计算机、逻辑学、数学、信息论、控制论、神经网络、心理学等领域的研究成果,目标是让计算机完成人类心智(后来也包括自然生物)所能做的事情,致力于不断融合、创新,探明智能的本质,实现机器智能,包括计算智能、感知智能、推理智能、学习智能以及认知智能[4-6]

整个人工智能发展历程交织着希望与失望、高潮与低谷、失败与成功,可谓跌宕起伏。有“十年内,计算机将有能力成为国际象棋世界冠军”“经过一代人的努力,可让计算机具有与人类同等的智力水平”的盲目乐观目标,也有政府部门和企业财团大举撤资导致人工智能研究项目资金匮乏的窘境;有笙歌鼎沸的盛况,也有秋风扫落叶的悲凉;有哲学高度的批判,也有实践层面的失败;有不同流派之间争论的立场鲜明,也有因思途不畅产生的自我怀疑乃至自我否定。这一发展历程之所以如此丰富多彩,大概首先是因为人们对人类智能的认识不深、不统一。事实上,人类智能也是有层次等级的,而且人类个体的一生中其智力水平也是在不断发展的。其次,人工智能本身是个多学科融合的领域,研究者各方背景不同,观点自然不同。所幸,人工智能领域作为一个独立学科领域的地位日益坚不可摧,并且仍在不断发展壮大,也深刻地影响着人类经济、社会、军事等各个方面。

人工智能有所谓三个流派:符号主义流派、联结主义流派和行为主义流派。虽然不同的流派因关注人类(自然生物)的不同智能而选择的理论基础和道路不同,但是无论哪个流派,都在朝着智能实现的目标努力。不同流派人工智能发展历程见表1-1。

表1-1 不同流派人工智能发展历程

img

续表

img

1)符号主义人工智能

符号主义人工智能的基本观点是,知识和推理是智能的基础。其代表理论是物理符号系统假说,认为无论是机器智能还是人类智能,其本质都是符号的操作和运算,更具体地强调机器应具有推理能力,并通过推理解决问题。由于该流派坚持人工智能只能通过符号系统和逻辑实现,所以也被称作逻辑主义人工智能流派。另外,符号主义人工智能聚焦于人类高级智能行为,例如搜索、推理、规划等。

机器定理证明不仅是符号主义人工智能的重大成果,也是人工智能最先取得重大突破的领域之一。事实上,在达特茅斯会议的前一年,即1955年,Allen Newell和Herbert Simon就开发了“逻辑理论家”程序,完成了罗素《数学原理》第2章38个定理的证明。进而,1957年,Allen Newell等人提出不依赖特定领域的通用问题求解器。1965年,罗宾逊提出逻辑推理的归结原理,代表着为期10年的人工智能发展第一次高潮的终结。人工智能从高潮进入第一个低谷期,但正是在低谷中孕育出了知识工程。

在批判前10年人工智能聚焦于“玩具世界”“闭世界”人工智能系统和强调通用人工智能系统的基础上,1968年,Edward Feigenbaum等人开发了第一个专家系统——DENTRAL系统,用于进行基于质谱仪数据的化学结构推理。1975年,Edward Shortliffe等人开发了细菌感染诊断专家系统——MYCIN系统,提出了考虑确定性因子的不精确推理。在强调知识重要性的基础上,Feigenbaum在1977年的国际人工智能联合大会上首次提出“知识工程”的概念,以开发专家系统为主要内容,让机器使用专家知识和推理解决实际问题。专家系统和知识工程掀起了人工智能发展的第二次高潮。

由于专家系统定位于专业知识的运用,不可避免会遇到知识获取难题。而且人们很多时候并不一定需要专家知识,更多的是需要常识。常识是人类通过身体与世界直接或间接交互体验认知而得到的经验知识。这类知识无需言明便可被理解或意义自明。常识和专业知识都不可缺少。美国Douglas Lenat等人实施的Cyc项目旨在开发百科全书式的常识知识库。该项目始于1984年,试图将人类的所有常识进行编码而建立知识库,利用人工方法将上百万条人类常识编码成机器可用、可理解的形式,用于与常识相关的智能推理。Cyc也被认为是最早的知识图谱。

对专家系统的批判之一是专家知识实际上是浅层知识,而现实事物的结构、行为、功能等深层知识(第一原理)才是解决专家系统知识获取困难以及知识受限问题所必需的。为此,从20世纪70年代末到80年代初,人工智能领域出现了一个新的研究分支——定性物理或定性推理(也称作基于模型的推理)。具体来讲,定性推理通过对物理系统结构的描述和分析推导出系统的状态变化(行为预测),并解释行为之间的因果关系,确定系统功能或作用[7]。1984年和1991年,《人工智能》杂志分别刊出两期定性推理专辑。定性推理发展出定性仿真、定性过程理论、定性因果推理、功能推理、定性空间推理等分支理论。

知识表示一直是符号主义人工智能的重要内容之一。早期的规则、框架、语义网络(Semantic Network)等都是知识表示方法。互联网的发展以及大规模知识库的必要性,导致新的知识表示方法的出现。1989年,Tim Berners-Lee提出构建广域链接信息系统,后来于1998年提出将客观世界实体和语义链接的语义网(Semantic Web,与前面提到的语义网络相区分)。这个实际上的事物概念网成为了现在的知识图谱的基本形式。终于,在2012年,谷歌正式推出被称为知识图谱的搜索引擎服务。知识图谱引领着知识工程进入了大数据知识工程的新阶段。其实,知识图谱的本质仍然是语义网络,是一种由点和边组成的图形化知识表达方式[8]。当然,知识图谱也是一种知识组织方式。

总之,符号主义人工智能源于数理逻辑,总体上经历了符号逻辑系统、专家知识工程(专家系统)、常识知识工程、专业知识工程(定性物理学、定性推理、基于模型的推理)等阶段,进而进入大数据知识工程阶段。符号主义人工智能的核心思想是知识表示、推理和知识应用。

2)联结主义人工智能

联结主义人工智能的基本观点是,人工智能必须能够模仿大脑的功能,更具体地强调机器应具有学习能力和认知能力,通过学习来解决问题。联结主义人工智能特指感知机、神经网络发展的机器学习,广泛意义上也可以包括强化学习以及其他机器学习方法。联结主义人工智能主要解决模式识别、聚类、分类、联想等非结构化问题。

早在20世纪40年代,Warren McCulloch和Walter Pitts开创了集成认知神经学、脑科学和数理逻辑计算的计算神经学,提出了最早的神经网络模型,给出了神经元的形式化数学描述和网络结构,证明了单个神经元能执行逻辑功能。1958年,Frank Rosenblatt将感知器建立在一个非线性神经元上,得到了神经元的McCulloch-Pitts模型。这是在计算机有限运算能力的条件下,基于硬件结构建立的第一个可进行模式识别的单层神经网络模型。但在此后的一段时间内,神经网络模型仍然无法测试,而且连比较基本的异或(XOR)逻辑运算都不能实现,即便多层神经网络也不具有低复杂度,相关研究进入了长达20年的停滞状态。

1974年,哈佛大学的Paul Werbos首次提出误差反向传播算法,不仅解决了异或运算问题,而且大大提升了神经网络迭代计算效率。直到20世纪80年代,神经网络才再度迎来研究高潮。1982年,John Hopfield提出了可用作联想存储器的互连网络模型,被称为Hopfield神经网络模型。该模型是一种从输出到输入有反馈连接的循环神经网络。1986年,David Rumelhart、Geoffrey Hinton等人在神经网络上应用了反向传播算法。1989年,Yann LeCun等人受日本学者福岛邦彦提出的仿生视觉皮层neocognitron神经网络模型等的启发,构建了应用于计算机视觉问题的包含2个卷积层和2个全连接层的神经网络,正式提出了卷积神经网络,并于1998年构建更完备的卷积神经网络LeNet-5,成功用于解决手写识别问题。

2006年,Geoffrey Hinton等人发表文章,提出将预训练、自编码器与深度神经网络结合,开启了深度学习(深度神经网络)在学术界和工业界的研究与应用浪潮,相继在语音识别、图像识别等领域开展应用,显著降低了错误识别率。2011年后,深度学习开始将卷积层与最大池化层合并,并将其输出传递给几个全连接层,再传递给输出层。2013年4月,美国麻省理工学院(MIT)的《麻省理工科技评论》(MIT Technology Review)将深度学习列为2013年十大突破性技术之一。2014年,当时还在蒙特利尔大学读博士的Ian Goodfellow等人提出生成对抗网络概念,使得神经网络系统不仅能够更好地生成图像与声音,还能识别它们,从而奠定了无监督自主学习算法框架的基础。2015年,谷歌DeepMind提出正式的Deep Q Networks系统。2016年,融合了深度学习、强化学习和蒙特卡罗树搜索方法的AlphaGo战胜了世界围棋高手李世石。这些研究让联结主义人工智能大放异彩,也是当前人工智能高潮形成的主因。

其他机器学习方向也在不断取得成果。早在1952年,IBM科学家Arthur Samuel开发了一个跳棋程序。该程序能够通过观察当前位置,并学习一个隐含的模型,为后续动作提供更好的指导。从1984年开始,Leo Breiman等人相继提出了适用于分类和连续输入(特征)/输出(预测)变量回归预测建模问题的决策树算法和多决策树组合的随机森林算法,后者属于集成学习范畴。1995年,由Corinna Cortes等人提出了支持向量机的概念,通过Kernel的技巧将低维空间线性不可分或难分的样本数据点映射至高维空间使其线性可分,在解决小样本、非线性以及高维模式识别问题方面具有明显优势。

总体而言,联结主义人工智能源于仿生学、生理学,从一开始便是重要的人工智能研究分支,虽然也有数次研究小高潮,但是直到进入21世纪才迎来了爆发式发展。其中的一个重要原因就是,人们终于找到了神经网络、机器学习的有效应用领域,充分体现了感知智能、学习智能和认知智能的力量。

3)行为主义人工智能

行为主义人工智能的基本观点是,比人类低级的简单动物也具有非凡的智能,人工智能必须能够模仿这样的智能行为。行为主义人工智能更具体地强调机器应具有与环境之间的互动能力,通过交互解决问题。行为主义人工智能并不以人类智能为研究对象,而是特指对自然事物,特别是自然生物的模拟,也被称作自然主义或进化主义人工智能。行为主义人工智能虽然擅长解决适应性、学习等问题,且具有一定的解决识别、聚类、联想等问题的能力,但是对问题求解、逻辑运算等束手无策。

机器人是人工智能领域的重要分支,是软硬结合的智能体。最早,符号主义人工智能将与机器人相关的规划问题当作重要研究对象之一。而美国MIT的Rodney Brooks从1984年开始致力于机器人(昆虫)智能的研究,用简单的指令和传感器控制机器人执行简单的任务,倡导所谓“无理由(推理)的智能”,开发出了一系列包括六足行走机器人在内的基于感知-动作模式模拟昆虫行为的控制系统。2005年,波士顿动力公司研制了四腿机器大狗,它能够在复杂地形行走、攀爬、奔跑,甚至能实现在遭受撞击后的自平衡。

行为主义人工智能不仅以智能生物机器作为成果,也模拟自然界的生物进化或其他活动,从而开发了众多智能算法。20世纪60年代,德国Ingo Rechenberg等人受达尔文进化论的启发提出了进化策略。1967年,美国密歇根大学John Holland教授的学生Bagley在他的博土论文中首次提出了遗传算法这一概念,讨论了遗传算法的博弈应用。1975年,John Holland出版专著《自然和人工系统中的适应》,系统地阐述了遗传算法的基本理论和方法。20世纪80年代中期之后,遗传算法进入兴盛发展时期,被广泛应用于自动控制、生产计划、图像处理、机器人等研究领域。

融合机器昆虫和进化计算,诞生了“人工生命”新学科。1987年,美国计算机科学家Christopher Langton在“生成以及模拟生命系统的国际会议”上提出“人工生命”的概念,关注如何用计算的手段研究和模拟一般生命现象和地球上特有的生命现象,认为生命智能实际上是底层单元通过相互作用而产生的涌现行为。换句话说,人工生命模拟的就是这一涌现过程,典型应用之一是模拟群体行为。1992年,Macro Dorigo发现在蚂蚁觅食过程中,单个蚂蚁的行为虽然比较简单,但是蚁群整体却可以体现一些复杂的智能行为。考虑蚁群可以在不同的环境下,通过某种信息机制实现信息的传递,寻找到达食物源的最短路径,提出了蚁群算法。后来该算法用于解决各种工程实践优化问题。1995年,James Kennedy和Russell Eberhart受飞鸟集群捕食活动的规律性启发,提出了基于群体智能的粒子群算法,利用群体中的个体对信息的共享,使整个群体的运动在问题求解空间产生从无序到有序的演化过程,从而获得最优解。

现代计算机之父冯·诺依曼提出了能够自我繁殖的细胞自动机概念:存在一组处于某种状态的细胞或系统基元(自动机、智能体),其下一状态由其周围细胞的状态、自身的状态以及事先定义好的一组简单规则决定。细胞自动机发展的一个分支是现在的强化学习。强化学习也强调智能体与环境的互动,其基本原理就是智能体根据经验改变策略以获得长期最大奖赏的过程,理论基础是马尔可夫决策过程和动态规划。1989年,英国剑桥大学Christopher Watkins提出了著名的强化学习(Q-Learning)算法。

行为主义人工智能源于控制论和进化论,以低层次的自然智能实现为目标,虽然没有促成人工智能发展的高潮,但是其主要成果的智能优化算法(特别是群体智能算法)和智能机器人得到了普遍应用,实现了群体智能、自适应智能和协同智能。

1.2.2 新一代人工智能

近十年来,在互联网、物联网、云计算、大数据等新一代信息技术发展的推动下,同时以深度学习为代表的机器学习方法在图像处理、语音识别、自然语言处理等领域的成功应用,掀起了新一轮的人工智能浪潮。国家重新将人工智能作为科技战略高地,制定国家战略发展规划,从国家层面全面推进人工智能的发展。科技巨头大力发展人工智能业务,新创人工智能企业如雨后春笋,新产品层出不穷。各行各业热切接纳人工智能的应用,促进与人工智能产业的融合发展[9]

2016年10月,美国发布《国家人工智能研究与发展战略计划》,积极布局,加强联邦政府资助,突出人工智能的基础研究、人机交互、社会学、安全、数据与环境、标准以及人力资源等七大战略方向。2018年4月,欧盟委员会提交《欧盟人工智能战略》报告,描述了欧盟在国际人工智能(AI)竞争中的地位,并制订了欧盟AI行动计划。其目标在于增强欧盟的技术与产业能力,推进人工智能的应用,并在2018年12月,发布《人工智能协调计划》,以促进欧洲人工智能的研发和应用。该计划的主题为“人工智能欧洲制造”(AI Made in Europe),并预计到2020年,欧盟及其成员国公共部门和私人部门将在人工智能方面投资200亿欧元。《日本再兴战略2016》将2017年确定为日本人工智能元年,其目标是通过大力发展人工智能,保持并扩大在汽车、机器人等领域的技术优势,逐步解决人口老龄化、劳动力短缺、医疗及养老等社会问题,推进超智能社会5.0建设。日本政府进一步出台了《下一代人工智能推进战略》,明确了人工智能发展的技术重点,推动了人工智能技术向强人工智能和超级人工智能方向延伸,并制定了人工智能产业化路线图,计划推进利用人工智能大幅提高制造业、物流、医疗和护理行业的工作效率。

我国同样高度重视人工智能的发展。2017年7月,国务院正式印发《新一代人工智能发展规划》,统筹各方力量,加大人工智能的研究、应用力度。规划提出到2030年的三步走发展战略目标,逐步提高我国人工智能理论、技术与应用总体水平。国家科技部于2018年启动实施科技创新2030——“新一代人工智能”重大项目,作为落实国家新一代人工智能发展规划的重要工作。该重大专项的总体目标是,以推动人工智能技术持续创新和与经济社会的深度融合为主线,按照并跑、领跑两步走战略,围绕大数据智能、跨媒体智能、群体智能、混合增强智能、自主智能系统等五大方向持续攻关,从基础理论、支撑体系、关键技术、创新应用四个层面,构筑包含知识群、技术群和产品群的生态环境,抢占人工智能技术制高点,妥善应对可能由此带来的新问题和新挑战,促进大众创业、万众创新,使人工智能成为智能经济社会发展的强大引擎。

2017年,中国工程院院刊《信息与电子工程前沿(英文)》刊登了“Artificial Intelligence 2.0”专题,系统阐述了人工智能2.0的重点方向。所谓人工智能2.0,指的是“基于重大变化的信息新环境和发展新目标的新一代人工智能”。信息新环境涉及互联网、移动互联网、传感网、大数据等。新目标是指对人工智能有迫切需求的产业模式和形态,例如智能经济、智能制造、智能医疗等。新一代人工智能新技术包括大数据智能、跨媒体智能、自主智能、人机混合增强智能和群体智能等。这些新技术本身体现了人工智能的发展新阶段:一是从传统知识表达到大数据驱动知识学习;二是从分类型处理视听文字多媒体数据到跨媒体认知、学习和推理;三是从追求“智能机器”到高水平的人机协同融合;四是从“个体智能”到基于互联网络的群体智能;五是从机器人转向更广阔的智能自主系统,从而促进智能机械、装备和产品的创新与升级。