1.6 工具和系统的贡献
在本书中,工具和系统是指所有人造物,简单工具、机械设备、生产线、自动化系统,建筑物、道路、管道、电网、水网、信息网、作为整体的城市基础设施,从简单加工过的木棍、石块到最复杂的机械设备,具有信息处理功能的机械系统或专注于处理信息的信息系统,包括人工智能系统。就智能发展而言,1.7节讨论的逻辑和知识也是一类特殊的工具或系统,但不在本节讨论。工具和系统是我们认识智能及其进化、发展、使用的另一个重要领域。
1.6.1 工具与智能
工具与智能呈现复杂的多元关系。一般而言,有些动物也能简单加工或利用自然材料,如树枝、石块作为工具,但本书讨论的范围仅限于人创造的工具。下面分别从工具是智能的产物、不同类型工具对智能发展和智能使用中的作用、工具的客观性、独立性分析等内容作综合性介绍。
1.工具与人同步诞生
用遗传基因和人类学的研究方法可得,人与猿的分离在460~620万年前[96]。2015年4月16日,世界科技研究新闻资讯网报道,由美国石溪大学学者索尼娅·哈尔曼德率领的考古团队在美国旧金山古人类学会年度会议上宣布,他们发现了人类祖先使用的最古老的工具,包括石头原料、刮削器和砍砸器等。考古学家对在此遗址发现的骨骼化石进行了年份测定,并得出其年份为距今大约340万年前。无独有偶,科学家在埃塞俄比亚发现了340万年前的古人类用骨制刀具切肉的化石(图1.26),这种刀具用尖锐的骨头做成,用来从动物骨头上剔下肉,并敲碎骨头,以摄取内部营养丰富的骨髓[97]。
图1.26 埃塞俄比亚发现340万年前切肉刀
从一般常识推论,树枝类的简单工具应该早于石块类工具。人与猿的分离,是从树上到地上,使用、掰折树枝的概率应该大于使用石质材料,在生活或狩猎中的可用性也很强,只是木质易于腐烂,难以经历数百万年岁月。
2.每一个历史阶段的工具代表了这个阶段人类的认知水平
从掰折的木棍、磨砸的石块到数控机床、计算机系统、航天器、人工智能系统、现代化城市的基础设施,每一个历史阶段的工具都集中体现了这个时期人类的智力水平。
农业时代的纺车、水车、犁、弩、计时装置、指南针、建筑工具、计算工具、水力和火药的利用等,都是现代科学技术诞生之前人类认知水平的结晶。如图1.27所示,巧妙地利用水力推动9个磨的运转,替代了人力,提高了加工能力[98]。图1.28则是中国学者张衡将天文知识与机械制造能力结合起来构建的浑天仪。
图1.27 天工开物所载9轮水力磨
图1.28 张衡及其改进的浑天仪[99]
经历文艺复兴和工业革命,人类对物理世界的认知达到前所未有的高度,工具制造随之突飞猛进。蒸汽机、电机、发电系统、核电为其发展提供了不绝的能源,各类机床承担不同类型和性质的机械加工任务,各类炉子利用温度、压力、化学反应等原理,制造出新的材料,矿山机械挖掘矿产,纺织机械纺纱织布,运输机械将人和物运送到相应目的地(图1.29),观测设备探索宇宙、大地、海洋、生物、社会和人的奥秘,代表工业文明综合能力的城市基础设施随技术发展而不断升级……。工具始终与科学技术的进步连接在一起,是科技进步最主要的标记,是人类智能的最直接的表达。
图1.29100多年前的汽车,主要由机械和动力装置构成
计算机发明以来,信息处理设备及机械、动力、信息处理三大部分成为这一阶段工具的特征。以1946年美国宾州大学UNIVAC计算机的诞生为代表,计算设备经历了比上个阶段更快的速度发展,已经应用到经济、社会、生活和军事的各个领域,网络无所不在、计算无所不在已经成为工具发展的一个新特征。随着计算机为代表的处理设备的发展,专门处理信息的系统也不断扩展,从国防、企业、政府机构到百姓家庭,信息处理系统成为今天完成各项事务的基本工具。计算性工具和机械、能源、运输、制造等工具结合,产生了自动化、半自动化的新的工具或系统。单一的设备如汽车(见图1.30)、飞机、机床,信息部件成为标准配置,数控机床替代了普通机床;美国F22战机有两万多个传感器和惊人的计算、通信能力;许多中高端汽车中,计算相关部件和系统占总价的50%以上。连续型制造的自动化能力全面具备,离散型制造的自动化生产线不断增加。具有一定智力水平的系统快速发展,并出现在某些领域达到或超过人的智力的人工智能系统,例如下围棋,Alpha Go的水平已经超越所有人类围棋手。
图1.30 今天的汽车,信息部件成为重要构成部分
3.工具是人认知功能的延长
从最早的简单工具开始,工具一直承担着延长人认知功能的作用。盲人或正常人在伸手不见五指的黑夜,借助一根木棍来感知看不到的地方,使用工具的过程,就是增进人认知能力的过程。
为了感知人自身感知不到地方,人类创造了很多工具来补充自身认知能力的不足。望远镜和天文望远镜等弥补视觉的不足,温度计、湿度计、压力计等弥补触觉的不足,血压计、核磁共振等弥补对人自身感知的不足,遥感卫星、深海探测器等弥补对地球感知的不足……。2万多种并在持续增加的传感器,将使感知无处不在,为人类认识世界、把握事物运动规律、发展智能发挥着不可替代的作用。计算机、传感器、信息网络等工具已经成为认知能力进一步发展的必要条件。
4.工具是人智能的一类承载体
工具是人制造出来的,但一旦制造出来,它就是一个独立的客体,一个将人的智能固化在工具中的知识载体。这个载体外在于人的大脑,因此它的知识可以为任何看到、使用和研究它的人获得,成为学习和知识传播的载体。
工具主义者和部分研究客观知识的学者,将工具作为知识的第三种形态。第一种形态是人的精神世界或大脑中存在的知识,第二种形态是记录下来的知识,第三种形态就是各种人制造的物件,简称工具。有学者认为“人类在知识基础上打造的工具,使工具带有知识的印记”,工具中的知识是集成态知识,“集成态知识是人类确切、可靠的成果知识”, “集成态知识以工具的形态结构积累与传承人类知识,因此,集成态知识的发展史,就是人类工具的发展史,反之,人类工具的发展史,也是人类知识集成的演化发展史”[100]。
玛雅文明神秘消失,遗留下来的玛雅古城遗址,它的建筑和城市设施,成为后人研究玛雅文明、玛雅人智能的主要载体。
5.人与工具及系统一起解决问题、完成任务
工具之所以被制造出来,是人为了适应环境、改变环境,是为了自身的生存和发展需要,是为了协助人类解决面临的各种问题,协助人类完成需要承担的各项任务。
工具服务于人的生存和发展是一个不证自明的结论。从山洞、泥草房到摩天大楼,从踩出来的路到高速公路、铁路,从钻木取火到数控机床,从水力纺车到特高压电网,从青铜器锻造到特种钢冶炼,从算盘到计算机,一个个工具的诞生和一条条技术路径的进路,就是人类解决问题能力的提升。
6.工具全面影响智能发展
智能的发展是有条件的,工具是满足这些条件的一个重要环节,有三个主要的作用。
一是延长了人的认知能力。如何延长人的认知能力,在前面已经介绍。智力的发展在一定意义上基于认知能力,在1.1节和1.2节的介绍中,已经说明了这一因果关系,这里不再赘述。在这个方面,也许简单改造过的树枝和石块对人类认知能力的提升比天文望远镜、遥感卫星的贡献还大。信息处理设备和人工智能的发展,更加直接地提升了人的认知能力,加快了智力增长速度和智能发展的速度。
二是改善了人的生存条件。生存是智能发展的前提。生命的延长、生活质量的提高与智能的发展正相关。经济和社会发展水平的提升使一部分人从为生存而劳动的状态中摆脱出来,使这些人有时间学习和创新,使其他的人的劳动时间减少,有更多的时间接受教育、培训和创新,这样的人越多,这样的时间越多,人类智能的发展越快。
三是工具成为知识传播的工具,成为跨越时空传播知识的载体,成为模仿学习的样本,也就是智能发展的材料。从上古时期到今天,许多创新和工具在不能直接交流的其他时空诞生,都与工具相关。
7.工具是一类独立的智能体
这里所说的工具是一类独立的智能体,有两种不同的含义。第一类是工具主义和第三态知识论者所指称的独立性,即工具一旦问世,就具有不以创造者主观意愿转移的生存和发展空间。第二类是指工具能在一定的条件下,成为自主发展的智能形态。区别在于,第一类是被动的,个体上存在与延续不受制于具体的创造者或制造者,但整体上依赖于人类。第二类则是主动的,不依赖于人类实现自我发展。
对于第一类独立智能体,在工具是人类智能的载体的讨论中实际上已经确定,我们可以从工具进化史看到这一性质。对于第二类独立智能体,现在已经有雏形,但还需要进一步的发展,才能产生真正的独立发展的非生物智能体。当前阶段的人工智能系统尽管已经在两个方面取得重大进展,即在局部领域超过人的智能,在一定范畴能进行自主的或超越人赋予的学习能力,产生有意义的结论,但整体看,它的智能是人赋予的。
部分工具,主要是具有智能性质的系统,将经历一个从赋予式主体到协同式主体,再到独立性主体的发展过程,这个过程将在第3章展开讨论。本节主要讨论工具和系统中的智能发展。
1.6.2 简单工具和非数字机械的贡献
生物智能从原始生命体到完整的细胞经历了漫长的进化岁月,远远比单细胞生物进化到现代人所花去的时间长。从简单工具进化到复杂的智能系统也是如此,从简单工具进化到具有专门信息处理功能的工具所需要的时间远远超过从具有信息处理功能的工具产生到智能系统的时间。
从功能看,从简单工具进化到具有专门信息处理功能的工具,如同原始生命体进化到单细胞生物。这类工具可以分成三类:单部件、多部件组合、连接式控制。
单部件的工具种类繁多,历史悠久。从前面提到的与人的进化同步的石块、木棍到今天大量使用的各种简单工具,如木工工具、切菜等生活工具等,这类工具不具备主体性,完全由人操纵使用;这类工具不具备信息性,没有任何信息处理能力;这类工具的功能性十分简单,斧子的砍削功能、木工钻的钻洞功能、针的缝衣功能,等等。这些功能虽然简单,但功能本身是复杂机械和自动化机械基本功能的构件,这些部件为人制造复杂工具提供了基础,增加了多方面的经验和知识,可以类比生物进化原始生命体产生之前的含有生命特征的物体。
多部件组合工具是指该工具是由多个部件组合而成,但只是传递力或机械运动,不存在对行为控制功能的工具,手动纺车、龙骨水车、马车、早期的车床等都是这类工具。
如图1.31所示,没有控制单元的普通车床,它一般由伺服电机、轴箱、进给箱、溜板箱、刀架、尾架、光杠、丝杠和床身等部件构成。手动开关控制伺服电机提供动力,手工控制加工部件。这样的车床有传动装置为加工提供动能,有机械运动部件为加工提供移动平台,有紧固件和刀具为加工提供操作平台。上述功能超越了体能,但所有功能的实现都有人的操作。这是经典的工具与人的智能结合的例子。在1.2~1.4节中,已经多次讨论人的智能行为是由控制和运动能力共同实现的。从这个角度看,普通车床不仅提供了动力和工作平台,这些部件本身是智能的不可分割的一部分。换言之,机床的传动装置、移动装置、工具运动装置都隐含着智能,如同人的很多运动功能是人的本能一样,在完成加工一个特定的机械部件的智能任务中,车床的这些功能是智能的有机组成部分,不可分割。但车床没有主体性,只有功能,主体性是由人完全掌控的,或者说,这些独立的、具有一定智能特征的能力,是人的智能的延长。
图1.31 普通车床
连接式控制工具是指本身具有一定的控制能力,即工具有一部分功能的实现不是人来控制的,而是工具本身具有控制能力,但这种控制又是基于机械传动,而不是由信息处理系统实现。
在如同人的认知功能一样,通过信息处理系统控制工具或系统的运行之前,古人的智慧创造了很多巧妙的通过机械传动实现功能自动实现的工具。汽车、飞机、火车、织机……大量机械装置实现了非信息处理的自动控制,下面以机械表和提花织机为例进行说明。
机械表由发条提供动力,由游丝震荡提供计时频率,由擒纵机构保证振动的稳定性并计算摆动次数,由齿轮传动实现计时功能,包括时分秒及星期、日期的计时,如图1.32和图1.33所示。
发条或振动为手表提供能量,以均匀小量地分配给振荡器,并产生稳定的振动频率。提供的能量通过轮列组,由轮列组以相同比例缩减传输力的同时增加圈数,擒纵轮铆压在该齿轮上。擒纵轮是分配机构及计数器。条盒轮转一圈约6小时,在此段时间内,擒纵齿轮和擒纵轮转约3600圈。这个数字代表第一只轮和最后一只轮之间的旋转频率比,该比例始终在此数值范围内。一般都设法使擒纵轮和分轮在手表的中心,并每小时转一圈。而其他的时间显示则在此基础上通过齿轮比例传动实现。
图1.32 海鸥机械表
图1.33 机械表的齿轮传动式控制[101]
电子表和机械表具有相同的功能。机械表完全靠机械传动实现计时、控制、计算和显示,而电子表则通过信息处理部件和程序实现这些功能。
还有一种织提花布的机械,有人更称之为计算机,但是没有使用任何的电子信息处理功能。这就是1801年,法国人约瑟夫-玛丽·雅卡尔(Joseph-Marie Jacquard)制成的脚踏式提花机(见图1-34),使用了由穿孔卡片组成的纹板传动机构,带动一定顺序的顶针拉钩,根据花纹组织协调动作,提升经线织出花纹,只需一人操作就能织出600针以上的大型花纹。
图1.34 雅卡尔提花织机[103]
从功能角度看,机械表和提花织机如同生物细胞中的一个细胞器,但是没有复制功能,没有自主生长能力,没有主体性。细胞器在生物智能发展中具有重要位置,非数字模式,但具备计数、控制能力的工具在非生物智能的进化中同样具有重要的位置,它们为后续讨论的计算工具和带有信息处理能力机械的发展提供了基础。
1.6.3 计算工具的贡献
计算是人类生存和发展过程中必然产生的需求,也是认知能力的重要组成部分。计算工具在智能发展中占有重要的位置。计算工具经历了数万年的发展,而在计算机发明之后,这个进程猛然加速,为非生物智能的发展奠定了第一个重要的基础。从结绳记事、算筹、算盘、差分机,一直到电子计算机,计算工具经历了从简单到复杂、手动到自动、计算能力持续高速增长的历史过程。计算工具对智能发展的贡献主要体现在三个方面,即参与人类逻辑能力提升进程,增强人类计算能力,将行为与逻辑、物理和信息黏合为统一的智能体。
1.参与人类逻辑能力提升进程
对人类智能研究做出重大贡献的著名心理学者,如皮亚杰、加纳德、萨迦德等,都把逻辑能力作为一个重要的研究方向,认知神经科学也将逻辑功能作为大脑研究的一个方向。
计算工具既是人类智能的产物,又为人类认知能力中逻辑能力的提升发挥了重要作用。为了计数,为了将计算好的结果告知别人,人在进化的早期通过扳手指、数石块计数,用树枝的不同摆法表示不同的数字,这些努力在增强计数能力的同时,也使人的逻辑功能通过海马和大脑皮质的记忆功能得到强化,并进一步在遗传基因中得到反映和强化。
遍布于世界各地的古文化,都形成了自己的计数系统,中国在春秋战国甚至更早的时候用算筹来计数,达到了很高的水平。如图1.35所示,这种形式的算筹,对形成汉字的数字描述系统具有现实的意义,而数字的产生是逻辑体系的一个基石。
图1.35 中国2000多年前的算筹
计算工具的诞生,产生了如何用好这些工具的逻辑需求,特别是电子计算机的使用为一些逻辑工具的发展提供了土壤,特别是对离散数学、数据结构化的算法和问题求解的模型和算法。
2.增强人类计算能力
这是计算工具对智能发展最显而易见的贡献。人类智能的特征决定了计算能力的不足,需要外在的工具补充,可以说,没有外在的计算工具,人类不可能取得如此大的智能进步。这也是为什么计算工具几乎伴随人类社会的发展而发展,至今尚未停步。
在计算工具发展史上,算盘是第一次得到广泛使用的计算工具,大约在1000年的时间内,它大量使用于各种商业活动中。第二次是1621年英国数学家威廉·奥特雷德发明、后经瓦特等科学家改进的对数计算尺。它不仅能进行加、减、乘、除、乘方、开方运算,甚至可以计算三角函数、指数函数和对数函数,一直被使用到袖珍电子计算器面世。在300多年的时间内,使用对数计算尺是理工科大学生必须掌握的基本功,是工程师身份的一种象征。
随着工业技术的进步,欧洲出现了利用齿轮技术的计算工具。1642年,法国数学家帕斯卡(Blaise Pascal)发明了人类历史上第一台机械式计算工具。1673年,德国数学家莱布尼茨(G .W .Leibnitz)研制了一台能进行四则运算的机械式计算器,这台机器在进行乘法运算时采用进位—加(shift-add)的方法,后来演化为二进制,被现代计算机采用。1822年,英国数学家查尔斯·巴贝奇(Charles Babbage),开始研制差分机,专门用于航海和天文计算,1832年研制成功,这是可编程计算机的雏形,如图1.36所示。此后,美国统计学家赫尔曼·霍勒瑞斯(Herman Hollerith)用穿孔卡片存储数据,用机电技术取代了纯机械装置,制成了可以自动进行加减四则运算、累计存档、制作报表的制表机。这些计算工具,为电子计算机的诞生拓清了大量的逻辑和结构性难题。
图1.36 巴贝奇差分机
第二次世界大战中,美国宾夕法尼亚大学物理学教授约翰·莫克利(John Mauchly)和他的研究生普雷斯帕·埃克特(Presper Eckert)受军械部的委托,为计算弹道和射击表启动了研制ENIAC(Electronic Numerical Integrator and Computer)的计划,1946年2月15日,这台标志人类计算工具历史性变革的巨型机器宣告竣工。ENIAC每秒能完成5000次加法,300多次乘法,比当时最快的计算工具快1000多倍。ENIAC的出现标志着电子计算机(以下称计算机)时代的到来[104]。
20年后,计算机进入集成电路时代,摩尔定理成为计算能力进化的经典规律。50多年来,计算机系统的性能一直在摩尔定理的支配下发展,价格也持续下降,成为大众化普及的计算工具。计算机性能的提高,激发出更多的计算需求,需要更多类型、更高性能的计算机系统,这是50多年发展历史所证明的结论。计算工具在两个方向不断前进,一个方向是高性能计算,从超级计算中心到通过网络实现计算能力汇聚的网格计算、互联网数据中心和云计算,2017年位列超级计算机第一位的运算能力达到每秒93.01千万亿次;另一个方向是适应不同信息处理需求的小型化,微型计算机、智能手机比大型机或高档服务器具有更广泛的应用空间,工控系统、自动化设备和家用电器,都成为计算部件栖身的地方,计算走向无处不在。如果将计算工具在经济、社会、军事、公共管理等各个领域的计算量汇集起来,再假设这个计算能力失去,社会将会怎样、人类智能进化将会怎样?社会即刻倒退数百年,科技无力取得新的进展,这就是计算工具的力量。
3.将行为与逻辑、物理与信息黏合为统一的智能体
计算工具的发展,特别是小型化、低功耗、高可靠计算芯片的发展,计算无所不在的趋势,使之成为将智能体中的行为与逻辑、物理与信息黏合在一起的黏合剂,这在智能的发展中是另一个具有里程碑意义的功能。
任何智能行为,都具有行为与逻辑、物理与信息的双重功能需求,将两者黏合为一个统一体,是智能发展的必然要求。
不仅在智能制造、智慧医疗、无人工厂式农作物生长车间等领域的应用,需要将这两个侧面融合起来,就是在所谓纯信息的智能系统,也需要两者的融合。下围棋的人工智能,后台的处理系统需要物理部件支撑,前台下棋这个行为的实现,需要物理部件的行为能力。下面将更深入地分析这个主题。
1.6.4 数字机械和自动化系统的贡献
信息技术的发展,特别是上面所述计算工具的黏合或融合功能,使得越来越多的工具带有信息处理部件,具备基于信息部件的控制能力,本书把这类工具称为数字机械。数字机械的发明推动工具智能进入新阶段,这个阶段对智能的贡献主要有三点:任务式工具研制、自动控制、物理和信息协同。下面以数控机床为例,说明具有信息处理功能机械对智能的贡献。
1.任务式工具研制
装备是工业之母,机床是装备之母。满足装备工业发展需求是数控机床发展的动力,换言之,数控机床的发展基于装备制造加工任务的需求,数控机床以及其他具有信息处理和自动控制功能的工具,如高炉、洗衣机,都是围绕需求研发的。围绕社会需求研制是这类工具的普遍特征。
数控机床发展的动力来自加工精度越来越高、加工形状越来越复杂、需要的加工能力越来越多的社会需求。这些需求成为数控机床研发机构和企业研制新机床、实现新加工需求的紧迫任务。当然,这也是基于技术本身的进步,我们看到,每一步技术进步都会很快在数控机床的发展中应用,机床的研制基于制造的需求和技术的进步。
精度要求达到微米级和纳米级的,主轴转速要求达到10000r/min,工件移动速度要求达到120m/min,加工方式要求具备镗、铣、车、削,控制轴数要求达到五轴,还有可靠性及加工能力等方面的要求,这构成了数控机床研制这个任务的技术指标,也就是任务决定了研制的目标。当然,这些指标是需要相应的技术支持的,所以目标的提出是以所需技术的存在及工程上可实现为前提。数字交流伺服电机和驱动装置,高技术含量的电主轴、力矩电机、直线电机,高性能的直线滚动组件,高精度主轴单元等机床功能部件,为机床向高速、精密发展创造了条件。
这样的加工精度、速度,必须具有相应的控制系统,具有将区里运动和加工过程控制融合一体的能力,这就是以下两个部分的内容。从上面的分析,数控机床就是根据需求和技术条件研制的具有相当智能的工具。
2.自动控制
数控机床的定义决定了它具有自动控制功能,控制系统能力也在数控机床不断发展的过程中提升。先进的数控机床只要将加工部件的相关参数输入,就能自行完成全部加工任务。数控机床自动控制的核心部分是对动力的使用、被加工部件的运动及刀具的运动的控制。数控机床对智能研究的主要贡献就在于实现了精确的、与目标一致的物理部件运动的控制,如同人在有目的的行为时,认知控制和运动控制的一体性。
数控机床的控制能力是精细的。在10000r/min的主轴转速、120m/min的工件移动速度、控制五轴同时在一个工作面上加工,还要达到微米、纳米级的精度。
数控机床的控制功能是多样的。要能够完成镗、铣、车、削等不同加工要求,要能够根据加工要求自动识别刀具、选取刀具,要能够控制其立面和斜面上的不同的转角,要能够保证动力部分与加工部分的无缝连接、高度协同,要能够使用必要的编程语言,要能够与上下游的计算机辅助工具如计算机辅助设施、计算机辅助制造、制造执行系统、生产线的控制系统协同,要能够实现数控机床内外有效的通信。
3.物理和信息协同
物理部件与信息控制按任务需求实现精确协同是这类工具对智能进展的最大贡献。智能的进化和发展在一定程度上就是行为系统和认知控制系统发展和协同的历史。具有信息处理功能的工具在非生物智能发展中第一个实现了这两者的协同。
我们从数控机床的几个控制例子,来说明其在非生物智能进化中的里程碑意义。五轴联动是指在一台机床上至少有五个坐标轴(三个直线坐标和两个旋转坐标)在数控系统的控制下同时协调运动进行加工,可以实现对复杂空间曲面的高精度加工,如汽车零部件、飞机结构件。这一机械加工功能的实现是物理运动和信息控制协同实现的,缺一不可。首先是物理运动在动力和装置上能实现五轴与目标一致的旋转和移动能力。机床具备了通常三维空间X、Y、Z轴的旋转,还实现了设置在床身上的工作台环绕X轴回转,这就是A轴,设有一定的工作范围;围绕Y轴旋转的是B轴,也有设定的工作范围;环绕Z轴回转的工作台就是C轴,一般能实现360°回转;不同的机床按加工需求选择A、B、C中的两个,也已经有六轴的机床,对于说明原理,五轴和六轴没有重大区别。A、B 或 C 轴最小分度值是将工件加工出倾斜面、倾斜孔精度的基础。A、B或C轴如与X、Y、Z三直线轴实现联动,就可加工出复杂的空间曲面,但实现这个功能需要精密的数控系统、伺服系统以及相关软件的支持。
数控系统实现对机床所有功能的精密控制,实现动力与工件、刀具运动的一致,实现与其他软件的衔接。
对加工工件和工具的运动与加工要求一致,是数控系统的主要功能,图1.37说明了这种控制程序与刀具运动能力结合。
为数控机床提供动力的是数控伺服电机,见图1.38,一般有多个电机。数控系统要与伺服电机的控制部件和传动机制精确协同,为不同的加工需求精确提供动力。如主轴电机带动主轴箱旋转从而带动分度头分度或旋转,编码器安装在分度头上检测分度头旋转角度,反馈信号接到伺服单元插座上,数控系统端口与伺服单元相连接,控制电动机的旋转角度。主轴电机控制分度头由液压系统控制立面、斜面的松开,从而控制立面、斜面的分度,由主轴编码器检测电机的转速反馈到数控系统,从而控制分度的度数。当立面、斜面液压系统夹紧时,主轴电机转动带动主轴旋转进行机械加工;当刀库机械换刀时,立面、斜面均回到零度位置进行换刀。
图1.37 数控机床刀具位移控制例示[105]
图1.38 数控机床伺服电机工作原理例示[106]
数控系统的刀具更换功能,同样需要与物理运动的精密协同。选刀指令将所需要的刀具从刀库中转到取刀位置,实现自动选刀;然后由机械手从刀库和主轴上取出刀具,进行刀具交换,将新刀具装进主轴,用过的旧刀具放回刀库。而不同的刀具就涉及多个对加工主轴的控制,多主轴控制的稳定性是保证加工中心正确工作和精准定位的依据。
数控机床的控制系统需要根据工件和刀具的运动轨迹确定操纵运动的函数,程序的编制需要将加工过程转变成计算工具能识别和运行的逻辑。五轴的加工模式有点、线、面,不同的方式需要不同的运动函数。这些功能是数控机床对智能做出的又一个贡献。人类认知中的一个重要能力——逻辑和数学,在这样的工具中的应用,也推动了逻辑和数学的发展。
数控系统实现高精度实时控制,还需要感知工件和工具的实时状态,并根据状态与预期的比较,确定是否调整,感知能力是数控系统的重要组成部分。例如,感应同步器将角度或直线位移转变成感应电动势的相位或幅值,用来测量直线或转角位移。
鉴于数控机床的工作特点,它能够实现与企业其他软件的协同。加工之前,可以接收来自计算机辅助设计及企业生产计划系统的信息;在加工过程中,可以向企业的制造执行系统、库存货供应链系统、管理信息系统等提交实时的加工结果信息、部件需求信息等;在加工完成后,可以向生产计划系统、仓储系统、销售系统、售后服务、管理信息系统等提供信息,实现整个企业的一体化信息管理。这些发展,成为自动化、智能化系统的基础。
炼铁高炉、全自动洗衣机、心脏起搏器等都是具有信息和计算功能的工具。这些工具门类众多、功能不一、与社会技术发展同步。工具根据社会发展需求和技术基础而研制,实现了精确的自动控制,实现了将物理性质的运动和信息属性的控制无缝协同,在理论和实践上厘清了工具系统物理和信息、行为和认知能力之间的关系。
4.自动化系统
自动化是指机器设备、系统或生产和管理过程在没有人或较少人的直接参与下,按照既定目的,经由控制系统,实现预期目标的过程,在这个意义上,自动化也就是自动化系统,因为自动化在各类实际应用中存在。本文所指自动化系统主要是指制造业的离散、连续制造过程及仓储系统的自动化。
从对智能发展贡献的角度看,自动化与具有信息处理功能机械相比,相同之处在于系统的目的性或任务特征,在于基于物质、能量的运动部分与基于信息的控制部分融合在一起,实现确定的目标;主要的差距在于多工具、多工序集成,系统范围更大,感知、物联功能的作用更加突出。
随着传感器技术的发展和应用的普及,自动化系统实践的成熟,企业的自动化系统所集成的工具、工序越来越多,承担的功能越来越复杂。自动化系统的基础是具有信息处理功能的各种装备,一条自动化生产线可能有几十台、数百台的这类装备。自动化系统的另一个基础是传感器,这里的传感器不是指具有自动化功能的装备中的,而是生产线这些装备之外的传感器,例如,在一个自动化煤矿,可能有数万个监控整个矿场所有人、装备、采煤、破碎、运煤、供电、通信、交通、水、有害气体等状态的各类传感器。
自动化系统所涉及技术领域和应用范围持续扩展,促进着控制系统能力的发展,主要体现在通过传感器获取信息的能力、通信的能力、不同类型信息的处理能力、根据控制需求建立优化模型的能力、不同硬件或平台连接的能力。这些能力为非生物智能的进一步发展打下了基础。
数字机械和自动化系统是非生物智能发展中第一次将一个给定范畴涉及的信息,围绕数字机械或自动化系统解决问题的能力要求,实现了结构显性。这个显性结构不仅该工具或系统可以理解,据此进行操作,而且也能为人所理解,开创了不同类型主体可以理解相同信息结构的新阶段,逻辑上,人工智能是这一过程的必然结果。
1.6.5 人工智能的贡献
本节讨论这一领域相关又有各自特征的三类研究方向:人工智能、机器人和其他智能系统,其他智能系统是指智能制造、智慧城市中超出人工智能和机器人范畴的系统。其实在今天的语境下,很难恰当地区分人工智能系统和机器人,有时候,自动化系统与智能系统、数控加工中心与机器人的区分也变得比较困难。从对智能进化贡献的角度,本书将人工智能系统和机器人的区分界定在两者的技术构成。人工智能系统侧重于信息和逻辑要素,机器人则必然将行为能力作为重要的构成部分。在本书的第5章,将进一步以智能事件或智能任务的不同来区分。至于在智慧城市、智能制造等领域的智慧或智能系统,则是指尚未能将所涉及系统全部自动化,但能替代人的部分工作,或使工作做得更加理性(智慧)。
1.6.5.1 人工智能
什么是人工智能,还没有共识。罗塞尔(Stuart J. Russell)和诺维格(Peter Norvig)所著《人工智能 一种现代的方法》中,列举了8本人工智能教材中的定义,归纳为四类:像人一样思考的系统、像人一样行为的系统、理性思考的系统、理性行为的系统。在此基础上,他们把人工智能看作是理性的代理或智能的代理,研究其中的一般原理及构建这样的代理的要素[107],可以称之为实践导向性定义。而另一本人工智能的专著中则更加理论化地定义为“人工智能研究的是智能行为中的机制,它是通过构造和评估那些试图采用这些机制的人工制品来进行研究的”[108],这是承续了人工智能是实验性学科论者的定义。
人工智能研究对非生物智能的发展起到了关键性的作用,主要有三个方面。一是深化了对智能的认识,并对认知科学、脑科学等领域的研究做出了贡献;二是如何构建一个智能系统,使之能像人一样具有一定的智能和理性;三是一些基础性方法上取得了进展。如何深化了对智能的认识,将在第2章讨论,本节主要分析二、三两个方面。
1.如何构建智能系统的研究
构建什么样的智能系统,如何构建是人工智能研究的核心内容,也是对智能研究,特别是非生物智能系统发展最重要的贡献。
在构建什么样的人工智能系统这个问题上,存在一种理念或逻辑,人工智能学者总是希望找到一种方法或架构,用逻辑或推理的力量,像人一样做事或思考,追求通用的人工智能或强人工智能。这种思想方法导致一旦人工智能研究取得一些进展,就会做出过于乐观的估计。早在1965年,赫伯特·西蒙(Herbert Simon)即预测在20年内,机器可以做人类所能做的事,然而,到今天还远远没有达到。2017年,又有一些科学家预测到2136年,人工智能可以承担所有人的工作,这样的可能性是存在的,但前提是对一系列重大理论和方法问题要有答案。工业革命基于物理学的大发现,智能革命的理论尚未建立,任何乐观的预言都缺乏理论基础。
构建什么样的人工智能系统,也就是人工智能的方向和目标,主要的区别在于通用还是专用,能做什么事、还是达到什么样的智能水平或逻辑推理水平。
在人工智能的萌芽期和早期,通用并试图达到或超越人的智能作为主要的目标。这个思想的来源,应与被后世誉为计算机和人工智能之父的图灵有密切的联系。在1941年之前,图灵认为计算机不能像人一样进行直觉思维,但在此后,他认为具有学习或自组织能力的机器人能模拟心灵活动的任何结果,还预测到2000年计算机能实现他提出的“完全图灵测试”。1955—1956年,赫伯特·西蒙(Herbert Simon)、艾伦·纽厄尔(Allen Newell)和克里夫·肖(J. Cliff Shaw)一起开发了信息处理语言(IPL),用这个语言编写了逻辑理论机——“Logic Theory Machine”,并证明了罗素和怀特海《数学原理》第2章52个定理中的38个。正是这个成果,1956年在达特茅斯夏季会议上,宣告了人工智能的诞生。在此后的一段时间里,不管是通用问题求解器,还是自然语言理解等工作,朝着通用的强人工智能的方向努力。他们认为,人是用符号及其处理来解决问题,而解决问题的过程是逻辑推理,包括直觉式的问题求解,计算机都可以模拟。符号系统、有限自动机和通用语言是这个阶段人工智能最主要的特征。然而,由于各种原因,这一路径没有取得意料的成功,以20世纪80年代末日本五代机项目的失败为标志,人工智能的主流开始转向新的路径。
1969年,人工智能学者费根鲍姆(Edward A. Feigenbaum)和诺贝尔生理学、医学奖得主莱德伯格(Joshua Lederberg)开发了能从光谱仪提供的信息中推断分子结构的专家系统DENDRAL。这个系统基于规则和知识,通过恰当的知识表示和推理过程,在这个专门领域取得了媲美人类专家的结果。人工智能一个新的时代,构建专门的、具备弱人工智能特征的智能系统成为主流。直至近几年,人工智能经典教材大体以这一路线为基准。
在这一发展路径中也有两个不同的分支,一类是通过构建不同智能特征的主体(智能代理)为模块,组合成功能更多的人工智能系统[110];另一类是围绕特定的问题,构建达到或超过这个领域人的智能水平的人工智能系统。1987年,苹果当时的CEO斯卡利(John Sculley)描述了基于智能代理的发展图景:“我们可以用智能代理连接知识应用,代理依赖于网络,可以与大量数字化信息联系”,从而实现智能系统的目标。模块化模式取得了不少研究成果,对理解智能,并在不断取得成功的后一类智能系统基础上如何综合做出了很好的奠基工作。而后一类智能系统的成果,则是这十几年人工智能再次从备受指责的阴影中走出来,并走向新的发展时期的主要原因。从1997年,IBM研发的“深蓝”(Deep Blue)击败人类象棋冠军以来,不断取得引起世人高度关注的进展。2000年,麻省理工大学研究人员西蒂亚·布雷泽尔(Cynthia Breazeal)开发了Kismet,它是一个可以识别、模拟表情的机器人。2011年,IBM开发的自然语言问答计算机沃森在电视智力竞猜节目“危险边缘”(Jeopardy!)中击败所有该比赛中得分最高的两位前冠军。2016年3月,谷歌DeepMind研发的AlphaGo击败围棋冠军李世石,一年后又击败了柯洁,被誉为棋圣的聂卫平评价AlphaGo是20段棋手,而人类围棋界最高段位是9段。
显然,这是迄今为止人工智能取得的最好成绩。从智能系统构建路径看,这是通过建立、测试和改进模型,以逼近所确定主题的真实环境和该领域人类的智力顶点。从系统的架构看,这类系统拥有六个或其中几个核心能力。一是具备解决该问题尽可能多的相关知识或信息,包括问题本身的和问题求解的;二是具有对该知识与信息集合有效的知识表征和组织能力;三是具备获得与解决问题相关的新信息能力;四是具备通过新获取的信息、问题求解过程、模拟问题求解过程进行学习,以提升知识表征、学习和问题求解能力;五是具有与问题求解有效性一致的模型、算法、推理、计算等逻辑能力;六是具有与问题求解的时间和成本约束一致的计算、存储、连接等计算资源。成功的案例和案例内含的路径的可复制性,成为这几年人工智能预期和投入再次爆发的基础。成功的人工智能系统构建实际上对认知智能和发展智能提供了极其宝贵的经验。
2.构建智能系统的方法
构建智能系统的方法除开一般的数学和逻辑基础外,主要是构建问题求解的逻辑和实现有效的计算。逻辑问题是指智能系统问题如何求解,主要涉及表示、推理(搜索)、学习和问题求解过程控制;计算问题主要涉及计算复杂性(对计算结果要求)、算法、计算资源(可获得性,技术和经济)。神经网络被用于学习、标识、逻辑、计算四个方面,需要专门介绍。
1)知识表示
尽管符号主义路线并没有后续成功的支持,但作为这一路径主要代表的知识表示却成为所有人工智能系统,也是所有智能中不可回避的要素。数十年对知识表示研究和实践得到的成果是人工智能对智能研究做出的基础性贡献。
在人工智能中,知识表示就是要把问题求解中所涉及的对象、环境、算法、求解过程和功能等知识构造为计算机可处理的符号体系。从便于表示和运用的角度出发,上述知识也可以分为四类:事实、事件和事件序列、问题求解的过程和操作、元知识。为了适应不同的人工智能系统对知识表示的特殊需求,可以在表示域和粒度、语义基元和表示的不确定性、模块性和可理解性、显式表示和灵活性、陈述性表示方式和过程性表示方式等特征上入手。
从其表示特性来考察可归纳为两类:说明型(declarative)表示和过程型(procedural)表示。说明型表示中的知识是一些已知的客观事实,关于专业领域的元素或实体的知识,如问题的概念及定义,系统的状态、环境和条件。过程型表示中的知识是客观存在的一些规律和方法,用于表示关于系统状态变化、问题求解过程的操作、演算和行为的知识。在长期的实践中,归纳出了知识表示方法的一些基本要求:一是具有良好定义的语法和语义;二是有充分的表达能力,能清晰地表达有关领域的各种知识;三是便于有效的推理和检索,具有较强的问题求解能力,适合于应用问题的要求,提高推理和检索的效率;四是便于知识共享和知识获取;五是容易管理,易于维护知识库的完整性和一致性。针对上述要求和特征,知识表示形成了一组表示的方法,并在构建人工智能系统的过程中完善。常用的知识表示方式有:谓词逻辑、框架、脚本、语义网络、产生式系统、类比、框架等表示方式。另外,对于动态过程的表示中,由于前述显式表示的局限性,可以采用一些替代的方法,如包容结构和模仿(copycat)结构等[110]。另外一些人工智能学者,如分布式人工智能学派,更多地研究智能的本体特征,用主体(agent)作为构建智能系统的模块,由此也产生了分布式的适用于不同主体的表示方法[111]。对于一些存在不确定性的问题求解,一些智能系统采用了模糊集、概率密度贝叶斯网络等方法进行标识[112]。对于更为复杂的智能系统,需要用不同分辨率求解,知识表示也相应采用多分辨率的模式[113]。实践证明,在对象为比较复杂的问题时,一个人工智能系统通常采用多种方法混合表示。
尽管取得了很多进展,但知识表示依然存在一系列重大的挑战,需要在更加广泛的范畴和更加透彻的理论基础上再度突破。
2)机器学习
机器学习是任何人工智能必须具备的关键构成要素。如何使一个人工智能系统具备智能,在任何典型的人工智能系统构建过程中必须利用得到的信息进行学习;如何使一个人工智能系统在变化的环境和使用的过程中不断完善,也必须利用新获得的信息、问题求解过程或模拟问题求解过程获得的经验进行学习。
在人工智能系统发展中,形成了很多机器学习具体方法,罗格将其归纳为三大类:基于符号的、连接主义的、基于社会性和涌现特征的。基于符号的机器学习是当今人工智能系统主要的学习方法,其特征是通过分析符号来更有效表征该智能系统中的对象和关系。演绎、类比、归纳、基于解释的、无监督和强化学习等都属于此类。连接主义的学习是指通过调整一个智能系统中的相互作用部件的连接来提高该系统的智力。感知机学习、反传和竞争学习、一致性学习、吸引子网络等都是这一类型的主要方法。社会性和涌现型学习是借用社会学和生物学进化等领域的演化计算,作为人工智能通过学习提升的方法。遗传算法、分类器系统、细胞自动机等是这一类学习方法的主要代表[114]。还有一些近期发展的机器学习,如深度学习、从序列到序列学习等。深度学习属于连接主义的学习类型,深度越深,意味着对已有知识利用的越少,因此深度学习算法更适合未标记数据,更适合强特征提取。从序列到序列学习在语音识别和机器翻译等自然语言处理领域具有较高的实用价值。
从上面的分析可以看出,目前机器学习还局限于人工智能系统构建和提升的范畴,如何通过机器学习,成为如同生物智能发展过程中学习的作用,其机理和方法,还刚刚起步,理论基础尚未形成。如何在更高层面界定机器学习的目标和类型,是机器学习发展的必要过程。
3)过程控制
任何人工智能系统都是一个对设定问题的求解过程,过程控制就是确定问题求解过程的策略、路径,确定算法的选择,也就是寻找最佳或可行的求解模式。所以,过程控制是逻辑推理过程、策略和规划的综合体。
人工智能系统借用逻辑来表示知识,求解问题。谓词逻辑和搜索策略是最基本的推理工具,其中搜索策略又根据系统的特征而采用不同的细分策略,除状态空间搜索等基本搜索模式外,深度或宽度优先等最佳优先搜索、启发式搜索、随机方法搜索等均有广泛的应用。
人工智能系统的问题求解策略有两种不同的用法,一种是搜索策略,使用深度优先还是宽度优先;另一种是存在多种不同路径时,优先采用什么路径。后一种通常在模块式智能系统中使用。
规划就是问题求解过程的计划。在很多场合,策略和规划具有相同的含义,在分布式、模块式的人工智能系统中,规划占有重要的位置。一个好的规划需要具有充分的表达能力和扩展能力,具有好的规划路径或规划算法,状态空间搜索、偏序、可动态调整的规划图等,都是规划的一般方法。如果人工智能系统是针对现实世界的问题求解,还需要考虑更多的环境因素,如资源和时间的约束,在非确定性环境和具有层次性特征的问题求解,规划对此类问题,也有一定的方法[115]。
3.关于神经网络
神经网络在人工智能的发展中展示了强大的生命力,发挥了独特的作用,因此需要专门做一个简要的分析。
模仿大脑来实现大脑之外的智能,有着数千年的历史,神经网络支持智能活动早于人工智能这个概念的诞生。1956年达特茅斯会议上,受到高度重视的、自顶向下的符号逻辑模式,实际上采用了1943年沃伦·麦卡洛克(Warren S. McCulloch)和沃尔特·皮茨(Walter Pitts)“神经活动中内在思想的逻辑演算”的思想。早在1951年,作为达特茅斯会议发起者之一的明斯基就和迪恩·爱德蒙(Dean Edmunds)开发了“随机神经网络模拟加固计算器”,用3000个真空管模拟40个神经元的运行。在此后的10多年间,著名的人工智能学者,如明斯基、纽厄尔、肖等都将神经网络作为基于符号逻辑的人工智能系统的基础构件。在过去几十年人工智能发展过程中,形成了两种不同的观点,一种观点认为基于符号的计算可以解释认知属性,另一种认为用网络来表示简单的、像神经元一样的处理,可以获取复杂的行为并解释认知功能。后者就是基于神经网络的人工智能系统了。
近几年,基于神经网络的人工智能研究在构建人工智能系统和人工智能理论研究两个方面取得了重要进展。2007年,杰弗里·辛顿(Geoffrey Hinton)认为,可以开发出多层神经网络,这种网络包括自上而下的连接点,可以生成感官数据训练系统,而不是用分类的方法训练。这一理论导致人工智能研究走向深度学习,神经网络是多数深度学习项目的方法论基础。2011年,在德国交通标志识别竞赛中,一个卷积神经网络成为赢家,它的识别率高达99.46%,人类约为99.22%。2012年6月:杰夫·迪恩(Jeff Dean)和吴恩达(Andrew Ng)构建的神经网络在随机抽取、未经标记的1000万张图片,发现其中的一个人工神经元对猫的图片特别敏感。
针对特定的问题,构建人工智能系统的实践,走在恰当的路线上,这是这几年取得令人瞩目的成功的根本原因。1988年,明斯基借其著作《感知机:计算几何导论》扩充再版之机指出:“我们认为,由于缺少基本理论,研究已经基本处于停滞状态……”,对人工智能研究而言,这个结论到现在依然成立。
不仅指导人工智能走向未来的理论尚未建立,最佳实践也没有达到,这是有人忧虑人工智能进入再一个冬天的原因。有人指出,无论是IBM的“危险边缘”,还是谷歌的AlphaGo,数据的作用及经验性知识没有得到恰当的评价;还有人指出,人工智能的神经网络研究进展,并没有跟上认知神经科学最新研究的成功,深度学习的算法与人脑的工作机制几乎没有共同之处。
1.6.5.2 机器人
机器人也可以看作一类人工智能系统。与1.6.5.1节中一般性讨论人工智能的发展和技术基础不同,机器人都是为完成特定类型的任务而存在,是直接对原来由人承担的事务的替代。这种替代有三种类型:一是通过存在物体移动、加工过程的任务,这类替代的工具,称为行为机器人;二是不存在物体移动过程的人类事务,如聊天机器人、语音处理装置等,称为思维机器人;三是一组行为机器人和思维机器人及其他非智能设备构成的一个智能系统,如智能电网、智能交通等。最后一类在下一节讨论。
行为机器人与1.6.4节中介绍的数控机床从功能上比较难以区分。一般而言,行为机器人替代的事务原来是基本上由人来完成的,而数控机床完成事务的承载主体一般由既有工具升级而来,又替代了人的部分操作。
1.行为机器人
机器人的前驱是各种机械,随着机械向自动化装备的方向发展,机器人应运而生。1961年,第一台工业机器人在新泽西州通用汽车的组装线上投入使用;1966年,第一款移动机器人诞生;1970年,第一个拟人机器人诞生,它包括了肢体控制系统、视觉系统、会话系统;2000年,可以像人类一样快速行走,在餐馆内可以将盘子送给客人的机器人诞生;到现在数百万工业机器人在生产线上替代了工人,更多的服务机器人进入不同的服务行业和家庭。
研发机器人的目的性特别明确,就是完成原来由人类完成或人类也完成不了,但又必须实现的事务(作业)。完成行为型任务,要有五个方面的功能:操作、移动、感知、思考、计算(控制)。综合这四种能力的主体,就称为行为机器人。行为机器人对智能发展的贡献主要是物体行为能力的形成和控制,在控制过程中特定算法的发展,以及对人类行为型智能事务的系统理解。
行为能力是智能的重要组成部分。无论是智能的发展还是智能的构成都不能缺少行为能力这个组件,只讨论逻辑组件,是对智能的误解。机器人的研究和发展,补充了人工智能研究者对行为研究的不足。
以机器人的操作臂为例(图1.39),行为能力由两部分构成,即机械能力和控制能力。机械能力是指操作臂的强度、动力传递、关节灵活性等能力;控制能力是指感知、空间描述、运动轨迹的生成、操作臂的线性或非线性控制、操作臂力的控制等。
图1.39 机器人手臂运动示例[116]
这个过程根据机器人用途的特殊性,就需要研究算法及其实现,需要实现动力学与控制结合起来的操作实现算法。机器人的研究是对其要实现的操作的完整理解,装配、焊接、搬运、分拣等不同用途的机器人都需要对相应事务的系统性理解。这个过程体现了智能的主体特征,体现了整个事务相关全过程、全要素的数据链构成,对功能和行为信息(知识)实现了完整的显性表征。
2.思维机器人
语音助手、多语种翻译器、聊天机器人等服务机器人都属于思维机器人。思维机器人对智能发展的主要贡献是对完全属于人类思维能力事务的仿真和迫近,对理解人的智能和理解特定思维事务的智能特征做出了贡献。1988年,罗洛·卡彭特(Rollo Carpenter)开发的聊天机器人,可以看作是第一款思维机器人。
机器翻译或自然语言理解是人工智能中十分活跃并得到高度关注的领域。在人工智能发展的早期,以乔姆斯基为代表的研究者,以有限自动机为核心,产生了形式语言理论。在20世纪50年代后期,贝叶斯方法开始用于文本识别,解剖了一本大辞典,总结出字母系列的相似度,开拓了概率模式的自然语言理解。20世纪60年代初,将语料用于自然语言理解的方式开始产生。在这三个基本要素支持下,此后几十年自然语言理解取得了一些进展,但始终没有能够将机器翻译实用化。
在互联网发展的基础上,一些企业利用互联网收集了超海量的语料,并对人类学习语言、理解语言和翻译的能力进行了深入的分析,形成了新的学习、理解、翻译模式,逐步接近实用,预计在不久的将来,多语种翻译将成为很多人移动智能终端的标配。这也意味着,我们在自然语言理解这个智能领域,生物智能和非生物智能将开始具有共同的基础。
1.6.5.3 其他智能系统
自动化系统、数字化设备、机器人、人工智能等领域的进展,推动了在更广泛的军事、经济、社会事务领域的智能化发展。智能制造、智慧农业、智慧城市等在世界各地兴起,这些系统都冠上了“智慧”“智能”的帽子,具有一定替代人的智能的性质。这些系统缺乏人工智能的理论研究支持,不能归到纯粹的人工智能领域,可以看作应用的扩展,但同样对智能的研究和发展做出了贡献。下面从智能制造、智慧农业、智慧医疗三个领域做简要分析,并总结其对智能发展和研究的贡献。
1.智能制造
智能制造(Intelligent Manufacturing, IM)是一种由智能机器和人类专家共同组成的人机一体化智能系统,通过人与智能机器的合作共事,去扩大、延伸和部分地取代人类专家在制造过程中的脑力劳动。面向产品生产全生命周期,实现泛在感知条件下的信息化制造,是在现代传感技术、网络技术、自动化技术、拟人化智能技术等先进技术基础上,通过智能化的感知、人机交互决策和执行技术,实现设计过程、制造过程、制造装备等智能化。图1.40所示为智能制造的一般特征。
图1.40 智能制造示意图[117]
如图1.40所示,全球的制造业都在走向智能制造。按照图中美国先进制造业五个模块的解释,重心在于通过数据链和网络平台以及模型和仿真的算法,提高制造过程的效率和质量,以智能工厂为核心,上联设计和供应链,下接分销配送和用户,实际上是自动化生产线和智能技术融合,实现了比自动化生产线更高的智能水平。图中的一条黄线、两条黑色双线是德国工业4.0的重心。智能工厂下边的黄线,是指在一个企业里边实现各个环节端到端的数字化无缝对接。这对智能的发展和研究有两个重要贡献:一是实现了一个工厂范围内所有知识的显式表征,对知识表示做出了贡献;二是一个工厂成为一个智能系统,使人工智能或非生物智能的实践领域有了大幅度扩展,对理解和发展智能具有重大意义。两条黑色双线,是指德国工业4.0所指横向集成和纵向集成。要点是在供应链和用户—制造企业—物流及整个流通服务环节的各相关方通过建立协同完整的数据链和互联互通的信息平台,实现优化。尽管这两个环节还没有达到智能化的水平,但为更广泛领域的智能化打下了基础。
智能制造通过传感器、物联网和数据链自动化技术,围绕制造过程,将信息的感知和获取、传输和处理、模型和算法、表征和使用、行为控制等智能要素在一个智能系统中融合起来,实现了比人操作更好的能力,对智能的研究和发展具有独特的价值。
2.智慧农业和智慧医疗
智慧农业是一个方向性的框架概念。它包含了农业专家系统和农作物的工厂化生产、农产品加工流通链基于信息和信息平台的优化等部分。智慧医疗尚没有得到广泛认同的严格定义。一般而言,它由医疗专家系统、远程医疗、医院信息系统等三个领域的发展和融合而成。
农业专家系统和医疗专家系统原理十分相似,都是将相对完整系统的领域知识构成结构化程度高的知识库,分别根据农民和医生的职业特征构建分析规则和应用环境,辅助种地或诊疗,也是人工智能拥有较多应用成功实例的领域。
农作物的工厂化生产是农业发展的一个重要方向。功能上它类似于自动化生产线,也有重大不同。自动化生产线确定了加工的产品之后,经由固定的加工流程完成;而农作物工厂化生产的周期比较长,在这个周期内,温度、日照、湿度、病虫害是变化的,需要根据生长环境的变化而动态调整,而这些变化又是通过实时感知来实现的。这些差异导致了信息表征模式和控制模式的不同。
农产品加工流通链基于信息和信息平台的优化如同工业的供应链优化一样,基于链环上各个环节为流通构建共用的信息平台,建立完整的、反应实时变化的信息链,为优化建立控制模型,实现优化的农产品流通过程。这个过程从智能角度与制造业的供应链集成是相同的。
医院信息系统发展已经十分成熟。以患者、电子病历和诊疗为主线,围绕医护人员、管理人员职责和发展,以医院所有业务系统的流程为基础,医院信息系统由若干个不同功能的模块构成,为医院的诊疗、管理提供全方位的辅助。远程医疗则是在医疗专家系统与/或医院信息系统的基础上,实现地域上分布的跨医疗机构诊疗服务,提高了医疗资源的利用能力。
综合起来,本节讨论的智能系统对智能发展和研究的贡献主要体现在三个方面:一是表征能力。对一个系统的信息(含知识)显性表征能力是这样的系统智能化的必要条件。二是感知能力。这类范围比较大、涉及对象比较多的动态系统,很多信息隐藏在对象或过程中,需要感知,并将其与过程或对象的属性信息结构显性表征。三是构建模型和算法。依据对象属性和行为特征,在信息显性表征的基础上,构建模型、选择、完善或创造算法。
1.6.6 小结
本节是对非生物智能发展的一个系统回顾。迄今为止,本节讨论的工具和系统都是人造物,是人的智能的结晶,替代人的体力和脑力,承担人类社会的必要劳动。非生物智能与生物智能一起,构成了智能这个对象。非生物智能是认识智能、理解智能、发展智能的另一半。
工具和系统的发展既受人的智能发展的规范,也有其自身的内在规律,这就是非生物智能的发展规律。人工智能和智能系统研究和发展,正在展示出非生物智能体赋予主体性之后的能力,强人工智能的研究将会导致非生物智能体拥有自主的主体性,智能的版图将重构。
在这个过程中,起关键作用的是客观化的信息(知识),在渐进积累的质变中,信息显性结构和在赋予基础上的新自我成为主体性发展的基础和导火索。对于人类社会已有事务的智能化是智能研究和发展的主要方向,不仅找到了动力,还找到了研究其本质的钥匙。
在工具和系统发展中,计算机和数字机械的出现,如同生物智能中语言和文字的产生一样,导致了非生物智能的快速发展。70多年取得的进展,远远大于简单工具产生到计算机产生的若干万年的进展。
人工智能、机器人和各类智能系统是当今非生物智能的最高形态,是非生物智能的集大成者。但是人工智能的理论研究与具体的非生物智能应用成果之间存在一条不协调的沟壑。有研究指出,是数据集,而非算法,是人工智能发展的主要约束,换言之,是高质量的数据和高质量的该类问题求解的人类知识经验,基于这些数据、知识和经验的学习,是人工智能这些年取得进展的主要原因。例如,1997年,当IBM的“深蓝”打败卡斯帕罗夫(Garry Kasparov)时,它的核心算法(NegaScout规划算法)已经有14年之久,然而它收集了70万国际象棋特级大师比赛的数据集,在此基础上构建的策略和算法超越了人类的世界冠军。2005年,谷歌软件完成的阿拉伯文/英文和中文/英文翻译是统计机器翻译算法的一个变体,但是使用了同一年从谷歌网站和新网页中收集到的超过1.8万亿的符号。2011年,IBM的沃森战胜两个此前水平最高的人类对手,成为美国有线电视节目“危险边缘!”冠军,它使用了多专家决策算法的一个变体,但用了来自维基百科、维基词典、维基语录和刚更新的古腾堡计划中860万文献资料。2016年和2017年,AlphaGo分别战胜李世石和柯洁,基于可以得到的、超过千万计的围棋棋谱,以及大量人类棋手对围棋局势判断和下棋的经验与风格,所有的算法、模型、策略,都是在这个基础上建立起来的。
这个现象值得我们再次思考什么是智能。牛顿曾经说过,“真相从来都是从简单中寻获,而非从多样和混乱的事物中”。对于智能研究,有人认为我们还处于前牛顿阶段。
吉斯曼(Samuel J. Gershman)、霍维茨(Eric J. Horvitz)和特纳鲍姆(Joshua Tenenbaum)2015年在一篇文章提出了一个假设[118],智能可以从三个方面描述:一是智能个体有目标,并相信可能通过计划、动作等实现这些目标;二是理想的结果或理论上最好的选择对于实际世界的问题求解可能是不现实的,但是理性的算法应该做到足够接近,在考虑成本的前提下达到满意的结果;三是这些算法应该可以根据具体问题的需求进行合理的调整,通过元推理(meta-reasoning)机制对给定情况选择最好的策略。
本节讨论到的机器人和经济社会应用中的策略就是这些假设在一定程度上的体现。看来,我们需要将生物智能和非生物智能,将理论研究的智能和实际使用的智能一并研究,才可能使智能的理论研究走出前牛顿时期。