2.7 CAD系统智能设计技术
2.7.1 人工智能
人工智能(Artificial Intelligence,AI)是一门综合了计算机科学、生理学、哲学的交叉学科。人工智能的研究课题涵盖面很广,从机器视觉到专家系统,包括了许多不同的领域。这其中共同的基本特点是让机器学会“思考”。
现在,人工智能专家们面临的最大挑战之一是如何构造一个系统,可以模仿由上百亿个神经元组成的人脑的行为,去思考宇宙中最复杂的问题。或许衡量机器智能程度的最好的标准是英国计算机科学家阿伦·图灵的试验。他认为,如果一台计算机能骗过人,使人相信它是人而不是机器,那么它就应当被称为有智能。
人工智能学科诞生于20世纪50年代中期,当时由于计算机的产生与发展,人们开始了具有真正意义的人工智能的研究。虽然计算机为AI提供了必要的技术基础,但直到20世纪50年代早期,人们才注意到人类智能与机器之间的联系Norbert Wiener是最早研究反馈理论的美国人之一,最熟悉的反馈控制的例子是自动调温器,它将收集到的房间温度与希望的温度进行比较,并做出反应将加热器开大或关小,从而控制环境温度。这项对反馈回路的研究的重要性在于:Wiener从理论上指出,所有的智能活动都是反馈机制的结果,而反馈机制是有可能用机器模拟的,这项发现对早期AI的发展影响很大。
1956年夏,美国达特莫斯大学助教麦卡锡、哈佛大学明斯基、贝尔实验室申龙、IBM公司信息研究中心罗彻斯特、卡内基-梅隆大学纽厄尔和赫伯特·西蒙、麻省理工学院塞夫里奇和索罗门夫,以及IBM公司塞缪尔和莫尔在美国达特莫斯大学举行了以此为期两个月的学术讨论会,从不同学科的角度探讨人类各种学习和其他职能特征的基础,并研究如何在原理上进行精确的描述,探讨用机器模拟人类智能等问题,并首次提出了人工智能的术语。从此,人工智能这门新兴的学科诞生了。这些青年的研究专业包括数学、心理学、神经生理学、信息论和电脑科学,分别从不同角度共同探讨人工智能的可能性。他们的名字对于人们来说并不陌生,例如,申龙是《信息论》的创始人,塞缪尔编写了第一个电脑跳棋程序,麦卡锡、明斯基、纽厄尔和西蒙都是“图灵奖”的获奖者。
人工智能的科学家们从各种不同类型的专家系统和知识处理系统中抽取共性,总结出一般原理与技术,使人工智能从实际应用逐渐回到一般研究。围绕知识这一核心问题,人们重新对人工智能的原理和方法进行了探索,并在知识获取、知识表示以及知识在推理过程中的利用等方面开始出现一组新的原理、工具和技术。1977年,在第五届国际人工智能联合会(IJCAI)的会议上,费根鲍姆教授在一篇题为《人工智能的艺术:知识工程课题及实例研究》的特约文章中,系统地阐述了专家系统的思想,并提出了知识工程的概念。费根鲍姆认为,知识工程是研究知识信息处理的学科,它应用人工智能的原理和方法,给那些需要专家知识才能解决的应用难题提供了求解的途径。恰当地运用专家知识的获取、表示、推理过程的构成与解释,是设计基于知识的系统的重要技术问题。至此,围绕着开发专家系统而开展的相关理论、方法、技术的研究形成了知识工程学科。知识工程的研究使人工智能的研究从理论转向应用,从基于推理的模型转向基于知识的模型。
2.7.2 专家系统
专家系统是一个或一组能在某些特定领域内,应用大量的专家知识和推理方法求解复杂问题的一种人工智能计算机程序。属于人工智能的一个发展分支,专家系统的研究目标是模拟人类专家的推理思维过程。一般是将领域专家的知识和经验,用一种知识表达模式存入计算机。系统对输入的事实进行推理,做出判断和决策。从20世纪60年代开始,专家系统的应用产生了巨大的经济效益和社会效益,已成为人工智能领域中最活跃、最受重视的领域。
专家系统通常由人机交互界面、知识库、推理机、解释器、综合数据库、知识获取6个部分构成,如图2-42所示。专家系统的基本结构大部分为知识库和推理机。其中知识库中存放着求解问题所需的知识,推理机负责使用知识库中的知识去解决实际问题。知识库的建造需要知识工程师和领域专家相互合作把领域专家头脑中的知识整理出来,并用系统的知识方法存放在知识库中。当解决问题时,用户为系统提供一些已知数据,并可从系统处获得专家水平的结论。
图2-42 专家系统的基本结构
(1)知识库
知识库用来存放专家提供的知识。专家系统的问题求解过程是通过知识库中的知识来模拟专家的思维方式,因此,知识库是专家系统质量是否优越的关键所在,即知识库中知识的质量和数量决定着专家系统的质量水平。一般来说,专家系统中的知识库与专家系统程序是相互独立的,用户可以通过改变、完善知识库中的知识内容来提高专家系统的性能。
人工智能中的知识表示形式有产生式、框架、语义网络等,而在专家系统中运用得较为普遍的知识是产生式规则。产生式规则以IF…THEN…的形式出现,就像BASIC等编程语言里的条件语句一样,IF后面跟的是条件(前件),THEN后面的是结论(后件),条件与结论均可以通过逻辑运算AND、OR、NOT进行复合。在这里,产生式规则的理解非常简单:如果前提条件得到满足,就产生相应的动作或结论。
(2)推理机
针对当前问题的条件或已知信息,反复匹配知识库中的规则,获得新的结论,以得到问题求解结果。在这里,推理方式可以有正向和反向推理两种。正向推理是从前件匹配到结论,反向推理则先假设一个结论成立,看它的条件有没有得到满足。由此可见,推理机就如同专家解决问题的思维方式,知识库就是通过推理机来实现其价值的。
(3)人机界面
人机界面是系统与用户进行交流时的界面。通过该界面,用户输入基本信息,回答系统提出的相关问题,并输出推理结果及相关的解释等。
(4)综合数据库
综合数据库专门用于存储推理过程中所需的原始数据、中间结果和最终结论,往往是作为暂时的存储区。解释器能够根据用户的提问,对结论、求解过程做出说明,因而使专家系统更具有人情味。
(5)知识获取
知识获取是专家系统知识库是否优越的关键,也是专家系统设计的“瓶颈”问题,通过知识获取,可以扩充和修改知识库中的内容,也可以实现自动学习功能。
2.7.3 模糊理论
概念是思维的基本形式之一,它反映了客观事物的本质特征。人类在认识过程中,把感觉到的事物的共同特点抽象出来加以概括,这就形成了概念。比如从白雪、白马、白纸等事物中抽象出“白”的。一个概念有它的内涵和外延,内涵是指该概念所反映的事物本质属性的总和,也就是概念的内容。外延是指一个概念所确指的对象的范围。例如“人”这个概念的内涵是指能制造工具,并使用工具进行劳动的动物,外延是指古今中外一切的人。
所谓模糊概念,是指这个概念的外延具有不确定性,或者说它的外延是不清晰的,是模糊的。例如“青年”这个概念,它的内涵我们是清楚的,但是它的外延,即什么样的年龄阶段内的人是青年,恐怕就很难说情楚,因为在“年轻”和“不年轻”之间没有一个确定的边界,这就是一个模糊概念。
需要注意的几点:首先,人们在认识模糊性时,是允许有主观性的,也就是说,每个人对模糊事物的界限不完全一样,承认一定的主观性是认识模糊性的一个特点。例如,我们让100个人说出“年轻人”的年龄范围,那么我们将得到100个不同的答案。尽管如此,当我们用模糊统计的方法进行分析时,年轻人的年龄界限分布又具有一定的规律性。
其次,模糊性是精确性的对立面,但不能消极的理解模糊性代表的是落后的生产力,恰恰相反,我们在处理客观事物时,经常借助于模糊性。例如,在一个有许多人的房间里,找一位“年老的高个子男人”,这是不难办到的。这里所说的“年老”“高个子”都是模糊概念,然而我们只要将这些模糊概念经过头脑的分析判断,很快就可以在人群中找到此人。如果我们要求用计算机查询,那么就要把所有人的年龄、身高的具体数据输入计算机,然后才可以从人群中找出这样的人。
最后,人们对模糊性的认识往往同随机性混淆起来,其实它们之间有着根本的区别。随机性是其本身具有明确的含义,只是由于发生的条件不充分,而使得在条件与事件之间不能出现确定的因果关系,从而事件的出现与否表现出一种不确定性。而事物的模糊性是指我们要处理的事物的概念本身就是模糊的,即一个对象是否符合这个概念难以确定,也就是由于概念外延模糊而带来的不确定性。
2.7.4 人工神经网络
人工神经网络是在现代神经科学研究成果的基础上提出的一种抽象的数学模型,它以某种简化、抽象和模拟等方式,反映大脑功能的若干基本特征。数学建模的人工神经网络方法就是从大量数据中利用某些方法,寻找该系统或事件的内在规律,建立该系统或事件的数据之间的联系,并用一种数学描述其输入与输出之间的关系。它将一个系统的内在联系通过数据、图表、图像、图形、公式、方程、网络结构等形式来体现,所以,在某种程度上,可以说数据、图表、图像、图形、公式、方程、网络结构等都是该系统的模型表达,这种表达就是相似系统的概念。因此,数学建模就是由一种系统的模型表达转换为系统的另一种模型或表达形式,比如数据、图表、图像、图形、公式、方程、网络结构等形式。这种表达就是相似系统的概念。数学建模的人工神经网络方法就是用人工神经网络的结构形式来代替实际物理系统模型。
一个神经网络的特性和功能取决于三个要素:一是构成神经网络的基本单元——神经元;二是神经元之间的连续方式——神经网络的拓扑结构;三是用于神经网络学习和训练,修正神经元之间的连接权值和阈值的学习规则。
人工神经元是对生物神经元的功能的模拟。人的大脑中大约含有1011个生物神经元,生物神经元以细胞体为主体,由许多向周围延伸的不规则树枝状纤维构成的神经细胞,其形状很像一棵枯树的枝干。主要由细胞体、树突、轴突和突触(又称神经键)组成,如图2-43所示。
图2-43 生物神经元示意图
生物神经元通过突触接收和传递信息。在突触的接收侧,信号被送入胞体,这些信号在胞体里被综合。其中有的信号起刺激作用,有的起抑制作用。当胞体中接受的累加刺激超过一个阈值时,胞体就被激发,此时它将通过枝蔓向其他神经元发出信号。
根据生物神经元的特点,人们设计人工神经元,用它模拟生物神经元的输入信号加权和的特性。设n个输入分别用x1,x2,…,xn表示,它们对应的连接权值依次为w1,w2,…,wn,用net表示该神经元所获得的输入信号的累积效果,即该神经元的网络输入量,y表示神经元的实际输出。图2-44给出了人工神经元基本特性示意图。
图2-44 人工神经元基本特性示意图
单个的人工神经元的功能是简单的,只有通过一定的方式将大量的人工神经元广泛地连接起来,组成庞大的人工神经网络,才能实现对复杂的信息进行处理和存储,并表现出不同的优越特性。根据神经元之间连接的拓扑结构上的不同,将人工神经网络结构分为两大类,即层次型结构和互连型结构。
(1)层次型拓扑结构
层次型结构的神经网络将神经元按功能的不同分为若干层,一般有输入层、中间层(隐层)和输出层,各层顺序连接,如图2-45所示。输入层接受外部的信号,并由各输入单元传递给直接相连的中间层各个神经元。中间层是网络的内部处理单元层,它与外部没有直接连接,神经网络所具有的模式变换能力,如模式分类、模式完善、特征提取等,主要是在中间层进行的。根据处理功能的不同,中间层可以是一层,多层也可以。由于中间层单元不直接与外部输入输出进行信息交换,因此常将神经网络的中间层称为隐层,或隐含层、隐藏层等。输出层是网络输出运行结果并与显示设备或执行机构相连接的部分。
图2-45 层次型神经网络拓扑结构
(2)互连型拓扑结构
互连型结构的神经网络是指网络中任意两个神经元之间都是可以相互连接的,如图2-46所示。例如,Hopfield网络(循环网络)、波尔茨曼机模型网络的结构均属于这种类型。
图2-46 全互连型网络拓扑结构
2.7.5 虚拟现实技术
虚拟现实技术是一种可以创建和体验虚拟世界的计算机仿真系统,它利用计算机生成一种模拟环境,是一种多源信息融合的交互式的三维动态视景和实体行为的系统仿真,使用户沉浸到该环境中。虚拟现实系统在远程教育、科学计算可视化、工程技术、建筑、电子商务、交互式娱乐、艺术等领域都有着极其广泛的应用前景。利用它可以创建多媒体通信、设计协作系统、实境式电子商务、网络游戏、虚拟社区全新的应用系统。
仿真技术的一个重要方向是仿真技术与计算机图形学人机接口技术、多媒体技术、传感技术、网络技术等多种技术的集合,是一门富有挑战性的交叉技术前沿学科和研究领域。虚拟现实技术(VR)主要包括模拟环境、感知、自然技能和传感设备等方面。模拟环境是由计算机生成的、实时动态的三维立体逼真图像。感知是指理想的VR应该具有一切人所具有的感知。除计算机图形技术所生成的视觉感知外,还有听觉、触觉、力觉、运动等感知,甚至还包括嗅觉和味觉等,也称为多感知。自然技能是指人的头部转动,眼睛、手势或其他人体行为动作,由计算机来处理与参与者的动作相适应的数据,对用户的输入作出实时响应,分别反馈到用户的五官。虚拟现实的关键技术可以包括以下几个方面。
(1)动态环境建模技术
虚拟环境的建立是虚拟现实技术的核心内容。动态环境建模技术的目的是获取实际环境的三维数据,并根据应用的需要,利用获取的三维数据建立相应的虚拟环境模型。三维数据的获取可以采用CAD技术(有规则的环境),而更多的环境则需要采用非接触式的视觉建模技术,两者的有机结合可以有效地提高数据获取的效率。
(2)实时三维图形生成技术
三维图形的生成技术已经较为成熟,其关键是如何实现“实时”生成。为了达到实时的目的,至少要保证图形的刷新率不低于15帧/s,最好是高于30帧/s。在不降低图形的质量和复杂度的前提下,如何提高刷新频率将是该技术的研究内容。
(3)立体显示和传感器技术
虚拟现实的交互能力依赖于立体显示和传感器技术的发展。现有的虚拟现实还远远不能满足系统的需要,例如,数据手套有延迟大、分辨率低、作用范围小、使用不便等缺点;虚拟现实设备的跟踪精度和跟踪范围也有待提高,因此有必要开发新的三维显示技术。
(4)应用系统开发工具
虚拟现实应用的关键是寻找合适的场合和对象,即如何发挥想象力和创造力。选择适当的应用对象可以大幅度提高生产效率、减轻劳动强度、提高产品开发质量。为了达到这一目的,必须研究虚拟现实的开发工具。例如,研究虚拟现实系统开发平台、分布式虚拟现实技术等。