AI赋能:人工智能赋能中国企业升级
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

第一节 计算机视觉:给计算机装上眼睛和大脑,让计算机感知环境

2011年,IBM研发出了首款能模拟人类大脑的SyNAPSE芯片,当时仅为一个单核心的原型。

2014年,IBM对其进行重大升级,芯片核心共有100万个“神经元”内核、2.56亿个“突触”内核,以及4096个“神经突触”内核。

2015年8月,IBM推出首个基于SyNAPSE打造的芯片TrueNorth, 48枚TrueNorth芯片组建成的具有4800万个神经元的网络,智力水平已经比肩普通啮齿类动物。同时,IBM开发了超级计算机Watson,广泛应用于医疗、金融等多个领域。

只要给计算机装上眼睛,它就能感知世界。

1.何为计算机视觉

计算机视觉是使用计算机及相关设备对生物视觉的一种模拟,其主要任务是,通过对采集的图片或视频进行处理,得到相应场景的三维信息,就像人类和许多其他生物每天所做的那样。

计算机视觉是一门关于如何运用照相机和计算机来获取我们所需的,被拍摄对象的数据与信息的学问。形象地说,就是给计算机安装上眼睛(照相机)和大脑(算法),让计算机能够感知环境。

计算机视觉既是工程领域,也是科学领域中的一个富有挑战性的重要研究领域。这门综合性学科已经吸引了来自各个学科的研究者,其中包括:计算机科学和工程、信号处理、物理学、应用数学和统计学、神经生理学和认知科学等。

视觉是各个应用领域,如制造业、检验、文档分析、医疗诊断和军事等领域中各种智能自主系统中不可分割的一部分,非常重要,一些发达国家例如美国,早已将对计算机视觉的研究列为对经济和科学有广泛影响的科学和工程中的重大基本问题,即所谓的重大挑战。

计算机视觉的挑战是要为计算机和机器人开发具有与人类水平相当的视觉能力。机器视觉需要图像信号,纹理和颜色建模,几何处理和推理,以及物体建模。一个有能力的视觉系统,能够把所有这些处理都紧密地集成在一起。

作为一门学科,计算机视觉开始于20世纪60年代初,但在计算机视觉的基本研究中的许多重要进展是在80年代取得的。计算机视觉与人类视觉密切相关,对人类视觉有一个正确的认识,将对计算机视觉的研究非常有益。

计算机视觉的最终研究目标就是,使计算机能像人类一样通过视觉观察和理解世界,具有自主适应环境的能力。这是要经过长期的努力才能达到的目标。因此,在实现最终目标以前,努力的中期目标是建立一种视觉系统,依据视觉敏感和反馈的某种程度的智能完成一定的任务。例如,计算机视觉的一个重要应用领域就是自主车辆的视觉导航,但是目前还无法像人类一样识别和理解任何环境,完成自主导航的系统。因此,研究目标就是,实现在高速公路上具有道路跟踪能力,避免与前方车辆碰撞的视觉辅助驾驶系统。

2.计算机视觉的应用

人类正在进入信息时代,计算机将越来越广泛地进入几乎所有领域。一方面,更多未经计算机专业训练的人也需要应用计算机;另一方面,计算机的功能越来越强,使用方法越来越复杂。如此,在进行交谈和通信时的灵活性与在使用计算机时所要求的严格和死板之间,就产生了尖锐的矛盾。

人类可以通过视觉和听觉、语言与外界交换信息,可以用不同的方式表示相同的含义,而计算机却要求严格按照各种程序语言来编写程序,保证计算机的运行。为了让更多的人使用复杂的计算机,就要改变过去的那种让人来适应计算机、死记硬背计算机的使用规则的情况,取而代之的是,让计算机来适应人类的习惯和要求,以人类习惯的方式与人进行信息交换,让计算机具有视觉、听觉和说话等能力。这时,就需要计算机具有逻辑推理和决策的能力。具有上述能力的计算机就是智能计算机。

智能计算机不仅会让计算机更便于人们使用,同时使用这种计算机来控制各种自动化装置特别是智能机器人,也可以使这些自动化系统和智能机器人具有适应环境和自主作出决策的能力,在各种场合取代人的繁重工作,或代替人到各种危险和恶劣环境中完成任务。

在许多计算机视觉应用中,为了解决特定的任务,计算机被预编程。但基于学习的方法,现在正变得越来越普遍。计算机视觉应用的实例及应用系统:

(1)控制过程。比如,一个工业机器人。

(2)导航。比如,通过自主汽车或移动机器人。

(3)检测的事件。比如,对视频监控和人数统计。

(4)组织信息。例如,对于图像和图像序列的索引数据库。

(5)造型对象或环境。例如,医学图像分析系统或地形模型。

(6)相互作用。例如,输入到一个装置,用于计算机与人的交互。

(7)自动检测。例如,在制造业中的应用程序。

当然,最突出的应用领域是医疗计算机视觉和医学图像处理。该区域的特征是,信息从图像数据中提取,用于诊断患者。通常,图像数据是在显示显微镜图像、X射线图像、血管造影图像、超声图像和断层图像。

第二个应用程序区域中的计算机视觉是在工业,有时也被称为机器视觉。一个例子是质量控制,其中的信息或最终产品被自动检测。机器视觉还被大量用于农业。

军事上的应用很可能是计算机视觉应用最大的地区之一。最明显的例子是,探测敌方士兵或车辆和导弹制导。更先进的系统为导弹制导发送导弹的区域,而不是一个特定目标。

其他应用领域包括:①支持视觉特效制作的电影和广播,例如,摄像头跟踪(运动匹配)。②监视。