上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人
1.2.5 机器视觉与人的视觉关系
机器视觉是研究如何能让计算机像人类那样通过视觉实现测量和判断等行为的学科。视觉实际上包含两个方面:“视”和“觉”,也就是说机器视觉不仅要捕获场景信息还需要理解场景信息。具体来讲,它是利用相机和计算机代替人眼,使得机器拥有类似于人类的对目标进行分割、分类、识别、跟踪、判别和决策的功能。对人类来说非常简单的视觉任务对于机器却可能异常复杂。在很多方面,机器视觉的能力还远远不如人类视觉,原因在于人类经过大量的学习、认识和了解,已经对现实世界中存在的各种事物有了准确、完善的分类归纳能力,而计算机则缺少相应的过程,就像一个婴儿很难分清不同的人,很难辨别物体的形状和外观、人的表情等,但经过不断与外界的交互、学习就能逐渐掌握对事物和场景的识别和理解能力。让计算机达到人类的视觉能力需要一个完善的学习过程。此外,生物的眼睛经历了5亿多年的进化,视觉系统不断完善,而相机的出现才短短100多年。
在图像理解等高级机器视觉问题上,计算机的视觉能力通常低于人类。人类及其他生物的眼睛具有的强大功能,所以机器视觉研究过程中借鉴了生物视觉的功能原理,比如Gabor滤波器的频率和方向表达同人类视觉系统类似,卷积神经网络的构建参考了人类大脑提取视觉信息的方式。