深度学习实践:计算机视觉
上QQ阅读APP看书,第一时间看更新

第2章
OpenCV入门

OpenCV的全称为Open Source Computer Vision(开源计算机视觉),由Intel公司的Gary Bradsky在1999年开始开发,第1版发行于2000年。它是一款免费的计算机视觉开源软件,由C/C++语言实现,提供了Python、Java、C++等接口,可以操作图像和视频,目前主要有第2版和第3版两个版本,第3版发行于2015年,运行更加稳定,性能更好,且部分支持OpenCL,本书将使用第3版,目前第4版正处于开发阶段。

OpenCV含以下几大核心模块。

● 核心函数模块:主要定义高维矩阵基础数据结构以及相应的处理函数。

● 图像处理模块:主要包含线性和非线性滤波(本质就是卷积操作)、几何变换、颜色空间转换和像素统计等功能。

● 视频模块:主要用作视频分析,包含运动预估、背景消除和目标追踪等功能。

● 3D校准模块:包含多视角算法、相机校准、姿态估计等功能。

● 2D特征模块:包含显著特征检测、描述等。

● 目标检测模块:进行预定义类的目标检测。

本章将介绍图像处理中最基础的常用操作(主要是读写及几何变换操作),然后简要介绍其人脸和眼睛检测自带算法的使用。