2.1 深度学习训练所需的硬件_深度学习图像识别技术：基于TensorFlow Object Detection API和OpenVINO? 工具套件-QQ阅读男生玄幻网

上QQ阅读APP看书，第一时间看更新

2.1 深度学习训练所需的硬件

2.1.1 英伟达显卡选型

对于深度学习训练来说，核心的执行硬件是显卡。TensorFlow官网对显卡要求是：CUDA^®计算能力为3.5或更高的NVIDIA^®显卡。参考英伟达官网（ https://developer. nvidia.com/cuda-gpus#compute，CUDA显卡列表），如图2-1所示。

如1.4.3节所述，基于迁移学习的模型训练，普通的计算机+显卡就能满足要求了。很多人有个思维定势：深度学习必须上高性能服务器，没有最高配的CPU和高性能的显卡（如Tesla V100、Tesla T4、GeForce RTX 2080Ti）是无法完成深度学习的。实际上，深度学习的硬件配置很大程度上是由任务和使用环境来决定的，请参考华盛顿大学博士Tim Dettmers结合竞赛经验给出的显卡选择建议（参考链接：https://timdettmers.com/2019/04/03/which-gpu-for-deep-learning/），本书的建议如下。

入门级：如图2-1所示，GeForce GTX 1050/1060/1070等都是性价比非常高的显卡选择。CPU对深度学习训练影响不大，Intel 8代CPU i3-8100及以上型号都行；若已有台式计算机，只需要在上面加装一个GeForce GTX 1050/1060/1070或类似的显卡即可，这是业界公认的性价比最高的选择。

图2-1 CUDA GPUs列表

比赛级：若想参加深度学习比赛（如Kaggle），用一块高性能的显卡是有必要的，如GeForce RTX 2080Ti，如图2-2所示。高性能显卡主要体现在CUDA核心数和显存上， CUDA核心数越多，计算速度越快；显存越大，支持的Batch Size（批尺寸）也就越大，即同一批训练的数据也就越多。

科研级：为了快速迭代实验结果以及训练更大规模的模型以提升性能，多GPU并行计算是标准，如4块或8块GeForce RTX 2080Ti或Tesla T4。

图2-2 GTX 1060 vs RTX 2080 Ti

2.1.2 英伟达显卡驱动安装

本书在写作时，TensorFlow的版本为1.13.1，该版本支持CUDA10.0 ， CUDA10.0要求NVIDIA^®GPU驱动程序版本为410.x或更高。

在Windows设备管理器中查看NVIDIA显卡属性页面，若驱动程序版本后五位是高于410.x的，则可以跳过本节，不用安装显卡驱动，如图2-3所示。

图2-3 查看GPU驱动程序版本

若驱动程序没有安装，或者驱动程序版本低于410.x，则需要下载并安装NVIDIA^®GPU驱动程序，具体步骤如下。

第一步，到NVIDIA^®GPU驱动程序下载页面https://www.nvidia.com/Download/index.aspx?lang=en-us#，根据所用的GPU型号选择驱动信息，本书选择的信息如图2-4所示。

图2-4 NVIDIA^®GPU驱动程序下载页面

第二步，选择好GPU驱动程序信息后，单击“SEARCH”按钮，进入下载页面。然后单击“DOWNLOAD”按钮，下载GPU驱动程序，如图2-5所示。

图2-5 下载GPU驱动程序

第三步，双击下载的安装文件431.60-desktop-win10-64bit-international-whql.exe （不同的版本命名会有所不同），选择图形驱动程序即可。因为Geforce Experience是一款专为游戏玩家设计的软件，它可以帮助Nvidia显卡用户快速升级驱动、优化游戏设置等，对深度学习训练没有什么帮助。单击“同意并继续(A)”按钮，如图2-6所示。

图2-6 选择图形驱动程序

第四步，选择“精简”安装，如图2-7所示，然后单击“下一步(N)”按钮，完成整个NVIDIA^®GPU驱动程序的安装。

图2-7 选择“精简”安装

2.1.3 测试驱动程序安装

安装完毕后，请重启计算机，然后打开“设备管理器”，在“显示适配器”下面能看到NVIDIA GeForce GTX 1060，如图2-8所示，说明NVIDIA^®GPU驱动程序安装成功了。

图2-8 测试驱动程序安装

NVIDIA显卡驱动没有安装或者没有安装成功的话，会显示“Microsoft 基本显示适配器”。

2.1.4 设置英特尔^®集成显卡为系统主显示输出

为了把NVIDIA显卡的计算资源全部释放出来，建议将“Primary Display”的设置改为“IFGX”，这样英特尔^®集成显卡会作为主显示输出。

默认情况下， BIOS中Chipset→System Agent (SA) Configuration→Graphics Configuration→Primary Display的设置是Auto，意思是当插上独立显卡时，独立显卡会作为主显示输出，请把Auto改为IFGX，如图2-9所示。不同主板厂商的BIOS设置菜单略有不同。需要注意的是：在NUC 9（石英峡谷、幽灵峡谷）上不需要在BIOS中设置主显示输出，只要将显示器接到集成显卡的视频输出即可。

图2-9 设置英特尔^®集成显卡为系统主显示输出

2.1.5 AINUC：便携式AI训练“服务器”

如2.1.1节所述，个人入门学习AI，最简单的方式是在PC上加装一张独立显卡，这样可以不用被动辄超10万元人民币的AI训练服务器阻挡在学习AI的门口。

当前，主流的办公学习用的是笔记本电脑，而非PC。笔记本电脑是无法加装一张满足AI训练要求的独立显卡的，所以，一个便携式的具备AI训练能力的迷你计算机，将是配合笔记本电脑做AI训练的最佳选择。

北京联合伟世科技股份有限公司作为英特尔^®的资深合作伙伴，基于英特尔^®NUC，为广大人工智能学习者、开发者及应用者推出了AINUC人工智能套件。其中，开发套件系列支持英特尔第九代酷睿及至强系列CPU，精心挑选了RTX2070、TESLA T4等多款人工智能计算卡，以满足专业用户的训练及推理需求，如图2-10所示。

图2-10 便携式AI训练“服务器”

AINUC人工智能开发套件与AI训练相关的性能参数如下。

● 第9代酷睿或至强系列CPU，可选。

● RTX2070或TESLA T4，可选。

本周热推：

After Effects 2022从新手到高手深度学习图像识别技术：基于TensorFlow Object Detection API和OpenVINO? 工具套件突破平面Photoshop UI界面设计与制作剖析 Photoshop案例实战从入门到精通印象笔记留给你的空间2.0：个人知识管理实践指南