2.1 深度学习训练所需的硬件
2.1.1 英伟达显卡选型
对于深度学习训练来说,核心的执行硬件是显卡。TensorFlow官网对显卡要求是:CUDA®计算能力为3.5或更高的NVIDIA®显卡。参考英伟达官网( https://developer. nvidia.com/cuda-gpus#compute,CUDA显卡列表),如图2-1所示。
如1.4.3节所述,基于迁移学习的模型训练,普通的计算机+显卡就能满足要求了。很多人有个思维定势:深度学习必须上高性能服务器,没有最高配的CPU和高性能的显卡(如Tesla V100、Tesla T4、GeForce RTX 2080Ti)是无法完成深度学习的。实际上,深度学习的硬件配置很大程度上是由任务和使用环境来决定的,请参考华盛顿大学博士Tim Dettmers结合竞赛经验给出的显卡选择建议(参考链接:https://timdettmers.com/2019/04/03/which-gpu-for-deep-learning/),本书的建议如下。
入门级:如图2-1所示,GeForce GTX 1050/1060/1070等都是性价比非常高的显卡选择。CPU对深度学习训练影响不大,Intel 8代CPU i3-8100及以上型号都行;若已有台式计算机,只需要在上面加装一个GeForce GTX 1050/1060/1070或类似的显卡即可,这是业界公认的性价比最高的选择。
图2-1 CUDA GPUs列表
比赛级:若想参加深度学习比赛(如Kaggle),用一块高性能的显卡是有必要的,如GeForce RTX 2080Ti,如图2-2所示。高性能显卡主要体现在CUDA核心数和显存上, CUDA核心数越多,计算速度越快;显存越大,支持的Batch Size(批尺寸)也就越大,即同一批训练的数据也就越多。
科研级:为了快速迭代实验结果以及训练更大规模的模型以提升性能,多GPU并行计算是标准,如4块或8块GeForce RTX 2080Ti或Tesla T4。
图2-2 GTX 1060 vs RTX 2080 Ti
2.1.2 英伟达显卡驱动安装
本书在写作时,TensorFlow的版本为1.13.1,该版本支持CUDA10.0 , CUDA10.0要求NVIDIA®GPU驱动程序版本为410.x或更高。
在Windows设备管理器中查看NVIDIA显卡属性页面,若驱动程序版本后五位是高于410.x的,则可以跳过本节,不用安装显卡驱动,如图2-3所示。
图2-3 查看GPU驱动程序版本
若驱动程序没有安装,或者驱动程序版本低于410.x,则需要下载并安装NVIDIA®GPU驱动程序,具体步骤如下。
第一步,到NVIDIA®GPU驱动程序下载页面https://www.nvidia.com/Download/index.aspx?lang=en-us#,根据所用的GPU型号选择驱动信息,本书选择的信息如图2-4所示。
图2-4 NVIDIA®GPU驱动程序下载页面
第二步,选择好GPU驱动程序信息后,单击“SEARCH”按钮,进入下载页面。然后单击“DOWNLOAD”按钮,下载GPU驱动程序,如图2-5所示。
图2-5 下载GPU驱动程序
第三步,双击下载的安装文件431.60-desktop-win10-64bit-international-whql.exe (不同的版本命名会有所不同),选择图形驱动程序即可。因为Geforce Experience是一款专为游戏玩家设计的软件,它可以帮助Nvidia显卡用户快速升级驱动、优化游戏设置等,对深度学习训练没有什么帮助。单击“同意并继续(A)”按钮,如图2-6所示。
图2-6 选择图形驱动程序
第四步,选择“精简”安装,如图2-7所示,然后单击“下一步(N)”按钮,完成整个NVIDIA®GPU驱动程序的安装。
图2-7 选择“精简”安装
2.1.3 测试驱动程序安装
安装完毕后,请重启计算机,然后打开“设备管理器”,在“显示适配器”下面能看到NVIDIA GeForce GTX 1060,如图2-8所示,说明NVIDIA®GPU驱动程序安装成功了。
图2-8 测试驱动程序安装
NVIDIA显卡驱动没有安装或者没有安装成功的话,会显示“Microsoft 基本显示适配器”。
2.1.4 设置英特尔®集成显卡为系统主显示输出
为了把NVIDIA显卡的计算资源全部释放出来,建议将“Primary Display”的设置改为“IFGX”,这样英特尔®集成显卡会作为主显示输出。
默认情况下, BIOS中Chipset→System Agent (SA) Configuration→Graphics Configuration→Primary Display的设置是Auto,意思是当插上独立显卡时,独立显卡会作为主显示输出,请把Auto改为IFGX,如图2-9所示。不同主板厂商的BIOS设置菜单略有不同。需要注意的是:在NUC 9(石英峡谷、幽灵峡谷)上不需要在BIOS中设置主显示输出,只要将显示器接到集成显卡的视频输出即可。
图2-9 设置英特尔®集成显卡为系统主显示输出
2.1.5 AINUC:便携式AI训练“服务器”
如2.1.1节所述,个人入门学习AI,最简单的方式是在PC上加装一张独立显卡,这样可以不用被动辄超10万元人民币的AI训练服务器阻挡在学习AI的门口。
当前,主流的办公学习用的是笔记本电脑,而非PC。笔记本电脑是无法加装一张满足AI训练要求的独立显卡的,所以,一个便携式的具备AI训练能力的迷你计算机,将是配合笔记本电脑做AI训练的最佳选择。
北京联合伟世科技股份有限公司作为英特尔®的资深合作伙伴,基于英特尔®NUC,为广大人工智能学习者、开发者及应用者推出了AINUC人工智能套件。其中,开发套件系列支持英特尔第九代酷睿及至强系列CPU,精心挑选了RTX2070、TESLA T4等多款人工智能计算卡,以满足专业用户的训练及推理需求,如图2-10所示。
图2-10 便携式AI训练“服务器”
AINUC人工智能开发套件与AI训练相关的性能参数如下。
● 第9代酷睿或至强系列CPU,可选。
● RTX2070或TESLA T4,可选。