前言
近年来,随着深度神经网络算法的发展,人工智能应用的热潮席卷全球,以深度学习为基础的信息搜索、图像处理、机器视觉、自然语言处理、信息推荐、智能决策等技术已逐步应用在智能金融、机器人、智能安防、智能制造、智慧交通、在线传媒、在线娱乐等领域,推动了人工智能产业的飞速发展。
人工智能产业作为战略新兴产业得到我国政府的高度重视,2015年以来国家先后出台了《关于积极推进“互联网+”行动的指导意见》《“十三五”国家科技创新规划》《新一代人工智能发展规划》《促进新一代人工智能产业发展三年行动计划(2018—2020年)》等多项政策,积极推动人工智能产业快速发展。根据中国电子学会数据,2021年我国人工智能核心产业市场规模为1300亿元,相较于2020年增长了38.9%。根据《新一代人工智能发展规划》,预计2025年,我国人工智能核心产业规模将超过4000亿元,带动相关产业规模超过5万亿元。我国人工智能产业市场规模巨大,人工智能技术与产业正处于高速增长期,产业的发展需要人才来支撑,然而目前我国人工智能人才严重不足,根据2020年人力资源和社会保障部发布的《新职业——人工智能工程技术人员就业景气现状分析报告》,我国人工智能人才缺口超过500万,国内的供求比例为1:10,出现了严重失衡,如不加强人才培养,至2025年,人才缺口将突破1000万。因此,人工智能产业人才的培养是人工智能产业发展的基础性工程,积极建设人工智能学科专业、改革人工智能课程与教材、实现人工智能创新人才的培养是我国人工智能技术与产业发展的迫切需要。深度学习是人工智能技术进步与产业发展的核心引擎,开展对深度学习算法与加速技术理论及应用的研究,培养具备深度学习理论与加速技术相关知识的技术人才就显得更加重要。然而传统的深度学习基础与应用课程所采用的教材不够完善,大多只注重深度学习算法的基础理论阐述,而缺少对深度学习算法优化技术与加速技术的讨论,更缺乏基于深度学习的应用案例的分析,因此急需一本适合人工智能领域人才培养、偏重深度学习应用与加速技术实现的高水平教材。
基于以上需求,我编写了本书。本书内容分为理论篇与应用篇,适合具备不同基础的读者学习,旨在培养读者在深度学习算法及硬件加速方案设计方面的工程实践能力。本书不仅注重对深度学习基础理论的阐述,而且深入分析了处理梯度消失与过拟合现象、选择合适初始值、优化损失函数等深度学习算法设计中的关键技术,阐述了深度学习算法硬件加速技术基础理论,并给出了加速方案设计案例,非常有助于读者理解深度神经网络在实际应用中所遇到的难题并掌握其解决方法。本书具有以下四个特色:
1)不仅引入线性向量空间、内积、线性变换与矩阵表示、梯度等神经网络数学基础概念,而且结合神经网络算法应用重新定义这些数学概念的物理意义,以加强读者对基于内积、梯度等数学概念的人工智能算法的设计能力。
2)详细分析了梯度消失与梯度爆炸处理、过拟合消除、初始值选择规则、可变的学习速度、损失函数优化等深度学习算法设计中的关键技术,以增强读者对深度学习算法的理解以及算法设计能力。
3)解读了网络模型优化、计算精度降低与网络剪枝技术、SIMD计算架构与GPU加速、TPU计算架构与TPU加速、ASIC AI计算架构与FPGA加速等深度学习算法硬件加速技术的基础理论。
4)重点讲解了基于OpenCL的FPGA异构并行计算技术与基于OpenVINO的FPGA深度学习加速技术,引入灰度图像逆时针旋转、squeezenet网络目标识别等FPGA异构加速应用案例,以提高读者在深度学习算法设计及异构加速方案实现方面的工程实践能力。
本书在编写过程中,不仅受到了湖南省教育厅高水平研究生教材建设项目与长沙理工大学优秀教材建设项目的资助,而且得到了戴葵教授、研究生陈立等的鼎力相助,同时获得了Intel和Terasic对加速技术实验部分的大力支持,在此一并表示真挚的感谢。由于作者水平有限,加上时间仓促,书中难免有疏漏甚至错误之处,敬请同行和读者批评指正,作者的联系方式为baichuang@csust.edu.cn。