第1章 时代已至
1.1 新一代人工智能崛起
1.1.1 一盘围棋引发的关注
“人工智能”(Artificial Intelligence)早在1956年达特茅斯会议(Dartmouth Conference)上就被公开提出,几十年间经历了数次沉浮,近几年来,才再次成为世界关注的焦点。2016年3月,DeepMind公司的AlphaGo利用深度学习(Deep Learning)技术,以4∶1的成绩战胜了韩国围棋职业九段棋手李世石。2017年5月,AlphaGo又以3∶0的总分战胜了中国围棋职业九段棋手柯洁。2017年10月,DeepMind公司推出的利用强化学习(Reinforcement Learning)技术的AlphaGo Zero,能够无师自通,从零开始,在3天内通过自我博弈490万盘棋局的强化学习后,以100∶0的成绩打败了AlphaGo。
人工智能自从诞生的那一刻起,仿佛就爱与下棋较劲,当跳棋、国际象棋等被一一征服后,人工智能又将目标投向了围棋。围棋似乎是一个不可能完成的任务,因为十九路围棋的全部合法路数约为2×10170种,这是一个号称比宇宙中质子总数1.57×1079还多的数字。人工智能竟然在围棋上战胜了人类,这在全世界引起轰动也就不足为奇。
对人工智能有一定认识的人们可能知道,这次围棋对战的关注度之高,还有一个重要原因,那就是AlphaGo是一个跨界综合。人工智能被认为是分而治之,主要有3个学派,即符号主义(Symbolism)学派、连接主义(Connectionism)学派和行为主义(Actionism)学派,它们各自独立研究问题。然而,AlphaGo背后整合了这三家不同学派的算法,是一个集大成之作。
这些事情让人们重新认识到了人工智能的强大,一些媒体甚至将2016年称为人工智能的发展元年。图1-1是全球人工智能热度折线图,折线的数字代表指定时间范围内全球对人工智能的搜索热度。根据图1-1中的数据可知,从2016年开始,全球对人工智能的关注出现了显著的增长。
图1-1 全球人工智能热度折线图[1]
那么,AlphaGo真的那么厉害吗?如果离开围棋,它还能做什么?以AlphaGo为代表的此轮人工智能技术的本质是什么?是否真的如马云所说,机器会把人们最快乐的东西剥夺掉,并侮辱了我们一把?当AlphaGo下出了那步大师公认的臭棋之后,它的反应是什么?AlphaGo是否真的“智能”?只有认清这些背后的实质,才能正确地利用好人工智能,同时不再产生困惑。
前Google的机器学习负责人约翰·詹南德雷亚(John Giannandrea)曾说:“我们仿佛置身于人工智能的春天。”
1.1.2 人工智能助力工业革命
工业革命的开端要从英国说起。现在被更多人接受的是,至今为止共发生了4次工业革命,而“第四次工业革命”这一概念由德国在2013年的汉诺威工业博览会上正式提出,旨在推动德国工业继“蒸汽机时代”“电气化时代”“信息化时代”之后,于正在到来的“智能化时代”中占领先机。美国对“工业革命”的定义与德国不同,认为“工业革命”需要包含“新能源技术”“新通信技术”和“新经济体系”,如图1-2所示,虚线以下部分为美国对工业革命历史的定义。[2]
图1-2 图解四次工业革命[3]
第一次工业革命发生在18世纪60年代至19世纪40年代的英国。该次革命在当时成功地将需要人力完成的工作机械化,以蒸汽机为动力,大大提高了工作效率。19世纪中期发生的第二次工业革命的核心是美国和德国。电力使工厂能够大规模生产,并推进化学技术的创新。当机器在20世纪50年代后使用计算机实现自动化时,就出现了第三次工业革命。
至于这些年我们经常听到的第四次工业革命,也就是“工业4.0”,指的是因物联网(Internet of Things,IoT)而改变的世界产业结构。随着人工智能带来了数据收集和分析技术的进步,机器在没有人工指示时也能自行运行,产业界因此确立了新的“自动化”风向标。下面以四次工业革命的细节进行一些概述。
1.第一次工业革命的潮流:蒸汽机的出现与工作效率的提高
第一次工业革命的先行者是英国。在当时的英国,许多农民因一次又一次的农业革命(圈地运动)而失去土地。他们涌入城市,导致了城市内劳动力过剩。另外,资本家从奴隶贸易中获利,并正在扩大业务。海外殖民地也十分广阔,铁、煤、棉花等资源丰富。充足的资源和过剩的劳动力为第一次工业革命提供了基础。
时值英国对棉织物的需求增加,由于棉花具有比羊毛织物更轻、更易于管理的优点,发展棉花工业成了资本间的共识。钟表匠约翰·凯伊(John Kay)开发了一种名为“飞梭”的能够在纵线之间简单通过横线的机器,提高了棉布的生产效率。此外,詹姆斯·哈格里夫斯(James Hargreaves)发明了“珍妮纺织机”,理查德·阿克赖特(Richard Arkwright)发明了“水力纺织机”,均可以大量生产棉纱。
随后的几年,托马斯·纽科门(Thomas Newcomen)发明的“蒸汽机”经过不断改良,成为当时所有“机遇”的原动力,社会的生产力也随之提高。为了低价快速地运输原材料和产品,交通设备方面也有了提升。蒸汽船和蒸汽机车投产并实用化,给海上交通和陆地交通带来了新时代。
第一次工业革命使英国被称为“世界工厂”,它的发展也推动了世界经济。另外,英国国内也出现了人口集中、低工资、工厂周边贫民窟化、疫病等问题。工业革命传播到其他国家是在英国国内革命基本完成的时候。以英国解禁机械出口为契机,19世纪30年代先后传至比利时、法国,之后又扩展到美国和德国。
2.第二次工业革命:从轻工业到重工业
第二次工业革命从时间角度来讲与第一次工业革命没有明确的界限,它指的是19世纪70年代至20世纪初期的革命。特征是从轻工业向重工业转型,主要涉及国家是美国和德国。标志性事件是德国发明了汽油发动机。与蒸汽机相比,它拥有更小的尺寸,该技术推动了汽车和飞机的实际应用。福特和通用汽车等汽车公司在企业内部整合了从材料到成品的装配线,实现了“大规模生产”。另一个标志性事件是美国的爱迪生改进了灯泡,加快了电能的产业化。
美国和德国在快速发展,被称为“世界工厂”的英国反而落后了。主要因为在当时,货币在金本位制度下得以稳定,而英国从殖民地也顺利获利,这使其错过了第二次工业革命的“起跑优势”。终于在19世纪末期,美国的经济实力跃居世界第一,德国也拥有了超越英国的经济实力。
3.第三次工业革命:计算机的出现
第三次工业革命发生在20世纪50年代左右,与第二次世界大战后的日本经济高速增长几乎同期。因为,此次工业革命的推动剂是电子计算机的大范围普及,所以该次革命又被称为“数字革命”。它使我们可以使用计算机替代与人类智能相关的工作。在人类的指挥下,机器可以依照命令自动运行,实现了自动化生产。
随着IT在制造业和分销行业的引入,世界迅速实现了数字化。不仅技术需要不断创新,公司所需的人力资源也开始发生巨大变化。与过去需要大量劳动力和需要“协作”相比,随着生产效率和生产力的提高,人员的需求逐渐转向了对“主观能动性”的追求,“自律自主”成了选拔人才的新标准。
4.第四次工业革命:工业4.0
工业4.0是指以智能制造为主导的第四次工业革命。万物互联,所有“事物”都连接到互联网,加之人工智能、能源、材料等技术的进步,因此导致或推动各种产业结构的变化称为第四次工业革命。第四次工业革命中社会的新目标是提高人工智能的准确性,即使人类不发出指令,计算机通过自己判断,也能够采取最佳行动。因此,“智能”一词也就成为工业4.0的重要特征之一,而人工智能也在第四次工业革命中扮演了举足轻重的角色。
通过万物互联,各国都在试图利用各种战略创造新的商业模式。德国政府于 2011年启动的国家项目,标志了第四次工业革命的开始。长期以来,德国一直保持着欧洲最大的制造业国家的地位,但除了国内高劳动力成本问题,德国也饱受着美国IT公司插足制造业引发的危机感。
德国的目标是通过物联网协调人员和设备,通过虚拟现实技术(Virtual Reality,VR)改革运营系统,利用大数据和云进行活化管理,以满足每个消费者的需求为目标进行大规模定制化生产。通过这些技术可以降低成本和减少库存,并实现制造业的新的理想形式。
我国在前三次工业革命中都没有抢到先机,所以对我国而言,第四次工业革命无疑是一次实现国力和社会基础弯道超车的难得机会。在发展新时代的支柱行业、龙头企业的同时,借助工业革命引发的管理结构、生产力结构的更新换代,淘汰或改善近年来高速发展带来的管理模式和政策漏洞,进一步完善中国特色治理模式也成为此次工业革命中的一个重要命题。在欧美经济发展迟滞的当下,世界也在期待着中国等新兴市场的革新,能够给世界经济注入新的、不同以往的活力。
不同于记录在书本上的前三次工业革命,第四次工业革命正在进行中。新的机制和商业模式将在未来被逐一发现并推广,将被引入我们的实际生活中,这对每个生活在这个时代的人来说,都是一次难得的机遇与挑战。
5.工业革命的影响
可以说,18世纪第一次工业革命的最大影响是产生了第二次革命。而第三次工业革命到第四次工业革命的变迁使得人们的生活发生了翻天覆地的变化。
在前三次工业革命的进程中,一方面,那些首先感受到社会变革并发动工业革命的国家在经济和军事领域得到了红利,成功地富国强军。另一方面,许多没有经历过革命的国家成为殖民地一般的存在,在全球经济中长期处于被奴役的地位。
工业系统也发生了变化。工业革命使得社会从与自然和谐相处的农业社会向工业社会转变,同时也带来了二氧化碳排放过度等环境问题,以及城镇人口集中问题。人们的生活方式已经改变,商品和服务也有所增加。
到城市工作的工人以工资为生,无法像农民一样自给自足,必须购买生活用品。各种产品的数量也因此不断增加,以家庭为单位提供的服务也在发生着变化。此外,随着机械化进程的推进,在机械力量和电子设备面前,性别差异被模糊化,妇女对社会的参与度也大大提升,男女平权运动得到了推进。
在正在进行的第四次工业革命中,计算机可以通过“学会思考”来降低整体生产成本。除了生产力和生产效率的提高,很多发达国家也期待这次革命能够改善并解决随着出生率下降和人口老龄化导致的劳动人口不断减少问题。
如何应对第四次工业革命,让可以预见的社会结构重大变化“软着陆”,是当今各国和各大公司所面临的新一轮能力测试。
一方面,人工智能对人们的工作方式及生活方式产生了巨大的影响,正在颠覆各行各业并重塑我们这个时代,如智能医疗、智能金融、智能制造、智慧农业、智慧安防、无人驾驶、智能家居等领域;另一方面,人工智能正在与各行业进行深度融合,并为社会的发展带来根本性变革。
从2019年的Gartner新兴技术成熟度曲线(如图1-3所示)的结果来看,新兴技术在未来5~10年将对商业、社会和人类产生重大影响,分为五大趋势:
● 感知和移动性(Sensing and Mobility)
● 增强人(Augmented Human)
● 后经典计算和通信(Postclassical Compute and Comms)
● 数字生态系统(Digital Ecosystems)
● 高级人工智能和分析(Advanced AI and Analytics)
这些新兴技术很多都与人工智能相关。人工智能与各行业融合得如火如荼,对人才的要求也变得越来越高。因此,在中小学阶段教授人工智能相关知识,对学生进行科普,能够增长他们的视野,培养他们的兴趣,令有志学习人工智能的学生进入高校后可以进一步深造,这对中国人工智能人才储备有着极为重要的推动意义。
图1-3 Gartner新兴技术成熟度曲线[4]
1.1.3 人工智能促进社会发展
人工智能在许多方面,如语音识别、图像识别等方面,已经超越人类。人工智能也从实验室研究发展到应用于诸多商业化相关产品中,这些产品的相继生产与推广,让人们真实感到了人工智能的存在,人工智能的发展进入了新时代。
此次人工智能的崛起,得益于大数据、算力和算法“三驾马车”并驾齐驱,也称人工智能的三要素。三者的关系可以简单概括为数据是水、算力是船、算法是船的动力系统,如图1-4所示。
图1-4 人工智能的三要素
尽管是并驾齐驱,如果非要在重要性上排序,笔者认为应该是数据为先,即三者中数据的地位最关键。自以深度学习为代表的一系列人工智能产品被研发出来,整个人工智能产业就离不开数据的支持。这不仅仅是因为概率统计模型需要扎根数据,也因为一个人工智能产品优劣的判断在很大程度上需要显示情境数据进行测试验收。
深层神经网络的算法核心设计出现于20世纪60年代末,但是当时的计算机及可信赖数据都无法满足这个算法模型进行进一步研究拓展,更遑论落地产业化应用,甚至很长一段时间内神经网络构建人工智能的尝试被看作异想天开。而随着时代的变迁,各行各业的数字化进展逐年递增,电子数据的总量不断上升。
IDC(Internet Data Center,互联网数据中心)的调查报告显示,2018—2025年全球数据圈将增长5倍以上,按照现有发展趋势,2018年全球数据圈为33ZB,到2025年将增至175ZB,其中,中国数据圈增速最为迅猛,平均每年的增长速度比全球快3%,预计中国数据圈将从2018年的7.6ZB增至2025年的48.6ZB。[5]如此庞大的数据总量和数据增量给深度神经网络的发展和商业落地提供了土壤,哪怕是近几年新出现的突破性算法略有缩减,但短时间内仍然看不到颠覆性创新理论出现的苗头,即人工智能对大数据的依赖这一现实条件在未来的较长一段时间内不会改变。
另外,深度神经网络模型也可以看作一种统计概率模型,这类模型的一大特征就是数据越多、越优质,则算法的表现也就越好。从这个角度来看,只要深度神经网络模型这个核心不变,数据,更正确地说是优质的大数据,就会一直是人工智能三大要素中无法回避的重心所在。
再说算法。算法是三大要素中最被人津津乐道的,因为它既“高大上”,又“矮穷矬”。说它“高大上”,是因为人工智能算法在很多人类都难以解决的问题上屡屡打破纪录,如物体识别、交通违章实时判定、高精度文字翻译、多语言语音输入、无接触体温检测等。而说它“矮穷矬”,是因为很多算法都是以开源形式共享在网络上的,很容易进行入门尝试。
近年来,人工智能算法的发展受到了数据的一定影响。随着大数据总量的攀升,并行算法等适合同时进行多线程计算的算法受到了欢迎,但是大量的数据并不意味是大量有效的数据。随着应用开发场景的逐渐细化,大数据在很多场景的条件制约之下就变成了小数据。例如,想用1000张厨具的照片生成一个餐具识别应用,但开发目的要具体化,于是目标变成了西餐厨具的识别,合适的照片一下子就只剩下300张了,假设训练高信赖度模型的最少样本数是500张,那么该项目就一下从大数据变成了小数据。这类情况也催生了很多自生成数据的算法,争取在数据不足的情况下有效地扩充训练数据的大小。也有研究者另辟蹊径,试图从近似工作的成品模型进行迁移学习(Transfer Learning),从而做到少量数据的深度学习。[6]
人工智能的发展催生了很多产业,一些公司会雇用“专业”员工给原始数据贴标签,通过人为加速特定场景数据的增长来满足研发需求,这个产业被称为“人工智能数据标注业”。为什么要在专业上标注引号呢?因为此专业非彼专业。这些员工虽然也是从事人工智能的工作,看似专业,然而仅仅是专业在图上打标,做着简单、重复的工作。然而,这些员工打标的正确率却直接影响着日后分析的准确程度,在这个环节中,甚至可能产生人为的伦理问题。说来可能不信,这些员工的工资甚至可能低于当地平均工资。
随着以人工智能为核心的第四次工业革命的发展,必然会产生很多新的领域,新兴的领域意味着新兴的数据场景、数据类别。没有不经累积就从无到有的大数据场景,所以面向小数据集的人工智能算法的研发在较长的时间内将会一直是一个值得研讨的课题方向。
最后说算力。不同于算法和数据的相互影响,算力的发展相对独立,从狭义的角度看,其主要取决于芯片产业的技术升级。在芯片设计理论没有跨越式的发展或突破式的创新下,硬件精度的提高是推动算力升级的主要因素,台湾积体电路制造股份有限公司(简称台积电)在2020年将芯片工艺水平提升到了5nm,苹果手机的处理器A14就是采用了这个级别的工艺,苹果在其发布会中提到过,相比基于7nm工艺的处理器A12,处理器A14在CPU、GPU功率上性能提升了40%,而在AI芯片的处理能力上,A14可以达到11.8万亿次/秒的运算能力。
然而,工艺不可能无止境地提升,现阶段半导体的尺寸缩小已经接近了极限,当前晶体管的三维结构工艺的节点就是7nm,继续向下突破,所需要的研发经费和研发周期都会陡升,现在5nm级芯片的技术仍在不断改良。尽管三星和台积电都发布了关于进一步提升技术精度至3nm的研发计划,但技术升级的时间点可能要推到2025年前后,其所带来的效率提升速度,相比数据和算法两驾马车仍旧稍显不足,单纯在制造工艺角度追求突破越发艰难。
因此,很多芯片厂商也在不遗余力地寻找硅的替代材料,期待新材料的更优物理性质能够帮助芯片生产迈向更加精细化的时代,但这不是短时间内可以实现的事情。现今的芯片技术在算力方面的贡献更主要体现在精度提升、芯片小型化所带来的场景订制芯片的便利性上。根据各行各业在计算方面的特征和需求,定制化的生产对应的芯片,如倾向于语音识别的芯片、善于图像处理的芯片、兼顾5G网络架构的芯片等。
数据、算法、算力是此轮人工智能崛起的三大要素,在以人工智能为驱动的第四次工业革命浪潮中,三大要素前行的方向都会对人才供给产生巨大的需求压力,在新一代人工智能教育培养中,对这三要素定位的清晰认知和有方向性的教育学习,是适应产业改革时代的不二法门。