代序
人工智能的先驱者艾伦·图灵在1950年发表了一篇划时代的论文《计算机器与智能》,文中提出了著名的图灵测试:“如果一台机器能够(通过电信设备)与人类展开对话而保证其机器身份不被识破,那么就可以认为这台机器具有智能。”在这篇论文发表后漫长的岁月中,AIGC一直备受关注,因为“创造力”曾经很长一段时间都被视为人类与机器最本质的区别之一,让机器学会创作的努力非常缓慢而艰难,写作、配乐、绘画、编程、视频等领域的“创意”“表现力”“个性化”更被视为人工智能不可逾越的鸿沟。
从1957年首支由电脑独立创作的弦乐四重奏《Illiac Suite》组曲,到2007年首部由电脑独立完成的小说《在路上》都是AIGC早期的杰出成就。但AIGC真正的腾飞始于2013年,深度变分自编码(VAE)模型首次以概率方式对潜在空间进行观察,产生了革命性的数据生成价值。紧接着在2014年出现了生成对抗网络(GAN),用零和博弈策略自我学习,带来了内容生成领域的突破。而里程碑式的突破出现在2015年,扩散模型(Diffusion)受到非平衡热力学的启发,从噪声中构建样本,这带来了如DALL-E2、Imagen、Stable Diffusion等一系列革命性的应用,让我们首次见证了一场深刻的生产力变革。人工智能的大模型预训练在2017年揭开序幕,由谷歌提出的Transformer模型采用注意力机制,进一步加速了预训练大模型的发展。正是这种预训练大模型让AIGC发生了质变,2022年面世的超级对答机器人ChatGPT正是其中最为瞩目的应用之一。
当今前沿的AIGC技术已经在产业各界形成了非常丰富的应用场景。人工智能不仅可以生成文字,还可以创作图片、音频、视频、3D模型、代码,自动生成各式各样的内容,这对人类来说,是一种非常新颖的信息技术表现形式,也意味着以数据驱动的业务创新有了更多的落地可能性。AIGC的发展和流行正在悄然引领一场深刻变革,不但重构和颠覆了数字内容的生产消费模式,更极大拓宽了人类通过数据认知世界、改变世界的能力,同时也再一次突出强调了数据要素对于产业创新的独特价值和意义。顶级的人工智能厂商纷纷入局AIGC技术的基础研发和应用场景创新,各个行业领域也都“嗅到”了AIGC技术可能带来的产业变革机会。尤其是ChatGPT的“优秀”成绩促使我们更加客观地审视大模型国产化的必要性,系统规划未来人工智能技术产业的突破和发展方向,深入探索人工智能技术如何与数字经济增长,以及全行业数字化转型战略布局落地深度契合与协同。
习近平总书记曾指出:“数字技术正以新理念、新业态、新模式全面融入人类经济、政治、文化、社会、生态文明建设各领域和全过程”[1],在当前数字世界和物理世界加速融合的大背景下,随着国家数据局的成立,我国的数据要素市场将进一步完善,对数据安全、数据治理的关注度不断提高。企业和社会机构的数据管理水平,数据相关业务的规范性也随着数字化转型进程的深化全面升级。在数据科学的技术创新方面,互联网企业、研究所、高校等多方产业主体已经形成了紧密的联动、互动,从实际应用需求出发,在算法、模型、理论、工具上不断地推陈出新,迸发出具有影响力的科技成果。人工智能的技术研发方向将逐渐从感知智能向认知智能的方向过渡和加强,快速覆盖到电商、文化、传媒、教育等更多具有经济价值潜力的市场应用场景。
本书是一本关于AIGC的前沿技术科普著作,笔者以ChatGPT为背景切入点,从信息编码、解码的独特视角,介绍了AIGC技术特色、基本原理和应用价值,同时详细系统剖析“揭秘”了ChatGPT的技术实现方法。本书结合人工智能三大流派的技术体系发展脉络,探讨了AIGC的核心技术理念,帮助读者更加深入地理解机器获得智能,呈现智能的底层逻辑,精准洞察未来智能化技术的发展趋势和产业化落地方向。
除此以外,本书还反思了AIGC技术可能带来的诸多争议性社会问题。例如,AIGC对职业替代的压力,AIGC技术对教育公平的影响,以及AIGC技术因为造假、危害言论等引发的道德和伦理问题。最后,本书畅想了以预训练大模型为中心的“下一代”AI技术概貌,讨论AIGC与企业数字化转型的关系,从数据获取、数据分析、数据生成等不同角度,阐释基于AIGC技术的更高级数字化应用场景构想,为企业智能化产业应用提供了更多启发性、建设性、革命性的实践创新思路。
新技术的产业,尤其是革命性新技术的产业一定会带来产业变革甚至产业革命。我最近一段时间集中全力进行产业研究,在这个时间点上,中国需要对前沿技术可能催生的前沿产业加大研究力度。它体现在两个方面:一是新技术引发的产业,二是新技术对传统产业的赋能。
我很高兴看到刘通、陈梦曦两位青年学者写了此书,他们都是我曾经任职过的上海交通大学安泰经济与管理学院的管理科学与工程学科博士研究生,陈梦曦是我配合田澎教授联合指导的博士研究生。我希望他们在这个领域里持续深耕,不断完善提升,跟上人工智能发展的脚步。
是为序。
何志毅
清华大学全球产业研究院首席专家
北京大学教授
中国国民经济管理学会会长
2023年3月于北京
[1]习近平向2021年世界互联网大会乌镇峰会致贺信[N].人民日报,2021-09-27(1)。