三、“中国版ChatGPT”名号的大战打响了
毫无疑问,ChatGPT的爆火在全球范围内引发了一场“人工智能狂欢”。一时间,资本圈热钱涌动,产业界蠢蠢欲动,创业者趋之若鹜……中国自然不想错过这波被认为是下一代人工智能革命的良机。
大部分国外类ChatGPT产品尚不支持中国用户注册,在短时间内,即使是谷歌或其他人工智能国际大厂,也不太可能为中国提供专属内容,这对中国企业来说意味着机会窗口,一场争夺“中国版ChatGPT”名号的大战就这么打响了!
虽然百度不是动作最快的,但绝对是最“焦急”的公司之一。
2023年2月7日14:08,百度官方微信公众号发布了一则标题为《官宣:文心一言》的消息。
点开后,里面只有寥寥数行文字:
给大家介绍下
我们的大模型新项目
文心一言(英文名ERNIE Bot)
敬请期待!
此外,配有2个注释:①百度在人工智能四层架构中,有全栈布局。包括底层的芯片、深度学习框架、大模型及最上层的搜索等应用。文心一言,位于模型层。②百度在人工智能领域深耕十余年,拥有产业级知识增强文心大模型ERNIE,具备跨模态、跨语言的深度语义理解与生成能力。
消息虽短,却清清楚楚地表明了百度的态度——我们在AI领域积累深厚,我们有类ChatGPT的产品。
随后,网上便出现了很多以“文心一言”命名的社交账号。百度方面表示,这些账号都不是真的,“文心一言”目前还处于上线前的冲刺阶段,3月将和大家正式见面。
也是因为给自己掐上了“3月完成内测”的倒计时,多位百度员工表示,高层下了死命令,要在一个月时间内看到产品。为此,百度也集结了公司在深度学习、自然语言处理(NLP)的核心人才,据了解,百度CTO王海峰任项目总指挥,其他带队高管还包括:百度集团副总裁吴甜(同时担任深度学习技术及应用国家工程研究中心副主任)、百度技术委员会主席吴华等人。
在2023年2月7日中午,奇虎360在互动平台表示,公司的人工智能研究院从2020年开始一直在包括类ChatGPT技术在内的AIGC技术上有持续性的投入,但截至目前仅作为内部业务自用的生产力工具使用,且投资规模及技术水平与GPT-3相比还有较大差距,各项技术指标只能做到略强于GPT-2。
虽然奇虎360坦承了技术差距,但此消息一出,公司股价在午后迅速涨停。第二天,奇虎360开盘再度涨停。截至第三日收盘,其已连续三天收获涨停板,股价创2022年4月以来新高。
时间来到2023年2月8日,有投资者在投资者互动平台提问国内知名人工智能企业科大讯飞:公司是否布局ChatGPT相关技术,是否有规划把该技术应用到相关产品中?
科大讯飞官方回应称,ChatGPT主要涉及自然语言处理(NLP)相关技术,属于认知智能领域的应用之一,公司在该方向技术和应用具备长期深厚的积累。科大讯飞主导承建了认知智能全国重点实验室(科技部首批20家标杆全国重点实验室之一),多年来始终保持关键核心技术处于世界领先水平,2022年就获得CommonsenseQA 2.0、OpenBookQA等12项认知智能领域权威评测的第一。同时已面向认知智能领域陆续开源了6大类、超过40个通用领域的系列中文预训练语言模型,成为业界最广泛流行的中文预训练模型系列之一,在Github平台的中文预训练模型的星标数达13 346,位列第一,是第二名的2倍。
同样在2023年2月7日的晚间,阿里巴巴的一名资深技术专家对外爆料,阿里巴巴达摩院正在研发类ChatGPT的对话机器人,目前已开放给公司内员工测试。从当时曝光的截图来看,阿里巴巴可能将人工智能大模型技术与钉钉生产力工具深度结合。
科大讯飞和阿里巴巴的消息给本就烧得正旺的火堆再添了一把柴,短短几天内,越来越多的科技企业“主动”或“被迫”加入了战局。当时的情形几乎可以用“避无可避”一词来形容——但凡某家上市企业和人工智能沾点儿关系,都会被ChatGPT的相关传闻所裹挟。
2023年2月9日,腾讯与字节跳动均对研发ChatGPT的传闻做出回应,但两家互联网大厂回应各不相同。
腾讯表示目前公司在相关方向上已有布局,专项研究也在有序推进。腾讯持续投入人工智能等前沿技术的研发,基于此前在人工智能大模型、机器学习算法及自然语言处理等领域的技术储备,将进一步开展前沿研究及应用探索。
字节跳动旗下PICO相关负责人则直接对传闻进行了否认,说消息不实,PICO目前没有采用类似ChatGPT技术的产品规划。不过,对于AI Lab是否正在研发ChatGPT,字节跳动没有做出回应。
2023年2月10日,京东云通过官方公众号发布了将推出“产业版ChatGPT”——ChatJD的消息,并公布ChatJD的落地应用路线图“125”计划。ChatJD将通过在垂直产业的深耕,快速达成落地应用的标准,并不断推动不同产业之间的泛化,形成更多通用产业版ChatGPT,构建数据和模型的飞轮,以细分、真实、专业的场景日臻完善平台的能力,最终反哺和完善通用ChatGPT的产业应用能力。
2023年2月20日,复旦大学自然语言处理实验室邱锡鹏教授团队发布了国内第一个对话式人工智能模型MOSS,邀请公众参与内测。MOSS可执行对话生成、编程、事实问答等任务。其命名灵感来自《流浪地球》中的人工智能MOSS,但该消息引来了不少骂声,很多人认为其行为是“碰瓷”“炒作”“蹭热度”。由于瞬时访问压力过大,MOSS服务器当晚被挤崩。
随后,MOSS官网发布公告回应称,MOSS还是一个非常不成熟的模型,距离ChatGPT还有很长的路要走。我们一个学术研究的实验室无法做出和ChatGPT能力相近的模型,MOSS只是想在百亿规模参数上探索和验证ChatGPT的技术路线,并且实现各种对话能力。声明中还透露,在MOSS完成初步的验证之后,复旦团队会将MOSS的经验、代码、模型参数开源。
2023年2月25日……
2023年2月28日……
2023年3月2日……
…………
截至本书成稿,国内已经有数十家厂商或机构发声,要么表示自家已有ChatGPT相关的技术积累,要么声称未来即将推出对标ChatGPT的产品、整合新技术到既有业务中,以至于“中国版ChatGPT”“中国版OpenAI”等概念在社交媒体上成为热门话题。
抛开炒作的因素,对于人工智能发展的三大要素(数据、算法、算力)来说,国内企业的确都有良好的基础。
在算法方面,ChatGPT的技术底座是大规模语言模型(LLM),其本质上仍是以深度学习为代表的技术长期发展和积累的结果,并未出现算法的革命性突破(相关技术解读详见本书第3章)。发布于2020年的GPT-3是具有1 750亿个参数的大模型,ChatGPT正是在此基础上进行改进的。
对于大模型来说,国内的几大互联网公司或科技巨头也都有各自的技术产品问世。百度有文心大模型,阿里巴巴达摩院有通义大模型,华为有盘古大模型……相比国外的一流模型,业界的共识是有两年左右的差距,但完全有赶超的可能。百度文心全景图如图1-4所示。
在算力方面,人工智能模型的训练和使用需要强大的算力。工信部发布数据显示,2021年,我国算力核心产业规模达1.5万亿元。截至2022年6月底,我国在用数据中心机架总规模超过590万标准机架,服务器规模近2 000万台,算力规模排名全球第二。另据《2021—2022全球计算力指数评估报告》显示,计算力指数美国为77分,中国为70分,分列世界前两位,中国算力水平与美国处于同一等级,差距并不大。
图1-4 百度文心全景图
在数据方面,ChatGPT的训练使用了大约45TB数据,其中包含多达近1万亿个单词的文本内容。在当前人工智能的发展阶段,大模型依旧是发展的主流,对于数据量的要求始终居高不下。从大数据资源看,中国拥有全世界最大规模的网民数量,有丰富的应用场景,在数据积累方面优势明显。
不过,一位北京大学教授曾分享过一组数据,表明了中文数据的质量现状:截至2021年,虽然简体中文互联网用户和英文互联网用户规模相当,但在全球排名前1 000万个网站中,英文内容占比为60.4%,中文内容占比仅为1.4%。这是ChatGPT的英文水平明显高于中文水平的原因,也是ChatGPT在模型的训练阶段被“喂”了更多英文语料的必然结果,这同样也可以成为中国企业发展ChatGPT应用的竞争切入点。
虽然国内已经具备了算力、数据及技术基础,但关键在于如何爆发。中国工程院院士、阿里云创始人王坚表示:“在同样多年技术积累的基础上,谁的技术积累到能够爆发的程度,这才是企业间的差异所在。”王坚指出,工业是应用新技术最好的地方。在电力行业、工业领域,我们可以找到比下棋更有高度的问题,引领下一波人工智能浪潮。如果能找到、解决好这样一个问题,对推动社会经济发展、人类生活变化,会产生更巨大、更积极的影响。