1.4 GPT简述
ChatGPT的发展史不仅代表了人工智能技术的发展,也代表了整个科技领域的进步,是产学研各界的科学家、工程师不断努力共同树立的一座丰碑。从算法侧描述ChatGPT的发展史,如图1.12所示,从1950年基于规则的第一代AI应用,到后面从机器学习逐渐演变到对不同种类深度学习模型的不断探索,直到2017年Transformer架构的发表,深度学习领域的模型才开始逐渐趋于统一。现在,基于Transformer的两种重要模型:GPT和BERT,也都经历了长足的发展。
图1.12 算法侧ChatGPT的发展史
GPT系列模型经历了1代、2代、3代、3.5代,到现在是GPT-4,下面分别详细阐述。
(1)GPT-1:GPT系列的第一个模型于2018年发布。GPT-1采用了Transformer架构,是单向(Unidirectional)语言模型。它使用了1.17亿个参数,可以生成较为连贯的自然语言文本,但在长文本和复杂任务中表现有限。它开创了能够训练没有标注的网页文本数据的先驱。
(2)GPT-2:GPT-2于2019年发布,采用了和GPT-1相同的基本架构,但参数量增加至15亿个,扩大了训练数据集的规模。这使得GPT-2在生成文本、文本摘要、机器翻译等任务中表现更为卓越。同时,在某些情况下,GPT-2可能会生成偏颇或不真实的信息。
(3)GPT-3:GPT-3于2020年发布,在架构上基本延续了GPT-2的设计,但参数量大幅提升至1750亿个。同时,它使用了更大的训练数据集,具备卓越的生成能力和泛化能力。GPT-3在多种任务上表现出色,如问答、摘要、翻译、代码生成等。然而,模型庞大的参数量也使得部署和运行成本较高。
经过了多代的发展与迭代,基于GPT-3.5的ChatGPT终于迎来了爆火,开启了AI新纪元。相较于GPT-3,ChatGPT具有以下几个主要优点。
(1)更强大的模型:ChatGPT采用了更大的模型和更多的训练数据,这意味着它可以更好地理解输入,生成更准确和更高质量的回答。
(2)更精细的调优:ChatGPT进行了更多的针对性调优,使其更适合解决各种实际应用场景中的问题,从而更有效地满足用户需求,提供更优秀的用户体验。
(3)更好的上下文理解:ChatGPT对上下文的理解能力得到了显著的提高,可以更准确地跟踪对话的进展并做出合适的回应。
(4)持续更新和改进:作为一款持续更新和改进的产品,ChatGPT在不断地学习、适应新的知识和场景,以便更好地满足用户的需求。
(5)广泛的应用场景:ChatGPT可以应用于各种场景,如客户服务、教育、创意写作、知识问答等,能够为不同领域的用户提供有价值的帮助。
(6)开发者友好:ChatGPT提供了API和工具,使得开发者可以轻松地将其集成到各种应用中,从而创造出更多有趣、实用的产品和服务。
正是因为这些优点,ChatGPT在功能、性能和应用范围等方面都超越了GPT-3,实现了“听得懂、答得好”,进而受到了更广泛的关注和欢迎。
GPT-4在GPT-3.5的基础上有了进一步提升,在很多任务上的性能优于GPT-3.5,包括处理复杂问题、生成自然文本和理解语境等方面,可以参考图1.13中OpenAI公司官方提供的考试成绩对比。对比GPT-3.5,GPT-4的主要提升如下:
(1)模型规模:规模更大,拥有比GPT-3.5更多的参数,从而具备更强大的处理能力。
(2)训练数据:使用了更丰富的训练数据,使其具备更广泛的知识。
(3)零样本学习:在零样本学习方面的性能更优,意味着它能更好地泛化到新任务。零样本学习指让模型只根据任务描述完成任务,使用者不给模型提供任何示例。
(4)容错性:更擅长纠正输入中的错误,使生成的文本更自然、流畅。
(5)多模态任务、生成控制、强化学习、安全性和可靠性、对话能力等方面也有所改进。
图1.13 GPT-3.5与GPT-4考试成绩对比
在认识以ChatGPT为代表的大语言模型强大能力的同时,也要知道其现有的不足。无论是基于GPT-3.5还是GPT-4,ChatGPT仍有三大类问题:
(1)回答的内容有真有假。
(2)不是实时内容。
(3)复杂任务处理能力有待提升。
第1类问题,是大家经常碰到的,比如,让ChatGPT简述一个胡编乱造的情节,它竟然煞有介事地编出一大段,如图1.14所示。
图1.14 ChatGPT生成的虚假信息
第二类问题不是实时内容,这是一个既定事实,因为ChatGPT和GPT-4的训练数据截止于2021年9月前,所以不能查询实时信息,缺乏时效性。
第三类问题,对于比如写复杂代码、理解长篇连贯文本等复杂任务,ChatGPT仍不能有效地处理,包括在各个细分领域的垂直应用也都尚未涉及。