1.2 模块化ISA和增量型ISA
Intel曾将其未来押在高端微处理器上,但这还需要很多年时间。为与Zilog公司抗衡,Intel开发了一款名为8086的过渡产品。它本该朝生暮死,无任何后续产品,但事实并非如此。高端处理器姗姗来迟,等它最终面世时,性能却不如人意。因此,8086架构得以延续——它演化为32位处理器,最终又演化为64位。其名称不断更替(80186、80286、i386、i486、Pentium),但底层指令集丝毫未减。
——Stephen P.Morse,8086架构师(Morse,2017)
计算机体系结构的传统发展方式是增量型ISA,这意味着新处理器不仅需要实现新的ISA扩展,还必须实现过去的所有扩展。其目的是保持向过去的二进制兼容性,使数十年前的二进制程序仍可在最新处理器上正确运行。出于市场营销的目的,新一代处理器的发布通常伴随着新指令的发布。这两点需求共同导致ISA的指令数量随时间流逝而大幅增长。图1.2展示了当今主流ISA x86的指令数量增长过程。x86的历史可追溯到1978年,在漫长的生命周期中,它每个月大约增加3条指令。
图1.2 x86指令集自诞生以来的增长情况
x86在1978年诞生时有80条指令,2015年增长到1338条,翻了16倍,并且仍在增长。但图中数据仍偏保守。一篇2015年的Intel博客指出,统计结果为3600条指令(Rodgers et al.2017)。按这个数据,在1978年到2015年期间,x86指令平均每4天增长1条。我们统计的是汇编语言指令,他们统计的也许是机器语言指令。正如第8章所介绍的,增长的主要原因是x86 ISA通过SIMD指令实现数据级并行。
这种约定意味着x86-32(我们用它表示32位地址版本的x86)的每款处理器都必须实现过去扩展的错误设计,即便它们已无意义。例如,图1.3列出了x86的aaa(ASCII Adjust after Addition)指令,该指令早已失去用处。
图1.3 x86-32 aaa指令的功能描述
它以二进制编码十进制数(Binary Coded Decimal,BCD)的形式进行算术运算,但它已化为信息技术的历史尘埃。x86还有3条类似的指令,分别用于减法(aas)、乘法(aam)和除法(aad)。它们都是单字节指令,因此一共占用宝贵操作码空间的1.6%(4/256)。
打个比方,假设一家餐馆只提供价格固定的套餐,最开始只有汉堡加奶昔的小餐。随着时间的推移,套餐中加入了薯条,然后是冰淇淋圣代,还有沙拉、馅饼、葡萄酒、素食意大利面、牛排、啤酒,无穷无尽,最后变成饕餮盛宴。食客能在这家餐馆找到他们过去吃过的任何一种食物(尽管这样没什么意义)。然而,这对食客来说是一个坏消息,他们每次的餐费将随盛宴加量而不断上涨。
除年轻和开放之外,RISC-V还是模块化的,这与过去几乎所有ISA都不同。其核心是一个名为RV32I的基础ISA,可运行完整的软件栈。RV32I已冻结,永不改变,这为编译器开发者、操作系统开发者和汇编语言程序员提供了稳定的指令目标。模块化特性源于可选的标准扩展,硬件可根据应用程序的需求决定是否包含它们。利用这种模块化特性能设计出面积小、能耗低的RISC-V处理器,这对于嵌入式应用至关重要。RISC-V编译器得知当前硬件包含哪些扩展后,便可为该硬件生成最优代码。一般约定将扩展对应的字母加到指令集名称之后,以指示包含哪些扩展。例如,RV32IMFD在必选基础指令集(RV32I)上添加了乘法(RV32M)、单精度浮点(RV32F)和双精度浮点(RV32D)扩展。
如果软件使用了一条未实现的可选RISC-V扩展指令,硬件将发生自陷,并在软件层执行该指令的功能。此特性属于标准库的一部分。
继续用我们刚才的比方,RISC-V提供的是一份菜单,而不是一顿应有尽有的自助餐。主厨只需烹饪食客需要的食物,而不是每次都烹饪一顿大餐,食客也只需为他们点单的食物付费。RISC-V无须仅为市场营销的热闹而添加新指令。RISC-V国际基金会决定何时往菜单中添加新的选择,经过由软硬件专家组成的委员会公开讨论后,他们才会出于必要的技术原因添加指令。即使这些新的选择出现在菜单上,它们仍是可选的,不像增量型ISA那样成为未来所有实现的必要组成部分。