2.2 词法分析过程_编译系统透视：图解编译原理-QQ阅读男生都市网

上QQ阅读APP看书，第一时间看更新

2.2　词法分析过程

词法分析从第一个字符开始遍历，识别出字符“i”，如图2-4所示。

图2-4　识别出字符“i”

根据C语言的词法规则，以字母或下划线开头的符号是标识符，所以根据“i”就可以确定当前分析的符号是一个标识符，但这个标识符的全部内容是什么现在还无法确定，需要继续向后遍历。下面识别出“n”，如图2-5所示。

图2-5　识别出字符“n”

根据词法规则，标识符的后续字符可以是字母、数字或下划线，“n”符合规则，它属于当前这个符号，继续遍历。下面识别出“t”，如图2-6所示。

图2-6　识别出字符“t”

仍然符合规则。继续遍历，识别出“空格”，如图2-7所示。

图2-7　识别出空格并确定符号“int”

它不再是字母、数字或下划线，这意味着，当前这个标识符的全部内容是“int”。下一个字符是空格，如图2-8所示。

图2-8　继续识别空格

这个空格为什么要被再次识别呢？这是因为第一次识别的空格是“int”这个标识符的后续，意味着“int”是一个标识符的完整内容。完成“int”的识别后，词法分析进入对下一个符号的识别，识别的起始位置从上一个符号的终结位置的下一个字符算起，在此就是空格，于是此时再次识别这个空格。可见，对这个空格的两次识别，性质是不一样的，分别对应着对前后两个符号的处理。对于其他可以确定前一个标识符终结的分隔符，也会进行这样的第二次处理。

根据C语言规则，空格是间隔符，不是任何符号的起始，于是跳过它，继续向后遍历，陆续识别出“f”、“u”、“n”、“(”。当发现“(”时，不再符合标识符“字母、数字、下划线”的规则，于是可以确定，“fun”是一个完整的标识符，如图2-9所示。