2.4 关键词
关键词(Keywords)是为了满足文献标引或计算机检索及国际联机检索工作的需要,而从论文题名、摘要、层次标题以及正文中选出来的用以反映论文主题概念的关键性词或词组,是科技论文文献检索的标识。关键词应为规范的术语,通常位于摘要之后,3~8个较为合适。早在1963年,美国《化学文摘》(Chemical Abstracts, CA)从第58卷起就开始采用计算机编制关键词索引,实现了快速检索文献资料的主题。在科学技术信息迅猛发展的今天,学术界早已约定利用主题词来检索最新发表的论文。发表的论文若不标注关键词,文献检索数据库一般就不会收录此类论文,读者也就不会检索到。一篇论文的关键词选用恰当与否关系到该论文能否被检索及其成果利用率的高低。
2.4.1 关键词分类
关键词包括叙词和自由词两类。叙词也称正式主题词或主题词,是指收入《汉语主题词表》和专业性词表中,可专门用于标引或检索文献主题概念而从自然语言的主要词汇中挑选出来并经过规范化的词或词组。专业性词表主要有:《医学主题词表》(《MeSH主题词表》, MeSH为Medical Subject Headings的缩写);《航空航天叙词表》(《NASA叙词表》, NASA为National Aeronautics and Space Administration的缩写);《核科学技术叙词表》(《INIS叙词表》, INIS为International Nuclear Information System的缩写);《工程与科学词汇叙词表》(《TEST叙词表》, TEST为Thesaurus of Engineering and Scientific Terms的缩写)等。自由词是指反映论文主题中新技术、新学科尚未被主题词表收录的新产生的术语,或在叙词表中找不到即还没有规范化的词或词组。
2.4.2 关键词标引
关键词标引是对文献和某些有检索意义的特征(如研究对象、处理方法和实验设备等)进行主题分析,并利用主题词表给出主题检索标识的过程。进行主题分析是为了从内容复杂的文献中通过分析找出构成文献主题的基本要素,准确地标引所需的叙词。标引是检索的前提,没有正确的标引就不可能有正确的检索。科技论文应按叙词的标引方法标引关键词,尽可能将自由词规范为叙词。关键词标引可按GB/T3860—1995《文献叙词标引规则》的原则和方法参照各种词表和工具书选取;未被词表收录的新学科、新技术中的重要术语及论文题名的人名、地名也可作关键词(自由词)标出。
1.基本原则
关键词标引应遵循专指性原则、组配原则和自由词标引原则。
1)专指性原则
专指性是指一个词只能表达一个主题概念。若在叙词表中能找到与主题概念直接对应的专指性叙词,就不允许选用词表中的上位词或下位词;若在叙词表中找不到与主题概念直接对应的叙词,而词表中的上位词确实与主题概念相符,即可选用该上位词。例如,对于“飞机防火”这一主题概念,在叙词表中可以找到与其相应的专指词“专机防火”,那么就应该优先选用“专机防火”,而不得选用其上位词“防火”标引,也不得选用“飞机”与“防火”这两个主题词的组配标引。
2)组配原则
组配是指概念组配,包括交叉组配和方面组配两类。交叉组配指两个或两个以上具有概念交叉关系的叙词所进行的组配,其结果可以表达一个专指概念。例如:“喷气式垂直起落飞机”,可用“喷气式飞机”和“垂直起落飞机”这两个泛指概念的词确切地表达叙词表中没有的专指概念;“肾结石”可用“肾疾病”和“结石”这两个叙词表示一个专指概念。方面组配指一个表示事物的叙词和另一个表示事物某个属性或某个方面的叙词所进行的组配,其结果可以表达一个专指概念。例如:“信号模拟器稳定性”可用“信号模拟器”与“稳定性”组配,即用事物及其属性来表达专指概念;“彩色显像管荧光屏涂覆”,可用“彩色显像管”“荧光屏(电子束管)”和“涂覆”三个词组配,即用事物及其状态、工艺过程三个方面的叙词表达一个专指概念。
在组配标引时,要优先考虑交叉组配,然后考虑方面组配。参与组配的叙词必须是与文献主题概念关系最密切、最邻近的叙词,以避免越级组配;组配结果要求所表达的概念要清楚、确切,只能表达一个单一的概念。如果无法用组配方法表达主题概念,可选用最直接的上位词或相关叙词标引。
3)自由词标引原则
自由词标引是指用叙词以外的词进行标引。在以下几种情况下允许采用这种标引方式:
(1)主题词表中明显漏选的主题概念词;
(2)表达新学科、新理论、新技术、新材料等中新出现的概念;
(3)主题词表中未收录的地区、人物、产品等名称及重要数据名称;
(4)采用组配原则其结果会出现多义的概念。
自由词应尽可能选自其他词或较权威的参考书、工具书,所选用的自由词必须概念明确、简洁精练、实用性强。采用自由词标引后,应及时做好记录,必要时可向叙词表管理部门反映。
2.标引方法
关键词标引的一般选择方法或步骤为:
(1)作者在完成论文写作后,纵观和通阅全文,对论文进行主题分析,弄清论文的主题概念和中心内容;
(2)尽可能从论文题名、层次标题、摘要及正文的重要段落中选出与主题概念一致的词、词组;
(3)对选出的词、词组排序,对照叙词表确定这些词的类别,找出哪些可直接作为叙词标引,哪些可通过规范化变为叙词,哪些可组配成专指主题概念词组,哪些需用自由词标引。
例如:“可重构制造系统中工件路径网络生成方法”一文的关键词有6个,分别为“可重构制造系统、路径网络、自动导引小车、多工艺路线、虚拟制造单元、设备布局”,其中前面两个选自论文题名,后面几个则是从论文层次标题和正文内容中选出的,补充了论文题名所未能表示出的主要内容,加大了论文所涉及概念的表达深度。
2.4.3 关键词标引常见问题
关键词标引时,应该用好《汉语主题词表》及其他主题词表、叙词表,标引时应该仔细查表,避免主题概念分析和词的组配有误;还要恰当选用自由词,只要是表达主题概念所必需的都可作为自由词标引,并列入关键词,但要注意控制自由词标引的数量。
以下列出科技论文关键词标引上存在的一些共性问题,希望引起作者和编辑的重视。
1)通用词过多
将无独立检索意义的通用词(泛指词),如“方法、研究、探讨、分析、报告、思路、措施、发展、理论、途径、策划、建议、创新”等作为关键词,缺乏对论文主题内容的专指性,不能准确概括全文的主题内容。用这样的关键词检索,结果必然将多学科文献中包含这类词的文献汇集到一起,形成一堆杂而乱的无用信息,降低文献的查准率,导致文献的错检。
2)主题词漏选、叠加
没有选出内容最为合适、数量足够的主题词,或将几个主题词叠加成一个词组当主题词用。不少作者完成论文撰写的主体工作后,要么带着应付的态度随便写几个词作关键词,要么仅局限于从标题或摘要中草率选取若干关键词,导致选取的主题词欠准确、不完整。另外,当有多个同级概念时,并未全部选取,而是轻率地选用它们的上位概念来代替,或者干脆将几个主题词叠加成一个词组来作关键词,这些情况都是应该避免的。
3)词性不当
将名词、术语或名词性词组以外的词或词组作关键词。有的作者错误地将虚词,动词、形容词、副词等实词,或一些偏正结构的词组作关键词,导致检索信息的混乱,失去了关键词应有的标引和检索作用。关键词应该是自行独立的,一般不应带有修饰词,也不宜用“和、与、而”之类的连词将几个关键词连结在一起所形成的词组作关键词。另外,一般不宜用人名作关键词,但重要人物除外,如马克思、毛泽东、邓小平等,但人名作关键词不要带官职。
4)排序不当
未按一定的规则、顺序排列关键词,未将词与词之间的逻辑关系反映出来,没有清楚明晰、层层深入地反映论文主题,造成层次不清、逻辑混乱以及对论文主题的误解。有的作者标引关键词的顺序相当随意,要么简单地以其在标题或正文中出现的先后顺序而定,要么凌乱堆砌,任意排序,使关键词的逻辑组合不能有效地揭示论文的主题,影响文献的检索。
5)深度不合适
没有把握好关键词的深度,关键词标引的数量不大合适。有的作者不了解标引深度对文献检索的影响,在关键词数量的选取上不加斟酌,要么过多,要么过少。过多时,标引深度虽然很高,但会增加一些不必要的“噪声”;过少时,标引深度过浅,检索时会造成有用信息的遗漏,难以全面反映论文的主题内容。
6)缩略词随意使用
随意使用非公知公用或自定义缩略词作关键词,造成阅读、理解困难。作者对专业通常比较熟悉,但使用缩略词时一般不大注意给出其全称(包括中英文名称),而是直接使用缩略词作关键词。关键词一般应是学术界或学科、专业内公知、公用的词语或专业术语。新产生的术语,应写完整而不宜简化,对非公知、公用的俗称、简称尽量少用,有确切术语、称谓的就不宜用俗称、代称,对自定义、自行简化的简称、缩略词应坚决不用。使用关键词全称时,为突出其简称或缩略形式,可在全称后面加括号,再在括号内给出其简称或缩略形式。
7)自由新词使用不当
随意使用一些新出现的、还未列入主题词表的自由词作关键词。新的名词、术语不断出现,通常不大可能被及时收录、更新到现有主题词表中,作者选用一些使用频度高的、为大众或专业人士广泛使用的作关键词,是非常必要的,也是时代进步的需要,这样就需要作者进行甄别,选出合适的词来。使用新的自由词时应看其是否符合下列条件:具有独立的检索意义;促进新的学科、技术发展;被国内外文献检索系统接纳;与国际知名刊物特别是知名检索刊物对关键词的选用相接轨。
在科技信息迅猛发展的互联网和大数据时代,如何从浩如烟海的文献中快速、准确、便捷地查找相关领域的研究现状及最新成果,科技论文中的关键词无疑起着举足轻重的作用。因此,科技论文是否录著关键词或关键词的标引是否恰当,直接关系到知名数据库的收录和论文被检索的概率,影响查全率、查准率以及该研究成果的被利用率和有效传播。关键词的正确标引对提高期刊被引频次和影响因子有重要意义,应引起足够重视。