药学文献检索(全国中医药行业高等教育“十四五”规划教材)
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

三、药学文献检索语言

(一)检索语言的概念

检索语言是根据文献检索的需要创造的人工语言,是在文献标引、文献检索工作中用来描述文献外部特征或文献内容特征及检索提问的一种专门语言。它能使文献存贮者和检索者达到同样理解,实现存取统一,其实质是表达文献主题的一系列概念标识。

文献检索包括存贮和检索两个部分。存贮是指编制检索工具和建立检索系统;检索则是利用这些检索工具和检索系统来查找所需的文献,连接文献存贮与检索这两个密切相关过程的正是检索语言。当存贮文献时,文献标引人员首先要对各种文献进行主题分析。即把文献包含的主题内容分析出来,使之形成若干能代表文献主题的概念,再用检索语言的标识把这些概念表示出来,然后纳入检索工具或检索系统。当检索文献时,检索人员将检索课题进行主题分析,明确其涉及的检索范围,形成若干能代表文献需要的概念,并把这些概念转换成检索语言的标识,然后从检索工具或检索系统中找出用该标识标引的文献。

由此可见,在文献存贮和文献检索的过程中,检索语言起着规范和转换作用及知识组织和知识表示作用。因此,检索语言是检索系统的重要组成部分,它是沟通存贮和检索两个过程及让标引人员和检索人员双方思想交流的桥梁。

(二)检索语言的种类

检索语言按其构成原理可以分为多种类型,常见的主要是分类检索语言和主题检索语言两大类。

分类检索语言又称为分类法系统。国际上最广泛使用的《杜威十进分类法》和国内最广泛使用的《中国图书馆分类法》(简称《中图法》),属于分类检索语言。

主题检索语言又称为主题法系统,主要分为标题语言、单元词语言和叙词语言三种。国内医药行业影响最大的叙词表--《医学主题词表》(MeSH)及《中医药学主题词表》属于主题检索语言。

由于每一种检索语言在词汇控制的类型、程度及实施手段等方面的差异,分别形成了分类检索语言和主题检索语言各自不同的结构、功能和特点。因此,如果对分类语言和主题语言有计划地实施统一的词汇控制,则可以对不同的检索语言之间实现兼容和互换,从而建立一种全新的检索语言。

1.分类检索语言 分类检索语言是用等级列举的方法,层层纵横依次展开文献类目的一种人工检索语言,它是一种传统的分类语言。分类检索语言的依据是各种体系分类法或分类表。体系分类法是一种直接体现知识分类的等级概念的标志系统,它以科学分类为基础,以文献内容的学科性质为对象,运用概念划分与综合的方法,按照知识门类的逻辑次序,从总体到部分,从一般到具体,从简单到复杂,进行层层划分。每划分一次,产生许多类目;逐级划分,就产生许多不同级别的类目。所有不同级别的类目,层层隶属,形成一个严格有序的知识分类体系。每个类目都用分类号作分类标志,每个分类号是表达特定知识概念的词汇,从而展开成层累制的编号体系。《中图法》就是这种体系分类。

(1)分类语言的优缺点

①分类法符合人们认识事物的规律和处理事物的习惯,因此容易被人们接受。

②体系分类是按学科、专业集中文献,能系统地揭示文献内容特征,从学科或专业的范围检索文献,能够满足族性检索的要求,获得较高的查全率。

③体系分类是按知识门类的逻辑次序形成直线性等级关系,这一点不容易反映当代学科相互交叉渗透而出现的多元概念的知识文献,故不易准确标引和检索主题概念复杂的文献。

④由于受类目数量的限制,不能满足检索专业性较高的文献,故查准率不高。

⑤分类语言是一种先组式的标引语言,不能随时修改、补充。因此,当新兴学科和边缘学科一旦出现,往往编排在意想不到的类目下,造成检索上的困难。

⑥由于使用不同的分类号,在检索文献时,要将检索的主题内容转换成学科或专业名称,从大类到小类一层一层地查找,还要经过学科转换成分类号,再转成学科的过程,这样,不但慢而且容易出错,造成误标、误检,影响检索效率。

总的来说,体系分类语言比较适合于单一学科的专题文献检索,而不适合于多学科的主题和多维概念的情报检索。

(2)分类检索步骤

①分析课题内容,明确其学科属性。

②查阅检索工具的分类目次表,根据分类号(或分类名)确定需查检的类目,记录选定的类目所在页码。

③逐条阅读所确定类目下的文献著录,根据文献题目或文摘等提供的信息再次进行筛选,确定所需文献。

④抄录选定的文献题录或文摘。

⑤根据文献题录或文献所提供的线索获取原始文献。

2.主题检索语言 主题检索语言也叫描述检索语言,它是用自然语词作为检索标识系统来表达文献的各种属性的概念,具有表达能力强、标引文献直接、专指度较深等特点。主题性检索语言主要包括关键词语言、标题词语言和叙词语言三种,是检索工具中最常用的检索语言。

(1)关键词语言:所谓关键词,是指那些出现在文献的标题(篇名、章节名)以至摘要、正文中,对文献主题内容具有实质意义的语词,即对揭示和描述文献主题内容来说是重要的、带关键性的那些语词(可作为检索入口)。

关键词语言是适应目录索引编制过程自动化的需要而产生的。它与标题词和叙词同属于主题语言系统,都是以自然语言的语词做标识。但标题词语言、叙词语言都是对自然语言的语词经过严格规范化处理的,而关键词语言则基本上不做规范化处理,或者说仅做极少量的规范化处理。

概括地说,关键词语言是将文献原来所见的,能描述其主题概念的那些具有关键性的词抽出来,不加规范或只做极少量的规范化处理,按字顺排列,以提供检索途径的语言。

关键词是从文献的标题或正文中抽出来的自然语词,所以没有关键词表,而有控制抽词范围的非关键词表(禁用词表)。在电子计算机自动抽词的情况下,凡是非关键词表中未列出的词,都可作为关键词。而列入非关键词表的词都是些无实际检索意义的词,包括冠词、介词、连词、感叹词、代词、某些副词、某些形容词、某些抽象名词(如理论、报告、试验、学习等)、某些动词(如连系动词、情态动词、助动词)。

(2)标题词语言:标题词语言是在分类语言的基础上发展起来的。分类语言用代码标识符号代表文献学科主题内容,使用起来不直接。为了克服这一缺点,标题词语言直接用规范化语词对文献主题内容的概念进行标引,使检索者和存储标引人员一目了然。所谓标题(subject heading,意为主题标识)是指用以简略地表达文献主题的词语,是完全受控的一种主题标识。

标题词语言由主标题、副标题、说明语三部分构成。

①主标题:它是能表达文献核心内容的主题概念。一般由经过控制的自然语言中的词、词组和短语来充当,主标题是从主题途径检索文献的检索入口词。

②副标题:它是从某一特定方面对主标题进行说明、限定,并经过规范化的词、词组或短语。其基本作用是对主标题的以下方面进行限定说明。副标题所表达的是文献主题的某个部分、某一应用方面、研究对象和方法性质、场所以及文献类型。

③说明语:它是用来进一步详细说明和限定主标题、副标题的内容等方面的词、词组和短语,它由未经控制的自然语言表达,但不纳入词表正文,而是排在主标题、副标题之下。

标题词的词汇由标题词的选择标准、标题词的词义、标题词的词形、专指度及标题词词间关系控制。

(3)叙词语言:叙词是在标题词和关键词基础上发展起来的,叙词和关键词语言是目前使用较多的两种检索语言。叙词语言是规范性的后组式语言,但其与上述的检索语言不同的是,它既包括了单个的词,也包括了词组,它可以用复合词表达主题概念,是概念组配。叙词语言拥有规范性语言与后组式语言之优势,既在用词上达到统一,又有较好的灵活性,它与其他类型的检索语言相比,是一种多功能的较完善的检索语言,能大大提高文献检索的查准率和查全率。

(4)主题检索步骤:

①分析主题内容及其相互关系。

②查询主题词表明确主题词。

③通过副主题词表的查询确定主题词的具体方面,以明确副主题词。

④根据主题词与副主题词的搭配形式查找相关工具书的主题索引,或相关数据库的主题检索途径。

⑤根据主题索引中提供的流水号逐期索取文献题录或文摘,并依据内容决定取舍。

⑥索取原始文献。

另外,按照检索语言中所使用语词的受控情况,检索语言又可分为规范语言(controlled anguage)和非规范语言(uncontrolled language)。

规范语言,又称为受控语言或人工语言(artificial language),是采用经过人工控制了的规范性词语或符号作为检索标志,来专指或网罗相应的概念,这些规范化的标志能较好地对同义词、近义词、相关词、多义词及缩略词等概念进行规范。比如“肉苁蓉”这个概念有多个同义词:淡大芸、苁蓉等,人工语言则规定只能用其中一个词来表示所有“肉苁蓉”的概念,假如人为规定的词是“肉苁蓉”,那么无论原始文献中作者使用的是哪一个词,检索者只需用“肉苁蓉”就能将所有肉苁蓉的文献查找出来。因此,使用规范化的词能相对提高检索的效率,但对检索者和情报存储人员在选词上要求比较严格。在前面所述的标题词语言、叙词语言等都是规范性语言。

非规范语言,又称为非受控语言或自然语言(natural language),是采用未经人工控制的词语或符号作为检索标志,通常所说的自由词、关键词就属此类。一般当某些特定概念无法用规范词准确表达,或新出现的词语(如“非典”)还未来得及被规范化时,都需要使用非规范词。这类词语有较大弹性和灵活性,检索者可以自拟词语进行检索。在机检中,非规范词的应用比较广泛。但这类语言对一词多义、多词一义的词语,检索就相对困难些。在后面所述的关键词语言就是一种非规范语言。

(三)《中国图书馆分类法》简介

1.基本结构 《中国图书馆分类法》(简称《中图法》)由书目文献出版社出版,1975年出版第1版,到2010年已经出版第5版。《中图法》属于一种等级体系分类语言。它以各门学科的特点和规律为基础,按照知识门类的逻辑次序,将学科划分为五个基本部类、二十二个基本大类。《中图法》的五个部类为:马克思主义、列宁主义、毛泽东思想,哲学,社会科学,自然科学,综合性图书。

(1)基本部类、22个基本大类

马克思主义、列宁主义、毛泽东思想……A马克思主义、列宁主义、毛泽东思想、 邓小平理论

哲学…………………………………………………B哲学、宗教

社会科学…………………………………………C社会科学总论

                 D政治、法律

                 E军事

                 F经济

                 G文化、科学、教育、体育

                 H语言、文字

                 I文学

                 J艺术

                 K历史、地理

自然科学…………………………………………N自然科学总论

                 O数理科学和化学

                 P天文学、地球科学

                 Q生物科学

                 R医药、卫生

                 S农业科学

                 T工业技术

                 U交通运输

                 V航空、航天

                 W环境科学、安全科学

综合性图书………………………………………Z综合性图书

再以这22个大类为基础,从总到分,从一般到具体,层层划分,逐级展开为二级类目,从而构成了《中图法》的简表。简表再进一步层层展开,最终形成等级分明、次第清楚的详细分类表(简称详表)。这样就形成了一套完整的分类体系。

在《中图法》中的分类标记符号,又称为分类号,它是用来代表各级类目名称的代号,用以标记每一个类在分类体系中的位置,表达类目之间的先后次序。

《中图法》的标记符号是采用汉语拼音字母与阿拉伯数字相结合的混合制号码。用汉语拼音字母顺序来表示22个基本大类的序列。在字母之后用数字表示大类下类目的划分。数字的设置采用小数制。分类号的位数一般能够表达其概念的大小,号码较短的代表较大、泛指的概念,号码较长的通常是专指的概念。当一个类号数字超过三位时,为使号码清楚、醒目,用小圆点“.”作为相隔符号,起易读、易记作用。根据类目的不同等级给予相应的不同位数号码,它不仅能表示类目的先后次序,还能表示类目的等级及其相互关系,这就是层累制,又叫等级标记制。它的特点是层层隶属,等级分明,下一级类目必须包括其上一级类目的号码,同一级类目的类号前几位必须相同。从分类号上可以看出类与类之间关系,反映类目表的结构特点。《中图法》基本上遵循层累制的编制原则。

(2)简表:简表是在基本部类的基础上进一步分划出来的基本大类,主要为第一、二级类目。基本大类多为独立学科,或由相关密切的学科组成,它是整个分类法的骨架,起着承上启下的作用,反映的是分类法的分类概貌。

(3)详表:详表由各级类目组成,是分类法的主体,也是文献分类标引和分类检索的依据。在结构和内容上,它是由简表扩展而成。详表之中,类目间的排列遵循一定的原则,反映了学科间的联系。

2.《中图法》的药学类目及其查找 医药、卫生类图书是医学、药学、卫生学图书的总称。其中药学一般包括生药学、药理学、药剂学等学科。掌握了分类法体系结构和图书内容的学科性质,在图书馆查找资料时,既省时、省力,又能迅速、准确找到所需资料。要查找某一类或某一本书时,先根据书的具体内容找到基本部类和基本大类。例如:查找《实验药理学》一书,这本书属于自然科学基本部类下的医药、卫生大类,其下列有许多二级类目:

R1 预防医学、卫生学         R74 神经病学与精神病学

R2 中国医学             R75 皮肤病学与性病学

R3 基础医学             R76 耳鼻咽喉科学

R4 临床医学             R77 眼科学

R5 内科学              R78 口腔科学

R6 外科学              R79 外国民族医学

R71 妇产科学             R8 特种医学

R72 儿科学              R9 药学

R73 肿瘤学

实验药理学属于二级类目里的“R9药学”,但二级类目并不是它确切的位置,它下面又可划分数个三级类目如下:

R91 药物基础科学

R917 药物分析

R918 药物设计

R92 药典、药方集(处方集)、药物鉴定

R93 生药学(天然药物学)

R94 药剂学

R95 药事管理

R96 药理学

R97 药品

R99 毒物学(毒理学)

三级类目中实验药理学编入R96药理学,而R96又可划分数个四级类目如下:

R961 药物的性质和作用

R962 化学药理学

R963 生化药理学

R964 精神药理学

R965 实验药理学

R966 分子药理学

R967 免疫药理学

R968 遗传药理学

R969 临床药理学

《实验药理学》一书的分类号为R965,如果想查找药理学方面图书馆都有些什么书,就在R96类号里查找,因为分类法具有凡能分入下一级类目的书,一定要具有其上一级类目的属性的特点。

(四)《医学主题词表》简介

《医学主题词表》(Medical Subject Headings,简称MeSH),由美国国家医学图书馆编辑出版,1960年出版第一版。自1963年开始,美国国家医学图书馆每年要对词表内容进行修改、补充和调整。《医学主题词表》有两种版本,一种是《医学主题词注释字顺表》(Medical Subject Headings Annotated Alphabetic List,简称MeSHAAL),专供标引、编目和联机检索使用。另一种版本即《医学主题词表》,是指导使用《医学索引》和《医学累积索引》主题部分的工具。《医学主题词注释字顺表》由中国医学科学院医学信息研究所翻译成中文版,在我国使用非常广泛。MeSH和MeSHAAL在收词范围、编排结构、使用方法等方面都完全一样,只不过是后者在某些主题词条目下列有一些注释。《医学主题词表》又包括字顺表、树状结构表和副主题词表三个部分。

1.字顺表

(1)字顺表中的词汇类型:字顺表包含的词汇类型有款目词、主题词、特征词和非主题词等。这些词均按字顺排列。在1991年前字顺表包括的词汇有:款目词、主要叙词、次要叙词、特征词和非主题词等。在1991年所有的次要叙词全部升为主要叙词,即主题词,所以字顺表中不再有次要叙词。

①主要叙词(major descriptor):是一种从来不以see under参照出现的主题词,机检时用作主题词检索文献,在《医学索引》中也能用作主题词检索文献。

②次要叙词(minor descriptor):是一种较专指的主题词,在词表中用“属”(see under)归入某一个主要叙词,而在该主题词下用“分”(XU)表示它们之间的从属关系。用次要叙词标引的文献只用于计算机检索。在印刷本即时通讯(instant messenger,简称IM)中,不收录次要叙词,有关次要叙词的文献,要在其上位类的主题词下查找。自1991年不再有次要叙词。

③款目词(entry terms):MeSH表中收入一部分不用作主题词的同义词或近义词,称为款目词,字顺表中用(see)和(X)参照指导读者使用正式主题词。

④特征词(check tags):如Animal、Human、Male、Child、Preschool等用于表达文献中涉及的特定内容,如动物、人类、性别、年龄组、文章类型等,通常用于计算机检索时作为特别限定条件使用。

⑤非医学主题词(Non MeSH):不用于标引和检索,只用于组织树状结构表,用来表达词之间的逻辑等级关系。

(2)字顺表的参照系统

①用代参照:用“see”(用)和“X”(代)表示,凡是词与词之间为同义或近义关系者,用此项参照。

②属分参照:用“see under”(属)和“XU”(分)表示,是表示上下位概念的包含与被包含关系的一种参照。它自1991年随次要叙词一同被取消。

③相关参照:用“see related”(参)和“XR”(反参)表示,是用以处理两个以上主题词在概念上彼此之间有某种联系或依赖的关系。两者可以互相参考,因而在各自的主题词下列出see related或XR,指引检索者从一个主题词去参考相关的其他主题词(在这些主题词下均收录有相关文献,以扩大检索范围,达到全面检索的目的)。

2.树状结构表 树状结构表又叫范畴表,它是将字顺表中所有的主题词和Non MeSH词按其学科性质、词义范围的上下类属关系,分别划分为15个大类,依次用A~N、Z代表。它是字顺表的辅助索引,帮助了解每一个主题词在医学分类体系中的位置,便于通过其上下级主题词的从属关系,扩大或缩小检索范围。它将字顺表中互不联系的主题词通过主题词所属学科体系和逻辑关系,加上一些必要的非主题词(Non MeSH)组成树枝一样的等级结构。

在每一个大类中主题词和Non MeSH词逐级排列,按等级从上位词到下位词,最多可达7级。用逐级缩排方式表达逻辑隶属关系,同一级的词按字顺排,第一级树状结构号均为一位数字,第二级以下结构号均用与级相等段的数字表示,中间用圆点隔开。一般来说,一个词归入一个类给一个号,但事实上有些主题词具有双重或双重以上的属性,这些词可能同时属于两个或多个类目,在其他类目亦给出相应的树状结构号,从而可以查出该词在其他类目中的位置。但是这些结构号只保留三级号码,三级以后的号码省略不写。

树状结构表的作用:

(1)可帮助从学科体系中选择主题词:树状结构表是按学科体系汇集编排的术语等级表,检索时若找不到适当的主题词,可根据检索课题的学科范围,在结构表中查到满意的主题词。

(2)可帮助进行扩检和缩检:在检索过程中如需要扩大或缩小检索范围,可根据树状表中主题词的上下位等级关系选择主题词。需要扩大检索范围时,选择其上位概念的主题词;需要缩小检索时,选择其下位概念的主题词。

(3)可帮助确定词的专业范围:在检索时树状结构表可以帮助确定词的专业范围,手检时便于确定主题词与副主题词的搭配。

3.副主题词表 《医学主题词表》专门列有与主题词配合使用的副主题词表。副主题词的重要作用之一是对主题词起进一步的限定作用,通过这种限定把同一主题不同研究方面的文献分别集中,使主题词具有更高的专指性。

副主题词表具有以下性质:

(1)专指性:每一个副主题词的使用范围仅限于它后边括号内的类目,并不是说任何副主题词和任何主题词都能组配使用。

(2)动态性:副主题词表每年随着主表的修订再版也在不断地修改变化,增加一些新的副主题词或删掉一些旧的副主题词,或者对某一副主题词的适用范围做一些修改和调整。

(五)《中国中医药学主题词表》简介

《中国中医药学主题词表》,由中国中医研究院(现中国中医科学院)中医药信息研究所编制,中医古籍出版社1996年12月出版。这是我国第一部中医药专业词表,其以独特的学术内涵和广泛的兼容性为中医药学在国内外的推广和应用创造了重要条件,提供了技术保证。

《中国中医药学主题词表》是一部规范化的、动态检索语言叙词表,它既适用于中医药学文献数据库的标引、检索和组织手工检索主题索引,也适用于中医药学书籍的主题编目,还可起到专业汉英词典的作用。其选词原则是:①选用在中医药学文献中经常出现,有一定使用频率的名词术语。②入选词应是词形简练,词义明确,一词一义,通过概念组配能表达特定的主题。③选用一定数量的泛指词,使词间具有上下位关系。④选用一些先组词以避免过多组配。⑤MeSH词表已收载词的处理原则:MeSH词表中的中医药词汇尽量收全,该表的西医药词一般不收;与MeSH词表同形之词加“△”符号以便识别。在参项中如参照本表未收的MeSH词则在该词后加(M)。

《中国中医药学主题词表》由字顺表、树形结构表、副主题词表、出版类型表、附表和索引表6部分组成。新版词表共收录正式主题词5806条,入口词1131条。

1.字顺表 字顺表又称主表,为本词表的主体部分,其收录全部正式主题词及入口词,是文献标引和检索的主要依据。它按汉语拼音字母顺序排列便于检索,以主题词中的单字为单位拼写汉语拼音。同音字按字形集中,首字音形相同者按第二字拼音排列,第二字相同时,按第三字排,依此类推。词中出现括号、连字符、逗号等符号时,不影响排序。其正式款目如下所示:

汉语拼音→ren dong teng

主题词名称→忍冬藤

主题词英译名→CAULIS LONICERAE

树形结构号→TD27.115.10.505

      TD27.125.350

标引注释→为忍冬科植物忍冬的干燥茎叶;属清热解毒药和祛风湿药

历史注释→95;1987-1994忍冬

检索注释→用忍冬检索1995前文献

参照项→C忍冬

代参照项→D金银藤

2.树形结构表 树形结构表又称范畴表,其根据中医药学学科体系,将全部主题词按学科门类划分,排列于14个类目59个子类目,该表明确地显示了每一个正式主题词之间的上下位关系及属分关系,是标引和检索时选用专指主题词的有力工具,也便于从学科角度选用主题词,还可供进行扩展检索之用。各类目采用MeSH相应的号码,其前冠以T(Traditional)组成双字母数字号码,各类目之下列出隶属于该类目的全部主题词,按主题词的属分关系逐级展开,呈树状结构。各词的词树号以最高一级类目的词号为首,下连数字组成,按级分段,以“.”分隔。根据树形结构号的分段可以显示主题词的级别。举例如下:

第一级 药用种子植物        TB6+

第二级 被子植物          TB6.10+

第三级 双子叶植物         TB6.10.15+

第四级 五加科           TB6.10.15.605+

第五级 人参属           TB6.10.15.605.20+

第六级 人参△           TB6.10.15.605.20.10

3.副主题词表 分为专题副主题词表和编目副主题词表两类。

(1)专题副主题词表:收录副主题词93个,其中11个为中医药学方面的副主题词,82个为MeSH副主题词,在标引和检索时用副主题词限定主题词,使主题方面更加专指。每个副主题词都规定了明确的定义和范围,对其允许组配的主题词类目做了严格的限定。此外对中医药学方面的副主题词,按上下位关系,以拼音顺序列出中医药学副主题词树形结构表,以利于做扩展检索及标引时减少概念相似副主题词的使用。具体示例如下:

汉语拼音→sheng chan he zhi bei

副主题词名称→生产和制备

副主题词英译名→production & preparation

副主题词英文缩写→SZ

允许组配的主题词类目→[TD]

副主题词定义或范围→与中草药、中成药、剂型等主题词组配,指其生产、加工、炮制和制备,如为中草药的炮制,应组配主题词“炮制”。

(2)编目副主题词表:收录资料类型副主题词51条,地理副主题词79条,语音副主题词24条,可供中医药学书籍编目使用。

4.出版类型表 收录MeSH词表中文献出版类型50个,按汉语拼音顺序排列,供标引和检索使用。

5.附表 收录了医学家姓名59条,按汉语拼音顺序排列,本表供书本式检索工具书编制及主题编目使用,在数据库的标引时按附表中医学家姓名格式填入标引工作单中的主题姓名项内,在检索时可以使用此附表。

6.索引表 是主题词的索引,包括汉语拼音索引、汉字笔画索引、英汉对照索引、中草药及药用动植物拉(英)汉对照[即拉丁文(英文)与汉语对照]索引五个索引表。