第二节 医学文献数据库检索与利用
不同的数据库有不同的检索方法,为了方便用户检索,数据库平台都提供灵活的检索方式和帮助功能。如图4-1所示,进入中国生物医学文献数据库首页就可看到快速检索、高级检索、主题检索等不同检索方式,检索输入框下面还有帮助功能。不同数据库的详细检索方式可参阅每一数据库的使用说明。
虽然不同的数据库有不同的检索方式,但文献检索有一些通用的规则,为了实现检索目标,首先要分析主题概念,确立检索用词。检索用词首选规范化的主题词,同时可利用自由词、同义词、近义词、相关词、缩写词、词形变化等做辅助性检索,以提高查全率,避免漏检。确定检索用词后,下一步要构建检索表达式。检索表达式由检索词和各种布尔逻辑算符、位置算符、截词符以及系统规定的其他组配连接符号组成。常用的检索技术有布尔逻辑检索、截词检索、词组检索、邻近检索、字段检索、扩展检索和加权检索。
布尔逻辑检索是运用布尔运算符来表示检索词之间逻辑关系的检索技术,常用的运算符有逻辑“或”、“与”、“非”,逻辑运算如表4-2所示。运算符之间也有优先顺序,大多数系统“Not优先于And优先于Or”。截词有前截词、中截词和后截词,根据截词个数还可分为有限截词和无限截词,利用截词检索可以提高查全率。常见的截词符有?、*、$、# 等,不同的检索系统有所不同。词组检索可提高检索准确度,通常用引号来表示。邻近检索是利用位置算符表示检索词与检索词之间位置关系的检索技术。这种检索技术通常只出现在英文数据库中。比较常见的几种运算符有:WITH、NEAR、NEXT、ADJ等,不同检索系统位置算符的规定有所不同。字段检索是一种限定检索词出现在数据库记录指定字段的检索技术。扩展检索指系统不仅能够检出含有该检索词的文献,还能检出与该检索词同属于一个概念的同义词或下位词的文献。加权检索是一种定量检索技术,在检索时首先查看检索词在数据库记录中是否存在,然后计算存在的检索词的权值的总和,只有当数据库记录的权值之和超过规定的阈值时才会被检索出来。提供加权检索的系统中,对权的定义、加权方式、权值计算、阈值确定等的标准与方法并不完全一致。
表4-2 布尔逻辑算符检索表达式
由于中文数据库检索相对简单,这里以“在PubMed数据库中检索2013年肿瘤药物治疗的综述文献”为例来说明PubMed的检索方法。PubMed检索主要有简单检索、高级检索、主题词检索、期刊检索和引文检索等等。对于该例,可以利用高级检索快速地查到文献。首先登录PubMed主页(http://www.ncbi.nlm.nih.gov/pubmed/)点击查询框下面的Ad-vanced,如图4-3所示,在All Fields中分别输入tumor, drug和therapy,在Publication Type中输入review,在Date-Publication中输入2013/01/01to 2013/12/31。然后点击Search,查询结果显示2013年有5084篇综述文章提到肿瘤药物治疗。仔细阅读会发现有些文章与主题的相关度并不是很高,有没有方法可以做一些限制来提高查准率呢?
图4-3 PubMed高级检索页面
主题词是经过规范化处理的词汇,主题词检索对于提高查全率和查准率有很大的帮助。在PubMed主页左上角下拉菜单中选中Mesh,然后输入tumor,页面显示与tumor相关的主题词列表,点击选中规范化的主题词Neoplasms然后选择副主题词drug therapy并选中“Restric to Mesh Major Topic”前的复选框,表明对该主题词进行药物治疗副主题词的限定。点击“Add to search builder”这时可以出现检索式“Neoplasms/drug therapy”[Majr],点击search PubMed,在返回的页面左边有过滤条件选项,在Article types下选择Review,在Publication dates下选择from 2013/01/01to 2013/12/31,这时显示有2516篇文章命中。
从这个例子中可以看出,数据库有灵活的检索功能,针对某一检索主题,采用自由词检索往往会得到较多的检索结果,需要进一步人工筛查才能得到确切的文献,而主题词检索可以将检索结果进行限制,利于检索结果聚焦。对于同一检索主题,检索流程的不同会产生不同的检索结果,需要个人依据检索习惯不断实践摸索。