人文社会科学领域文献计量学研究
上QQ阅读APP看书,第一时间看更新

第三节 人文社会科学领域文献计量学研究的热点问题

近十几年来人文社会科学领域的文献计量学研究主题主要涉及以下几方面:学术评价、期刊评价是近期的研究热点,也是在学术界引起广泛争议的话题;网络计量学作为一个新兴的研究领域,引起了人们的极大关注;可视化技术的研究和应用为进一步深入揭示和形象展示文献计量学研究成果提供了更加先进的手段;面向学科的文献计量学分析是文献计量学的重要应用。除以上内容之外,文献计量学研究的基础——数据库的建设与发展是学者们高度重视的问题,由于人文社会科学领域的文献特点,这个主题显得尤为重要。

一 数据源的开发与研究

全面、翔实、可靠的数据来源是进行文献计量学分析研究的基础。在人文社会科学领域,由于文献形式的多样性,除了一般引文分析的基础数据——引文数据库之外,还要充分依靠其他一些可以进行定量分析的数据源。

引文数据库是最常用的数据来源。目前使用最广泛、影响力最大的是汤森路透公司的社会科学引文索引(SSCI)和艺术与人文引文索引(A&HCI)。这两个数据库拥有较大的期刊量、国际性的收录原则、高质量的数据和很长的年代跨度,是目前进行国际性引文分析的最佳工具。

然而,受到人文社会科学文献的离散性和索引收录范围的限制,这两个数据库在收录的期刊数量和文种上覆盖面不足,所以一些国家和地区又开发了自己的引文索引,除中国大陆地区南京大学和中国社会科学院文献信息中心分别开发了中文社会科学引文索引(CSSCI)和中国人文社会科学引文数据库(Chinese Humanities and Social Sciences Citation Database, CHSSCD)之外,海外也有一些地区正在建立自己的引文数据库。台湾地区出于学术评价的需要,也于20世纪末开始建立台湾社会科学引文索引和台湾人文学引文索引(Taiwan Humanities Citation Index, THCI)。欧洲学者非常重视引文数据库的开发,他们认为应当建立欧洲自己的引文数据库。目前,欧洲人文引文索引正在建设之中。此外,一些国家还建立了专业引文索引,如波兰社会学引文索引(Polish Sociology Citation Index)等。

以上是传统的引文索引,是专门为了进行引文分析和文献检索而建立的,数据质量较高,具有较为强大的统计分析功能。

另外一类引文数据库是从文摘数据库发展而来的,最典型的是爱思唯尔公司开发的Scopus数据库,该库在题录数据库基础上增加了引文数据,并提供了针对引文的检索功能,因此期刊收录范围广,但是目前该库的数据回溯时间还不够长。

此外,还有一些文摘数据库也可以作为文献计量分析的基础数据。如剑桥科学文摘有100多个文摘数据库,这些数据库收录范围比引文库更广、数据量更大、数据的时间范围更长,具有较高的标引质量,其中很多都提供了叙词或经过规范的关键词,虽然不能进行引文分析,但是可以对来源文献进行统计,以及进行深度的主题分析。这类数据库中有的还收录了图书、报告等文献类型,可以弥补期刊引文数据库的不足,全面反映人文社会科学的现状。部分文摘数据库对于论文是有选择的,可以进行论文摘转率统计。

随着网络技术的发展,一些搜索引擎也提供了文献的引用信息,如Google Scholar。由于它界面简单,可以免费使用,而且检出的引文量还比较多,所以有时也被作为搜集引文数据的一种工具。但是由于缺少对引文的细致加工,没有公开数据收录范围、时间跨度和更新频率,因此还不能作为一种严格意义上的数据源。另外一些搜索引擎,如Altavista等,提供了检索网页链接数量的功能,常被用来搜集网络计量分析的相关数据。

一些进行自动引文标引的系统也具备了类似的功能,如CiteSeer、RePEc、Citebase,等等。其中RePEc是一个规模较大的经济学数据库系统,它的一个服务平台CitEc具有引文分析功能。但是该系统建设引文数据的目的是通过引用关系增加整个系统的可用性,改善系统的检索效果,还不宜直接利用它来进行评价性计量分析。

此外,还有图书馆的书目数据库、图书馆流通数据、电子资源的使用统计、搜索引擎的检索日志,甚至有关文献利用的专门调查数据等,都可以作为人文社会科学领域文献计量分析的基础数据。

虽然有如此多的数据源,但是依然没有一种数据源可以满足人文社会科学领域文献计量分析的大部分要求。因此,我们应当详细了解每一种数据源的特点,掌握它收录的文献类型、内容的时间跨度、语种范围、数据质量,以及适用范围等信息,针对研究的内容和采用的方法决定选择何种数据源。有时为了弥补数据的缺陷,需要同时使用几种数据源,必要时还需结合一些专门的调查数据共同进行分析。

二 学术评价研究

早在20世纪20年代前后,人们就开始利用出版物和引文来评价科学活动。随着现代科学走入大科学时代,政府对科学研究的投入越来越大,科学研究的社会影响越来越广泛,科学研究的绩效评估工作也变得越来越困难、越来越昂贵和越来越重要。在这样的背景下,各种科学评估指标应运而生,并在国际间迅速蔓延开来,产生了巨大影响。其中,文献计量学相关指标受到很大关注。

从当前的实际情况看,部分国家在评价体系中采用了文献计量学指标,而另外一些国家的评价方法仍以同行评议为主。文献计量学指标只适用于部分学科,有时仅作为基础资料供评价者进行参考,同行评议仍然是国际上多数国家进行人文社会科学评价的最主要方法。然而,尽管在各国科研管理机构的评价制度中,文献计量学方法使用得还不是很广泛,但是在实际的科研活动中,文献计量学的相关指标还是直接或间接渗透到单位对科研人员的聘用、升职等很多方面。

文献计量学方法在学术评价中的应用一直是个有争议的话题。在人文社会科学领域,人们对利用文献计量学方法进行学术评估的争议更大。专家们也一再提示,要谨慎利用文献计量学方法进行与经费、职位等直接有关的学术评价。但是,这并不意味着否定文献计量学方法在学术评估中的作用。通过理论分析和实证研究,国外的学者目前已经达成如下共识:

(1)人文社会科学文献的分布和利用规律不同于自然科学。文献类型的多样性、语言的离散性、研究主题本地化等特点,导致文献的国际化趋势没有自然科学强,英语也不总是学术研究的通用语言。因此仅仅利用以英文期刊为基础的引文数据不能全面揭示全球人文社会科学研究的特点。

(2)社会科学领域中部分学科(如经济学、社会学等)的文献特点与自然科学较为接近,因而比较适合利用引文数据进行学术评价,而以图书为主的人文领域则不宜利用目前的期刊引文数据库来评价。

(3)可以利用文献计量方法在宏观层面进行绩效评估和比较,但是对于微观层面的使用则要谨慎。

(4)分析时除了利用引文数据库之外,还要充分依靠其他一些可以进行定量分析的数据源。

(5)文献计量方法经常要结合其他评价方法如同行评议、问卷调查等一同进行,尽量避免只使用文献计量学指标或仅仅使用单一的文献计量学指标进行评估。

文献计量学指标的利用有很多先决条件,不满足条件的滥用必然导致评价结果的不合理。目前存在着一些对文献计量学方法的误用,这些误用导致了学术界对计量方法的误解,这是该方法在学术界受到强烈抨击的重要原因。

三 核心期刊研究

对核心期刊的早期研究基本上围绕着图书馆馆藏建设进行。但是近年来,由于学术评价中越来越多地利用了核心期刊的评价指标,因而核心期刊早已不仅仅局限在图书情报相关学科,逐步渗透到期刊管理、科研管理等多个领域,甚至成为整个学术界的热门话题。

核心期刊的概念源于布拉德福对期刊的分区。早期的研究侧重于从数学角度对布拉德福定律进行验证、解释及对其局限性的分析,近期则更多地进行核心期刊的遴选实践,以及各种评价和测度指标的开发和应用。

海外的期刊评价开始得很早,形成了较为成熟、稳定的方法。最有影响的是汤森路透对其系列引文数据库来源期刊的选择,以及JCR的期刊统计指标。中国大陆地区核心期刊的遴选实践始于20世纪80年代对外文科技核心期刊的14遴选。1992年,北京大学《中文核心期刊要目总览》出版了国内第一部包含人文社会科学及自然科学各学科的中文核心期刊目录。从此,中文核心期刊研究和遴选工作成为核心期刊领域的主流工作,全国开始了大规模、全学科的核心期刊目录遴选。人文社会科学领域的核心期刊表在21世纪得到迅速发展,出现了由不同机构制作出的多种不同的核心期刊表。近年来,台湾地区教育部门也很重视利用引文方法进行学术论文排名,因此台湾地区也开始建设自己的引文数据库,主要目的是用于学术评价。1999年开始建立的台湾社会科学引文索引,其来源期刊经过严格筛选,可以作为台湾地区社会科学的核心期刊。

由于一些机构将核心期刊作为定量评价的重要手段,用于个人的职称评聘和年度考核,因而遭到学术界的抨击。很多学者对于核心期刊的负面效应都进行过激烈的批评,其核心是反对“以刊评文”。

当前核心期刊研究的另一个重要方面是期刊的测度和评价指标。期刊的定量评价指标包括引文相关指标、文摘量、索引量、图书馆流通指标等多种指标体系,其中使用得最多的是引文指标,包括从引文数据库中统计得来的各种关于来源文献和被引文献的指标。随着文献计量学研究的深入和技术手段的发展,又有一些不同于以往的全新指标出现,如期刊的h指数、SJR和特征因子等。

四 网络计量学的发展

网络计量学是随着互联网发展而新兴的一个研究领域。

1997年,阿尔明(T. C. Almind)和英格沃森在一篇论文中首次提出了Webometrics的概念T. C. Almind, P. Ingwersen,“Informetric Analyses on the World Wide Web: Methodological Approaches to ‘Webometrics'”, Journal of Documentation, Vol.53, No.4(1997): 404-426.。同年,Cybermetrics电子期刊在西班牙马德里科学信息及文献中心创刊,该刊的创办是网络计量学这一研究领域正式确立其地位的标志。

经过十多年的发展,网络计量学有了长足的进步,成为文献计量学相关领域中一个有发展潜力的分支学科。

当前,网络计量学研究的主要问题包括以下几方面:

1.链接分析

链接分析方法是网络计量学中的重要分析方法,是目前的研究热点。链接分析包括与传统引文分析相似的超链接解析和应用计算机理论以及图论理论进行的万维网拓扑结构研究。此外,还包括一些对链接目的的研究。塞沃尔提出了社会科学的链接分析研究理论框架M. Thelwall,“Interpreting Social Science Link Analysis Research: A Theoretical Framework”, Journal of the American Society for Information Science Vol.57, No.1(2006): 60-68.

2.网络链接的动机和行为

对于一般的网站而言,最为常见的链接目的是相关资源导航。在学术网络空间中,内容与链接之间的关系有着与普通商业网站不同的内涵,其链接与文献引用相似度更高,因而更具有研究价值。目前对网络链接目的的研究也主要集中在学术网络中。同引文链接相比,网络链接的情况更加复杂,有更多的不确定性,引用类型更加松散和多样化,各学科有不同的链接特点和习惯,链接数量不能直接反映机构的学术水平。

3.描述万维网结构

探索网络信息资源的分布、增长、老化规律是网络计量学研究的重要内容。在网络计量学研究中,学者们也证明了网络空间中指数定律的存在,文献计量学的三大定律——布拉德福定律、齐夫定律、洛特卡定律在网络资源中仍然适用。此外,近年来利用社会网络方法的研究日益增多,学者们应用社会网络理论来测度网页的位置和距离。

4.网络信息资源评价

网络信息资源评价是网络计量学研究的重要应用。近年来利用网络计量学研究方法进行网络信息资源评价的实践很多,有些还延伸到对大学网站的评价乃至对大学的评价中。对网络资源的评价可以分为定性评价和定量评价两种方法蒋颖:《因特网学术资源评价:标准和方法》,《图书情报工作》1998年第11期。。定性评价大多从网络资源内容的权威性、准确性、客观性、时效性、覆盖面、实用性等方面进行。定量评价的主要方法是链接分析方法,包括最常见的利用入链数和网络影响因子来进行网站影响力评价,利用Google的PageRank方法对网页重要性和相关性进行排序等。

5.网络引文研究

传统的引文分析仅限于对正式出版的核心期刊收录的相关内容的研究,新兴的链接分析包含了大量学术性或非学术性网络信息,而网络引文分析则针对学术领域中的网络正式出版物和灰色文献开展范围更广的引文研究。

总之,网络计量学是一个新兴的、发展较快的领域,相关研究论文数量在不断增长,但是从目前的研究和实践现状来看,它还不是一个成熟的学科,一些基本问题还没有解决,如基本理论框架还不成熟、过多地借鉴了其他学科的研究方法,数据获取困难,并难于进行重复验证等。

五 可视化技术的研究和应用

可视化技术可以把抽象的数据和复杂的公式用形象的图形(图像)表示出来,增强数据和结论的表现力,同时作为一种分析工具,还可以发现数据中存在的隐性关系和规则。

文献计量学作为以数据为基础的研究领域,一直非常重视数据的可视化表现。特别是引文索引出现以后,文献计量学专家掌握了大量可供分析的数据,用图形和图像方式表现分析结果成为该领域的尖端技术,数据的统计分析和可视化工作也逐步从手工转移到计算机。进入21世纪,随着数字资源的发展和可视化工具的开发,可视化技术的应用达到了更高的水平。文献计量学专家们在研究中越来越多地使用了各种更加复杂、显示效果更好的可视化技术,有些机构还开发了一些专门用于文献计量的可视化软件。目前,用图形或图像来揭示文献、作者、期刊、学科之间的关系和展示学科结构、表现科学发展历史已经成为文献计量学常用的手段。信息可视化技术在文献计量学领域得到了长足的发展,也形成了一定的研究规模。

(1)在可视化方法方面发展迅速。可视化核心技术——降维方法方面,除了传统的多维尺度、因子分析和主成分分析等方法之外,又出现了更多的算法,如潜在语义分析、寻径网络标度、自组织特征映射图、三角测量、力矢量布局算法等。

(2)图像的表现方法也有了很多新的方式。如可以进行视图转换,制作可视化图形或进行交互动作设计;可以进行位置探查,利用可视化结构中的位置来揭示附加的数据信息;可以进行视点控制,利用放大、摇动和裁剪视点来进行视图变换;还有一种是“总体+细节”图,这种图提供了多个视图,可以将数据的整体模型和用户关系的一些细节同时呈现在用户面前。

(3)在工具软件方面,研究者们开发了大量的可视化工具。除了一些通用统计软件如SPSS、SAS和Stata等可用于绘图以外,还出现了一些专门的文献计量学可视化软件,如加菲尔德的引文编年图软件HistCite、陈超美开发的CiteSpace等。此外还可以利用社会网络软件如UCINET、Pajek,以及一些国外实验室开发的免费软件如VxInsight、Theme scape等。

可视化方法利用得当可以提高数据表现力,进行内容的深度挖掘,如里德(E. Reid)和陈炘钧(H. Chen)利用多种视图来揭示国际恐怖主义研究领域中的知识结构、核心作者、机构、出版物、基本概念,并以多种视图来表现其相互之间的关系E. F. Reid, Hsinchun Chen,“Mapping the Contemporary Terrorism Research Domain”, International Journal of Human-Computer Studies Vol.65(2007): 42-56.;欧盟2004年发布的报告利用了多张图表来显示各国在经济学领域的影响力European Commission, Mapping of Excellence in Economics, Luxembourg: Office for Official Publications of the European Communities, 2004.;周萍(P. Zhou)等利用Pajek软件绘制出中国社会科学期刊交流结构,对政治学、马克思主义、图书馆学情报学和经济学等几个领域的引文模式与国际同行进行了比较分析Ping Zhou, Xinning Su and Loet Leydesdorff,“A Comparative Study on Communication Structures of Chinese Journals in the Social Sciences”, Journal of the American Society for Information Science &Technology, Vol.61, No.7(2010): 1360-1376.

然而随着可视化工具的日益普及应用,也出现了过度使用可视化技术的情况,国内一些期刊编辑也认为目前的部分论文中,可视化图形用得太多,但是没有起到应有的揭示和深化分析作用,只是作为论文的一种装饰,甚至可能还存在误用的情况。因此,如何利用好可视化工具也是未来面临的一个重要问题。

六 其他方面

除了以上研究热点,还有一些主题也是人文社会科学领域文献计量学研究经常涉及的。

面向学科的文献计量学分析是文献计量学方法在人文社会科学领域的重要应用。利用文献计量学方法进行面向学科的分析,描述学科结构,探知研究前沿,一直是文献计量学研究与应用的重要内容,它们可以帮助科研管理部门遴选学科发展的重点领域和优先支持领域,制定科研发展战略,进行科研管理与决策;可以通过比较国内外同领域机构的研究状况,为学科发展提供参考;还可以为学者提供本学科及相关学科的全面观察视角,等等。目前这类研究在科技方面的应用比较多,已经成为科技政策制定的重要参考。在人文社会科学领域,虽然有一些相关研究,但还没有广泛应用到科研管理部门,从目前的发展趋势看,未来将会有更多重要应用。本书收录了作者及合作者进行的三项实证研究,以期对文献计量学在人文社会科学领域的应用进行探索。

引文分析是文献计量学研究的最重要的方法之一,它的应用非常广泛。“引文分析”一词是文献计量学领域使用频率最高的关键词之一。除了对引文分析方法的研究和理论问题的探讨之外,大量的论文都是利用引文分析方法进行各种实证研究。同自然科学相比,国内外人文社会科学领域的引文分析研究范围相对较窄,主要与以下一些主题相关:学术评价、与自然科学的比较、学术合作、情报交流、期刊分析、开放获取研究、用户研究、馆藏发展、数据源分析评价等方面。随着数据源的不断拓展和分析方法的进步,人文社会科学领域的引文分析还会得到更加广泛而深入的应用。由于引文分析是文献计量学的核心内容,其技术方法非常成熟,同时已经渗透到其中的很多研究领域,因此本书不再进行专门论述,而是在各章节中分别介绍涉及的相关内容。

七 小结

近些年,文献计量学名声远扬,起因就在于国内高校和科研院所的学术评价中采用了文献计量学指标。其实文献计量学本是对于学术交流系统中的文献进行定量分析,从而探求文献分布规律和学术交流模式,从文献交流过程中探索科学发展的历史。

人文社会科学与自然科学的确存在差异。这种差异导致的主要问题在于以期刊为基础的引文数据库能够反映科技文献交流活动的主要层面,但是却只能反映社会科学的一部分、人文学科的冰山一角。

这给我们造成了一些困难,但不是完全不可克服。信息技术的发展为人文社会科学文献计量学研究提供了更多的契机。

在未来,文献计量学将有更大的发展。首先,数据源不断拓展和整合,引文数据库进行了调整、优化和创新,书目数据的可用性大大增强,新型的数据来源迅速发展,这将逐步解决当前在人文社会科学领域中存在的各种数据支持不力的问题。其次,技术和方法飞速发展,各种软件应运而生,自动化和智能化水平越来越高,技术工具几乎可以为数据清理、规范、统计、可视化全过程提供服务,同时,随着语义网、大数据等技术的发展,将会对文献计量学的分析能力和内容揭示能力产生更为重要的影响。文献计量学应用将越来越普遍,研究领域不断拓展,在人文社会科学领域的应用将会更加广泛。

总之,在信息技术和学术评价两大驱动力的推动下,文献计量学研究的内涵和外延都会得到扩展。与此同时,文献计量学也将迎来更大的挑战。