一 数据来源与研究方法
1.数据来源及处理
笔者于2017年2月16日以CNKI(中国学术文献网络出版总库)作为数据来源库,设置检索字段为关键词“创新驱动”,策略为“精确”,时间跨度不限,期刊来源类别选择CSSCI和核心期刊,匹配设置为精确匹配,检索到论文570篇。剔除会议通知、报道、征稿以及无关键词文献与重复文献,共计得到论文568篇,并从CNKI数据库中导出参考文献格式为Notefirst的论文作为研究样本。在关键词统计方面,发现部分关键词意思相同,如供给侧改革与供给侧结构性改革,转型发展与转型、转型升级、经济转型等,技术创新与科技创新,发展战略与战略举措、战略路径,发展对策与对策研究、路径分析、措施等。进行样本核对后,运用书目共现分析系统Bicomb左下角的“提取”中的“修改”功能对这些有相同意思的关键词进行了合并处理。关键词出现的次数越多,可以在一定程度上表明其受到关注的程度越高,也能够在一定程度上反映出当前该领域的研究动态。经过处理后总共获得关键词1179个,出现总频次2335次,也就是说平均每篇文章有1.98个关键词。
2.研究方法
(1)文献计量分析
文献计量分析(Bibliometrics Analysis)是情报学独有的分析方法,在科学与科技管理、科学评价与预测等学科领域及定量管理等领域得到了广泛应用。其中,共词分析法可以追溯到文献计量学中所阐述的引文耦合和共被引两个概念,其本质是如果两个专业术语可以代表某个研究领域的主题或方向并同时被包含在同一篇文献中,即表明这两个术语之间存在一定程度上的相关关系,同时被包含的频率越高,表明两者相关关系程度越高,两者之间的距离也越小。本书选取能浓缩文章主题内容的关键词作为共词分析对象,利用中国医科大学医学信息学系开发的书目共现分析系统进行信息的提取、统计并最终形成共词矩阵。
(2)社会网络分析
社会网络分析(Social Network Analysis, SNA)中的社会网络是指由多个点(社会行动者)和各点之间的连线(代表行动者之间的关系)组成的集合,现已被广泛应用于经济学、社会学和管理学等学科中。社会网络分析从“关系”的角度出发研究社会现象与社会结构,常用到的分析指标包括网络密度、中心性、凝聚子群和核心边缘分析等。其中,网络密度用来衡量网络中各主体之间关联关系的疏密程度,等于网络中“实际存在的关系总数”除以“理论上最多可能存在的关系总数”,即所有可能存在的关系的平均值。网络中心性包括度数中心度(Nrmdegree)、接近中心性(nCloseness)和中介中心性(nBetweeness),其中,度数中心度又称为点度中心性,是指在网络中与该节点有直接关系并存在相连直线的节点总数,该指标越大,表明该节点存在越频繁的交流活动,在网络中的地位也越重要;接近中心性采用距离来衡量一个节点在所处网络中的中心程度,也就是计算出该点到其他所有节点的最短距离并将其加总,所得出的总和数即表示其中心程度,该指标越小,说明相比于其他节点该节点可以越快速地与其他所有点建立联系,同时也意味着其信息中转的时间和成本耗费越少;中介中心性又称为间距中心性,是测量网络中某个关键词影响其他关键词共同出现在一篇文献中的能力大小的指标,该指标越大,说明该关键词对其他关键词发生联系的影响能力越大。凝聚子群属于聚类分析,通过将子群从网络中划分出来从而了解和掌握该子群对整个网络的影响。计算方法不同,凝聚子群的定义和分析方法也存在差异,主要包括以下类型:派系、n-派系、n-宗派、k-丛及凝聚子群密度。核心-边缘分析根据网络中节点之间发生联系的紧密程度,将其分别划分在核心区域和边缘区域,若节点处于核心区域,则表明该节点在网络中具有较为重要的地位。本研究运用到的软件工具包括Microsoft Excel、Bicomb、Ucinet,并运用Netdraw进行了知识图谱可视化分析。