情报学与信息管理研究文集
上QQ阅读APP看书,第一时间看更新

4 PatentEX大为专利信息创新平台

PatentEX提供的数据源是中国、美国、欧洲、日本、韩国官方免费专利数据库,其比较有特色的功能是公知技术分析和辅助核心专利识别。公知技术分析是指中国失效专利/国外超过保护期限没有进入中国的专利搜索分析,并在检索结果页面,直接提供是否是公知技术,如果是的话则说明该专利可以免费使用。在核心技术识别方面,主要采用的是引证数量、被引数量、IPC数量、权利要求数量、同族专利数量等。PatentEX支持自动统计出引证数量、被引数量、国际专利分类(International Patent Classification,IPC)数量、权利要求数量、同族专利数量这些指标,且可以进行排序。不需要像Innovation平台那样还要分析人员自行导出这些数据到其他工具中进行排序。此外,PatentEX支持在线翻译功能,英、法、德、日、韩等外文专利可以在线翻译成中文,可以选择翻译摘要、权利要求、说明书等,比较适合中国用户使用。

PatentEX的指标中被引数量、权利要求数量、同族专利数量等已经被多种核心专利识别工具采纳,这里不再赘述。笔者观察到,PatentEX核心专利识别指标中还设立了引证数量指标和IPC数量指标。

引证数量是指专利引用专利文献、科学文献等现有技术的数量。PatentEX认为引证数量越多,说明技术涵盖量较高,科学研究对专利的贡献大,也就应该是核心专利;但在专利指标体系研究中,曾有研究者将这一指标细分,采用专利引用非专利文献数和专利引用专利文献数这两个指标,如袁润等设立的8个专利分析指标中就有这两个指标,但是经过层次分析法计算出这两个指标的权重分别是0.0519和0.0444,排在第5和第6位,在8个指标中总占比不到0.1[17]。由此可见引证数量是一个颇有争议的指标,单独采用引证数量这一指标识别核心专利的效果不一定理想。

IPC数量是对国际专利分类号数量进行的统计。该方法认为,一件专利拥有的国际专利分类号数越多,说明该专利涉及的技术领域越广,涉及的功能较多,则越有可能是重要的核心专利。但也有研究认为,由于国际分类号数量只是表示专利的应用范围和应用宽度,是否真正能够投入市场以及进行商业化的运作,这些都是未知的。笔者也没有检索到核心专利识别中单独采用IPC数量指标的研究文献。只有张娴等曾应用层次分析法设计了21个专利分析指标,其中包括国际专利分类号数量,但经9名专家两两打分比较后,最终得出国际专利分类号数量的权重仅有0.00546,排在第18位的结论[18],说明国际专利分类号这一指标在核心专利识别上的作用微乎其微。

为此,笔者利用Thomson Innovation检索了标题或摘要中包括big data的专利,以便简单验证引证数量、IPC数量与核心专利间的关系。检索得到了978条专利数据(检索时间为2015年4月27日),选取引证数量前10和IPC数量前10的专利,具体数据如表1和表2所示:

表1 big data领域引证数量前10的专利

表1是通过引证数量指标识别出的引证数量前10的专利,从中可见这些专利的引证数量都很大,PatentEX工具则认为是核心专利。但通过进一步区分引用专利数和引用非专利文献数,发现这些专利对引证数量贡献较大的主要是引用专利数。而有些研究表明,如果专利的引用专利数量较多,对专利的权利要求是有限制作用的,专利引用的专利文献越多,观测到的权利要求范围越窄,专利的质量越低[19],可见单独使用引证数量大小来识别核心专利效果并不理想。

表2 big data领域IPC数量前10的专利

从表2可以看出,IPC数量前10的专利在被引次数、同族专利数量和权利要求数量上表现均不突出,可以判定仅仅基于国际专利分类号数量来识别核心专利其效果确实微乎其微,与张娴等专利指标体系研究得出的国际专利分类号权重极小的结论[18]相吻合。

总体而言,大为专利信息创新平台PatentEX采用的核心专利识别方法是统计被引次数、同族专利数量、权利要求数量、引证数量和国际专利分类号数量,其中被引次数、同族专利数和权利要求数这些方法是学术界和其他工具常用的方法。而引证数量和国际专利分类号数量这两个指标在专利指标体系中的权重极小,且单独采用这两个指标进行核心专利识别的研究文献也非常少。本文通过大数据领域的978条专利数据尝试对这两种方法进行的简单验证,也发现单独使用这两个指标识别核心专利的效果不够理想。