转换到繁體中文

您的位置 : 首页 > 报刊   

[图书情报学研究]基于CNKI的著者引文分析探讨(摘要)
作者:白广思

《郑州大学学报(哲学社会科学版)》 2007年 第02期

  多个检索词,请用空格间隔。
       
       摘 要:以著者为分析对象的引用或被引用现象进行分析是引文分析的极为重要的方面。它可以反映一个著者在科学交流中的地位和作用。著者引文分析必须在引文统计数据基础上进行。国家知识基础设施(CNKI)中的《中国引文数据库》为引文分析提供了丰富的数据来源。目前实现了中国学术期刊(光盘版)电子杂志社出版的源数据库产品中的期刊、图书、论文、报纸类文献的引用文献和被引用文献的链接。因此,基于CNKI的著者引文分析可以实现。
       关键词:CNKI;引文分析;著者引文分析
       中图分类号:G256 文献标识码:A
       文章编号:1001—8204(2007)02—0166—03
       著者引文分析在引文分析中有着突出的地位。引文分析是利用各种数学及统计学的方法,以及比较、归纳、抽象、概括等逻辑方法,对科学期刊、论文、著者等各种分析对象的引用或被引用现象进行分析,以便揭示其数量特征和内在规律的一种文献计量研究方法[1]。其中以著者为分析对象的引用或被引用现象进行分析是极为重要的内容,它可以反映一个著者在科学交流中的地位和作用。著者引文分析必须在引文统计数据基础上进行,因此,著者引文统计是引文分析的前提。国家知识基础设施(National Knowledge Infrastructure,CNKI)采用自主开发并具有国际领先水平的数字图书馆技术,建成了世界上全文信息量规模最大的“CNKI数字图书馆”,并正式启动建设《中国知识资源总库》及CNKI网络资源共享平台,其中《中国引文数据库》为引文分析提供了丰富的数据来源。本文拟探讨基于CNKI的著者引文分析的相关问题。
       一、基于CNKI著者引文分析的指标
       1.引文统计数据来源
       《中国引文数据库》的数据来源于中国学术期刊(光盘版)电子杂志社出版的源数据库产品中的文献和参考文献,如中国期刊全文数据库、中国优秀博硕士学位论文全文数据库、中国重要会议论文全文数据库、中国重要报纸全文数据库、中国图书全文数据库、中国年鉴全文数据库等。目前实现了期刊、图书、论文、报纸类文献的引用文献和被引用文献的链接。随着数字资源的扩增,中国引文数据库中的文献类型及数量也将随之不断增长,相应地,各类型引用文献和被引用文献的链接也将动态增长[2]。通过它可以获得以下数据:
       [参考文献]反映本文研究工作的背景和依据。
       [引证文献]引用本文的文献,本文研究工作的继续、发展或评价。
       [共引文献](也称同引文献)与本文有相同参考文献的文献,与本文有共同研究内容。
       [同被引文献]与本文同时被作为参考文献引用的文献,与本文共同作为进一步研究的基础。
       [二级参考文献]本文参考文献的参考文献,进一步反映本文研究工作的背景和依据。
       [二级引证文献]本文引证文献的引证文献,更进一步反映本文研究工作的继续、发展或评价。
       [相似文献]与本文主题相近或内容相似的文献,较全面反映本文研究方向的动态信息。
       [相关研究机构][相关文献作者]点击相关研究机构和相关文献作者,可以直接查到这些机构和作者其他文献,可以全面了解该机构和该作者的研究动态和历史。
       [文献分类导航]从导航的最底层可以看到与本文研究领域相同的文献,从上层导航可以浏览更多相关领域的文献。
       [相关期刊]与本文所在期刊相关的同类期刊。
       具体到著者引文分析,可以得到CNKI源数据库产品中的某著者每篇文献的相关数据。但必须注意,所得数据都来自于CNKI源数据库产品中。比如参考文献必须是已收人数据库中的文献,而不是本文所有原附的参考文献。
       2.引文测度的指标
       对于不同的分析对象,引文测度(Citation Measure)也有所不同,利用上述数据源可以定义对著者引文分析的测度指标。主要有:
       [著者被引论文量]等于该著者论文被《中国知识资源总库》收录并被引用的数量。
       [著者引文率]等于该著者论文中被《中国知识资源总库》收录的参考文献数量除以该著者被引论文量。
       [著者被引量]等于该著者论文的引证文献量。
       [著者引用量]等于该著者论文中被《中国知识资源总库》收录的参考文献数量。
       [著者影响因子]等于该著者的被引量与著者论文量之比。
       [著者引证系数]等于该著者引用另一著者论文次数占该著者总引用量的百分比。
       [著者被引系数]等于该著者被另一著者引用的次数占该著者总被引用量的百分比。
       [著者自引证系数]等于该著者引用本人论文次数除以该著者总引用量。
       [著者自被引系数]等于该著者被本人论文引用次数除以该著者总被引用量。
       当然,根据需要还可以设计更多测度指标,本文不拟赘述。
       二、基于CNKI的著者引文分析的实证
       我们登录中国知网(http://www.edu.cnki.net),打开“中国引文数据库”链接,选择被引作者为检索项,作为例子,以王宏鑫为检索词,可检索出王宏鑫的被引文献有23篇。打开每一被引文献题名的链接,便可得其详细数据。整理后便可得下列基本数据表:
       
       
       另外,为了计算引用测度指标,我们需要得到其他一些细节数据,如:自引量、自被引量、他引量、他被引量等。这些数据可以通过打开每一被引文献题名的链接,便可得其详细数据。再进行累计便可得到相应总量数据,按照上面给定的指标定义及计算方法,便可以得到相应测度指标:
       
       其中自引量与自被引量应该是相同的,但来源不同,自引量来自于参考文献数据,自被引量来自于引证文献数据。
       另外还有两个指标即著者引证系数、著者被引系数来自于相关著者的详细数据,数据量较大,限于篇幅本文不拟赘述。上述数据比较直接的来自于CNKI的《中国科学引文索引》数据库,基本反映了著者引用与被引用的基本情况。如果想得到更多的细节分析,需要进一步的数据挖掘。
       三、基于CNKI著者引文分析的更多内容
       基于CNKI的著者引文分析,通过数据挖掘可以得到更多更细的分析结果,主要包括:
       [参考文献分析]参考文献的年代分布、参考文献来源分布、参考文献著者分布等,反映著者研究工作的背景和依据。
       [引证文献分析]引证文献年代分布、引证文献来源分布、引证文献著者分布等,反映著者研究工作的继续、发展或评价状况。
       [共引文献分析](也称同引文献分析)共引文献年代分布、共引文献来源分布、共引文献著者分布等,反映与作者有相同参考文献、有共同研究内容的文献状况。
       [同被引文献分析]同被引文献年代分布、同被引文献来源分布、同被引文献著者分布等,反映与作者文献同时被作为参考文献引用,共同作为进一步研究的基础的文献状况。
       [二级参考文献分析]二级参考文献年代分布、二级参考文献来源分布、二级参考文献著者分布等。通过对著者参考文献的参考文献研究,进一步反映著者研究工作的背景和依据。
       [二级引证文献分析]二级引证文献年代分布、二级引证文献来源分布、二级引证文献著者分布等。通过对著者引证文献的引证文献的分析,可以更进一步反映本文研究工作的继续、发展或评价状况。
       [相似文献分析]相似文献年代分布、相似文献来源分布、相似文献著者分布等。通过对与著者论文主题相近或内容相似的文献分析,较为全面反映出著者研究方向的动态信息。
       随着CNKI相关数据库的进一步发展与完善,将能挖掘更多的著者引文分析数据。
       作者简介:白广思(1964—),男,山东阳谷人,郑州大学图书馆副研究馆员,主要从事图书馆自动化和信息管理研究。
       参考文献
       [1]邱均平.文献计量学[M].北京:科学技术文献出版社,1988.
       [2][2006—9—23]http://ckrd.cnki.net/Grid20/Navigator.aspx?ID=6.
       (责任编辑 郑良勤)