近五年我国档案学研究热点领域及态势分析基于
随着可视化技术的突飞猛进,借助社会网络分析工具与可视化软件揭示档案学研究热点及发展方向已成为研究趋势。该类研究方法能透彻把握学科主题结构并将其可视化,但对学科发展态势的分析却因缺乏数学模型的支撑而略显主观。若能建立数学模型对档案学研究的热点领域进行预测,则更显科学严谨且尽可能客观地反映档案学研究领域未来的发展态势。
虽然国内外鲜有基于数学模型对档案学发展态势的研究,但其他学科在研究本学科发展规律时已形成一批可借鉴的研究成果。张宁等[1]采用灰色预测GM(1,1)模型对情报学领域自2012年至2016年有关数据类的研究进行计算,预测分析出了关键词所代表的研究主题发展。苏光耀[2]根据灰色系统理论预测了高校潜势学科的发展趋势,为高校学科建设提供建议。据此,文章将GM(1,1)模型引入档案学学科的相关研究中,尝试借助该模型反思目前研究存在的问题,探测档案学科未来的研究重点与发展方向,尽可能为档案学者的未来研究提供思路导航。
1 灰色预测模型的原理
灰色系统理论是我国研究人员首创的研究方法,旨在解决具有较高灰度的信息问题。在信息领域一般以“黑”表示信息未知,“白”表示信息明确,“灰”便处于黑白之间,表示部分信息明确而部分不明确,因而灰色系统理论是针对“不完全信息”进行研究的,其特点是可充分开发已有的“最少信息”。[3]
灰色预测模型是灰色系统理论的组成部分,其以不完全数据为研究对象,通过再生成、开发及提取已知数据后,对样本的运行行为及演化规律作出描述,进而预测样本发展趋势。灰色预测模型与传统预测方法的不同之处在于,灰色系统理论认为,任何随机量与无规则的干扰因素都能总结形成一定规律,其将随机量看作一种“外延明确、内涵不明确”的灰色量,运用一定的数据变换方法将灰色量转换为生成数,得到序列算子,从而形成具有一定规律的函数,即“少数据”建模。[4]灰色系统模型不依赖原始数据,而是通过对数据间的处理,从新数据中探寻原数据的现实规律,[5]所以在求解小样本问题时要优于时间序列预测法。
GM系列模型是灰色预测理论中的基本模型,尤其是GM(1,1)模型已广泛用于经济、社会及科学技术等多领域,以提供预测决策、评估与规划建模。[6]目前其他学科采用该模型对本学科未来发展进行预测分析的成果已十分丰富,为档案学学科态势研究提供了可参考的方向。GM(1,1)模型分为均值、原始差分、均值差分与离散四种基本模型。由于均值模型比其他三种离散形态模型更适合震荡序列的建模,[7]能在大多数情况下取得令人满意的预测效果,因而文章选择均值模型,以期达到预测档案学领域研究主题热度发展趋势的目的。
2 数据来源及研究思路
2.1 数据采集与处理
文章以CSSCI(2019—2020年版)中《档案学通讯》与《档案学研究》所刊文章为数据来源,以CNKI期刊数据库为对象匹配表达式“JN=‘档案学通讯’OR JN=‘档案学研究’”,时间限定2015年1月1日至2019年12月31日进行专业检索(检索时间截至2020年9月28日),得到1490条检索结果。剔除无关文献后得到有效文献1353篇。在建模前,删除如“对策”等无明确意义词汇,合并因不同作者对同一概念产生的不同表达,并规范关键词及标点符号。
2.2 研究思路
文章首先对近五年来档案学领域论文进行文献计量分析,划分高低频词界限,展现高频词的时间分布特征及出现频率;其次使用CiteSpace绘制关键词共现网络,关键词聚类后使用机器算法从关键词团中提取名词性术语,并自动为类团命名,归纳出近五年档案学研究的主要领域分布;最后基于所得研究领域的时间序列构建灰色预测模型,利用Python语言进行精度检验,预测未来两年相关领域的发文量,依据发文量随时间演化的特征揭示其各自发展态势。
3 档案学主要研究领域及热点
3.1 关键词统计分析
运用改进版普赖斯公式M=0.749√(N_max)(Nmax表示关键词出现频次的最高值)[8]确定高频词阈值为8,得到高频词73个。有文献指出:“档案”所含意义广泛,对研究热点问题的意义较低,[9]研究时应将其删除。考虑到部分关键词存在词意交叉重复,应在建模时整理归类。
图1近五年来档案学领域关键词共词图谱聚类
下一篇:没有了