王兆鹏 郑永晓 刘京臣︱借器之势,出道之新--“
唐宋时代全景
本文原刊于《文艺研究》2019年第9期,责任编辑陈斐,如需转载,须经本刊编辑部授权。
摘 要“数字人文”已成为一种强大的浪潮,成为人文社会科学研究的一大趋势。数据、平台、团队是数字人文的三大核心要素。古典文学的数字人文研究,既要注重作家、作品和历史地理等系列数据和结构化数据库的基础建设,使数据库可以实现语义检索、时空定位、关联生成,又可以统计分析、可视化呈现,还可以运用大数据和信息挖掘技术,开展空间分析、时段考察、意象流变、作家作品的接受史和影响史等理论研究。数字人文会给文学研究的范式、方法、视角带来重大影响和变化,提高研究的科学性。今后的数字人文研究,应该以问题为导向、人文为本位、技术为辅助、数据为基础、平台为契机、团队为依托,守正出新。
■王兆鹏 永晓、京臣,二位好!“数字人文”(digital humanities)研究已成为一种强大的浪潮,成为人文社会科学研究的一大趋势。《文艺研究》杂志约咱们三人谈谈数字人文研究的最新进展以及古典文学研究应用数字人文的前景。这次两位来武汉开会,正好可以好好地交流一下。
一、 数字人文的特点与发展历程
■王兆鹏 先请永晓介绍一下数字人文。
■郑永晓 关于“数字人文”,维基百科中文版的定义是,电脑运算或信息科技与人文学的交叉学科,是以合作、跨学科与电脑运算等新方法来进行人文学的研究、教学、出版等学术工作。这只是众多定义中的一种。事实上,学界还没有统一的定义。由于数字人文的持续发展及其开放特性,旧的定义往往很快会被新的定义所取代。
■刘京臣 确实,有学者在系统梳理西方数字人文的发展历程后指出,“什么是数字人文”这一题目本身,已经成为一种写作题材,以至于每年都会有专著面世,可见这一概念很难定义。
■王兆鹏 虽然难以定义,但合作、跨学科和电脑运算这三点,应是数字人文的基本特征。
■郑永晓 是的。数字人文是从“人文计算”(humanities computing)发展而来的。它使用数字化的资料或数字原生资料,结合传统人文学科如历史学、哲学、文学、艺术、考古学、文化研究与社会科学的方法论,以计算机运算所提供的工具,如超文本、超媒体、图像、文献检索、数据挖掘、统计等,进行综合性研究。
■王兆鹏 跟人文计算相比较,数字人文有哪些特点?
■王兆鹏 “数字化”与“数据化”有什么区别?很多人不明白,数字化文献库与结构化数据库究竟有什么不同?我们现在常用的全文检索数据库,如《国学宝典》《中国基本古籍库》《汉籍全文检索系统》《文渊阁〈四库全书〉电子版》和《中华经典古籍库》等,是不是结构化数据库?
■刘京臣 您说的这些数字化文献资源库,是通过信息技术对文献进行处理,使其转化为电子数据格式,能够通过光盘、硬盘、磁盘阵列等保存和传播。我们存储在电脑硬盘里的各种文献资料、网上流传的各类电子书、图片文献、文本文件以及超文本标记语言(HTML)文件、可扩展超文本标记语言(XHTML)文件等,都属于数字化文献。
■王兆鹏 通俗地说,非结构化数据库,是一种固化数据。《中国基本古籍库》之类的文献资源库,只是用数字化方式储存,并没有改变原书的文本形态,它只能进行字词检索,而不能提取数据,检索到的资料不能重组关联。而结构化数据,是一种活化数据,是将原始文本按一定规则转化成碎片化数据,数据之间可以任意重组关联,形成新知识,发现新问题;可以自动生成数据,进行统计分析;可以进行语义检索和时空定位;并能可视化呈现。哈佛大学的《中国历代人物传记资料库》和我主持的《唐宋文学编年地图平台》,都是这样的结构化数据库。
下一篇:没有了