数字化技术使史料获取及考证方式发生革新性变化——
数字化背景下的史料学
刘 萍
近年来,计算机及数字化技术对历史研究的影响在多方面体现出来。大多数学者认为,其对传统史料学影响最为巨大。因此讨论的问题也主要围绕史料存储、呈现、获取等而展开。
史料的数量和种类极大扩充
计算机和数字化技术引入历史研究后,一个最显著的特点,是克服了传统史料学对于大量零散或形态各异的史料无法解决的困难,使得大量零散但又有一定体系的史料通过数字化扫描快捷存储于计算机中,从而使得史料数量呈爆炸性增长,扩大了史料的范围,传统史料学发生了革命性的变化。吉林大学文学院马卫东指出,所谓“史料革命”主要包括两方面的含义:一是史料的种类与数量大幅度增加,样态更加多元,除了传统的文献、考古资料外,举凡保留过去信息的一切资料,都有可能进入史家的视野,特别是过去不被注目的官方和民间资料被源源不断地发掘出来,成为新的史料。二是各种纸质史料被大规模数据化、信息化,并建立了各种类型的历史资料数据库。前者着眼于史学观念的转变,即新史学“眼光向下”所带来的史料拓展,后者着眼于技术层面对史料学的影响。复旦大学人文学院姜义华也认为,大数据成百倍、成千倍地扩大了历史资料的范围,尤其突出的是,除传统的文献与遗址、遗物外,人类存留的所有纸质的、音像的和其他物质的、非物质的资料,借助于技术手段,“几乎都可被用来协助复原历史的本来面貌”。
史料的形态及内涵发生改变
有学者认为,在大数据时代,史料的存在形态、生成方式、传播方式都发生了革新性的变化,并进一步提出了“新样态史料”这一概念。传统史料一般是以纸质、实物、遗迹的形式呈现,而“所谓新样态史料,指不同于传统史料的存在方式、表现形式,而依赖现代化信息技术生成的,带有数字化特征的历史资料”。哈尔滨师范大学历史文化学院张作成认为新样态史料系指以数字文本、音频和视频形式呈现于专业网站、网络数据库中的史料,故新样态史料不仅是可读资料,也是可听、可视资料。新样态史料除了在生成方式、储存方式、呈现方式等方面,与传统史料不同外,前者还具有传统史料并不具备的交互性和开放性,即新样态史料的使用者,可能同时也是制作者,从而形成“资料共筹”现象,使得史料的边界不断扩大。南京大学历史学院梁晨认为,大数据对史料学产生的影响,不仅使史料存在形态发生改变,量化数据库的建立也使史料内涵发生质的改变,量化数据库通过收集一定地域、一定时间跨度的整体性个人或微观史料,并按照一定数据格式进行电子化,构成可以分析的数据化史料,“从而使历史研究所依靠的各种材料逐渐出现了数据化发展倾向”。
史料获取及考证方式发生革新性变化
历史学者一致认为,新史学研究形态的最大特点,是文献检索技术的改变,科学技术对历史研究最为直接的影响体现在获取史料的方式上。传统史学研究获取史料的方式,一般是通过阅读纸本,手工摘抄而完成。河南大学历史文化学院张宝明认为,互联网、多媒体以及大型数据库建设,使史学工作者从传统的做笔记、抄卡片,并进行整理、分类等耗时长、效率低的史料搜集方式,一跃到数字化、信息化、快捷化的检索手段。史料获取方式的变化,实现了史学工作者将史料一网打尽、竭泽而渔的梦想。也有学者认为,数字化检索不仅使获取资料的速度大大提高,且通过分类或编组等检索方式,打破传统的卡片式分类或检索方式,使获得的资料更为有效。具体而言,“初步掌握大数据技术的研究者,可以通过使用一组标签编组、分类和检索史料,并可以通过合并多个搜索标签有效地过滤用于历史研究的资源”,从而迅速得到符合自己研究主题的资料。中山大学历史学系陈春生认为,“文本数字挖掘”所具有的“创造”“重构”史料的能力,大大提高了学者校勘、辑佚、考订史料的效率。
史料数据化对历史研究的影响
多位学者表示,史料数据化将对历史研究带来挑战和机遇。如湖北大学中国思想文化史研究所马建强认为:“大数据时代利用计算机、互联网以及大型数据库来获取史料、挖掘分析史料信息的一套思维和方法也将成为史学研究的一种新范式。这种范式的形成将会带来全新的学术问题、学术理念、学术思维、学术视野以及学术方法、学术形态。”关于史料数据化对历史研究的影响,学者认为主要体现在以下几方面:
第一,促进对整体史或长时段历史的研究。有学者认为,传统史学受史料时空和内容限制,这两方面制约着研究选题的选择,一些超长时段或大跨度空间的选题,时常会因史料收集限制而遭舍弃。大数据为整体史或长时段研究提供了可能。马卫东认为,在大数据环境下,人文社会科学研究在片段数据、海量数据采集与分析的基础上,通过碎片化重组,便具有了整体性。湖南师范大学历史文化学院郭辉认为,“大数据提供以往单凭个人之力无法搜集和阅读的海量史料,并能运用计算机技术对之进行分析和初步解读。大数据或将拯救史学的碎片化走向,真正实现史学的原初理想与追求,假以时日能够通过大数据得出科学的整体史。”梁晨等人认为依靠大规模系统历史资料构建的量化数据库不仅扩大了史料的范围,克服史料繁芜的局限,同时为历史长时段的研究提供了可能。这些数据库涵盖一定地域范围,具有一定时间跨度的整体性,同时也涵盖大规模个人或其他微观层面信息的系统资料,从而能丰富、完善对微观历史和行为的认识,还有助于构建更为可靠的宏大叙事,促进对人类社会发展规律的进一步认识。
第二,促进跨学科及精准研究。姜义华认为,大数据的开放性,能够使人们较方便地将人文社会科学研究与自然科学、技术科学紧密结合起来,有效运用自然科学、技术科学最新成果及研究手段,从而有效推动人文社会科学内部各学科实现真正的交叉、渗透和结合,使跨学科研究成为可能。郭辉从史料开放性角度分析了跨学科研究的可能性,以往不太被其他学科关注的历史资料开始为“他者”关注,促进了跨学科的融合。郭辉认为,不少数据库提供全文检索,使史学研究有可能运用大量数据,并通过定量分析数据得出相对精确、客观的结论,从而为精准历史研究提供了可能。
(作者为中国社会科学院近代史研究所研究员、中国社会科学院中日历史研究中心研究员)
《北京日报》(2025年02月24日 第10版 理论周刊·学界万象)