侯官先贤与“数字人文”的原脉律动
2023-03-2809-25-47来源:福建日报

作者:陈振文

当下,作为数字技术与人文学科跨界融合的研究领域,数字人文创新了人文学科的研究范式,实现了自然科学、社会科学和人文科学的深度融合,成为各个学科领域发展的新引擎。若论数字人文的思想源泉,可以追溯到20世纪20年代的“索引运动”,而引领这场学术文化创新运动的著名人士多是侯官先贤。

排检法的数字思维

19世纪初,中西文化交流的频繁,突显了汉字识字难、检字难的矛盾。最初创造新检字法的是几位外国人,他们因学习汉字和研究中国学问的需要,自创新法,如(英)马礼逊的《华英字典》(1815年)、(法)加略利的《字声总目》(1841年)等。

汉字排检之法,古代有三种:义序法、形序法和音序法。千余年来,部首检字法作为形序法的主要代表,一直处于主流地位,直至《中华大字典》《辞源》仍沿用其法。20世纪初,随着社会进步,事务日繁,书报增多,俗字、简字、新起字层出不穷。文牍管理、电报查字、印刷排版、名录编排等均离不开汉字排检方法,并提出了“效率”的要求。正是在这样的形势下,改革汉字排检方法成为必然。

创新检字法的方案如雨后春笋般涌现。到20世纪30年代初,各种检字法有61种之多。其中,用单行专著形式(包括各种字典所附,及图书馆目录使用、电话、电报号码使用)公布发表的检字法有17种,其余大多数检字法都是以探讨的形式用论文、谈话等形式介绍,有的仅举几个字例即衍义出一套检字方法,没有太大实际操作价值。

据统计,到20世纪40年代末,已有各种检字法87种。各种检字法一经面世就被迅速运用于工具书的编纂。其中,以数字代表字形、部首的排检理念设计的“四角号码检字法”“中国字庋撷法”,因其易学、易记被社会广泛接受和长期使用。

这一时期字典、辞典和多种“引得”等工具书编纂的繁荣,检字法研究的发达功不可没。检字法中的数字思维,使汉字由字形获得有序化数字编码序列,显示出学人独立思考的创新意识。在20世纪30年代初,还相继诞生了两部“索引学”专著:钱亚新的《索引和索引法》和洪业的《引得说》。

索引理论探讨和编纂实践还吸引了包括学术界的蔡元培、胡适、赵元任、何炳松、钱玄同、刘复、林语堂、郑振铎,图书馆学界的万国鼎、王重民、杜定友、袁同礼、姚名达、沈祖荣,出版界的叶圣陶、李小峰等人热烈参与,由此演化为一场被著名图书馆学家万国鼎称之为的“索引运动”。

“索引运动”开先声

“索引运动”最初是由“检字法”引发的,其初衷是提高汉字的排检效率。但随着讨论的深入,各学科领域学者的聚集和应用的拓展,成为探寻科学的读书方法、治学现代化的途径和知识侨易的舞台。

古人传统的读书治学重在博闻强识,功夫愈深,成就愈大。但面对浩如烟海的文献,穷其毕生,也不可究殚。就是记忆力超群、被胡适称为“稀有的天才”的傅斯年也感慨:“凡一种学问能扩充化地作研究时应用的工具的,则进步;不能的,则退步。……在中国境内语言学和历史学的材料是最最多的,欧洲人求之尚难得,我们却坐看他毁坏亡失。”傅斯年不满中国人自己的“材料”被人拿了去,原因就是没有科学的整理材料的工具。也正因此,胡适发起“整理国故”,提出“研究问题、输入学理、整理国故、再造文明”的主张。其中“输入学理”就包括引进西方索引编制的方法,“索引式”的整理成为“国学的系统整理的第一步”。

在此后的二三十年间,开展了广泛的索引研究,建立了我国最早的索引学术组织和索引编纂机构,编制了大量索引,使我国索引事业完成了从古典索引法(书目)向现代索引体系的过渡,进而影响了学术范式的现代化。“索引式”的古籍整理也成为数字人文的先声。

20世纪是前所未有的变化激荡的一个世纪。19世纪中期以来的中国近代化进程到了20世纪开始加速,并完成了由传统向现代的历史性转换。以“民主”和“科学”为核心开启民智成为社会文化思潮的主旋律。任鸿隽在1915年《科学》创刊号上说:“科学之本质不在物质,而在方法。”这种科学观无疑打上了卡尔·皮尔逊的烙印。

皮尔逊在给“科学”下定义时,直接把“科学”与“索引”挂上钩:“科学可以说是我们官觉印象的累篇分类的索引。我们有了他,可以不费力的查出我们所要的东西。”

这些理念为“索引运动”的蓬勃发展留下时代注脚。20世纪后半叶,随着计算机技术在索引工作中的应用和检索语言的发展,索引的载体形式和编制方式方法都发生了重大变革。“数据库”就是信息时代的索引。当下,新的索引领域正在开辟。

侯官先贤领风气

鸦片战争后的几十年,各种思潮不断涌现,而这些不同思潮都可以从侯官先贤的思想和实践中寻找活水源头。民国时期以高梦旦、林语堂、洪业、郑振铎、翁独健等人为代表,在“索引运动”中再次显示这一思想魅力。

侯官先贤中最早介入索引活动的是商务印书馆元老高梦旦。据王云五回忆,约在1911年前后,高梦旦就有“改革部首之草案”:“其方法但管字形,不管字义,将旧字典之二百十四部,就形式相近者并为八十部,并确定上下左右之部居。”同期在商务印书馆的侯官先贤郑贞文,也在回忆文章中证实了高梦旦是最早对汉字旧式检字法进行现代改造之人。

旧式检字法现代改造最成功的范例是“四角号码检字法”,其“始于高梦旦,成于王云五”。生于20世纪五六十年代的人,对《四角号码字典》记忆犹新,“四角号码检字法”的习用也是“无师自通”。但长期以来,似乎没有人将“人机对话”中汉字植入电脑的标配之一的“五笔输入法”与“四角号码检字法”之间建立起联系。二者之间核心设计理念是相通的,都是以数字代表字形设部原则。可以说“四角号码检字法”就是“五笔输入法”1.0版,后者是前者“0到1”的跃升。今天我们在中文语境下能便利地使用各种智能工具,要感恩这其中的思想火花。

正式拉开汉字部首改革和“索引运动”序幕之人要属语言学家林语堂。1917年,林语堂在《科学》杂志第3卷第10期发表《创设汉字索引制议》一文,首次把“索引”这一术语引入中国。之后又发表了《论“汉字索引制”及西洋文学》《汉字号码索引法》《图书索引之一新法》等有关索引新法的一系列文章,把运用索引新法改革文字看作是一场文学革命。林语堂晚年自创的“上下形检字法”和键盘,还被台湾神通公司采用为计算机输入法。

林语堂从语言学的研究视角探讨索引编制法,相继提出了首笔法、末笔法、号码法和新韵法。虽然在后人看来,这些方法有这样或那样的不足,但对“索引运动”有首倡之功,无疑对中国现代索引的理论研究起了极大的推动作用。

侯官先贤中对现代索引贡献最大的应数历史学家洪业。无论是在理论建构还是在索引编纂成果以及编纂程序的探索上,洪业都称得上是一位“前无古人、后无来者”的人物。洪业创设并领导的“哈佛燕京学社引得编纂处”,用自创的“中国字庋撷法”编纂出版了经史子集各种“引得”多达64种81册,不仅推动了民国时期中国索引编纂事业的科学化,同时为学术研究提供了极大便利,至今仍有其利用价值。

作为新兴治学工具的索引,在“索引运动”肇始,就被侯官先贤赋予了学术研究的品质。“长乐西谛”郑振铎1926年在《文学周报》上连续发表《缀白裘索引》,1937年在作《〈词林摘艳〉里的戏剧作家及散曲作家考》时,又编写了《〈词林摘艳〉引剧目录及作者姓名索引》,为研究元明散曲及剧作家提供资料和检索便利。1941年撰写《索引的利用与编纂》长文,全面论述索引的功用、分类、编纂等一系列理论与实际问题。著名蒙元史专家、福清的翁独健编纂《道藏子目引得》,在开拓索引类型、便利道藏检索的同时,更为现代道藏研究提供新的增长点。

以“六书”为结构准则的方块汉字,是中华民族文化的结晶。但也因其形音义复杂的结合,给汉字的排检带来困难。对汉字排检方法的探索成为2000年来中国语言文字学者关注并力图解决的问题。汉字的输入问题,则成为汉字计算机信息处理起步阶段的瓶颈。从字形“解构”汉字,以至四角号码检字法、五笔输入法的出现和推广,可以说是汉字排检的里程碑和汉字植入计算机的数字化革命。

由数字、数据,进而数据库;由检字法、索引,进而数字人文,是历史的层累进步。今天,数字人文已从最初以语料库为核心的语言学领域,延展到人类学、文学、社会学、新闻传播学、历史学、档案学、图书馆学、管理学、艺术学、文化学等诸多学科,但古老的文本语文学中仍存在着与今天的数字人文和自然科学一脉相承的线索,语言学领域的文字解构、文本分析等仍然是数字人文的重要手段。

民国时期,以侯官先贤为代表的这一时期的检字法发明、索引理论探讨和编纂实践,不但为中国现代索引史的发展奠定了基础,而且为学术现代化、现代文化启蒙和教育发展作出了特殊贡献,开“数字人文”风气之先。

(作者为福建江夏学院设计与创意学院教授)

《福建日报》(2023年3月28日 第10版:理论周刊·读书)

点击显示全部 》
微信公众号
主办:中共福州市 委党史和地方志研究室
邮箱:fzdsfzs@126.com 闽ICP备20005811号