时至今日,史料的分类越来越细,除了文献史料、实物史料、口述史料等常规史料,还包括影像史料、音频史料等,特别是数字技术的快速发展,不仅极大推动史料数字化构建,也在生成大量原生的或外延的数字化史料。比如,史料数据库的建设为历史研究工作者检索、复制文献史料提供了极大便利,人工智能技术等对古籍文字进行识别排序进而激活古籍生命力,等等。同时要看到,随着史料数字化发展向纵深推进,在历史研究中也产生了“技术万能主义”等错误认识。因此,无论是面对史料数字化还是数字化史料,我们都要坚持辩证唯物主义和历史唯物主义,真正让数字技术推动历史学向更为宽广的领域发展。
在历史学发展史上,始于20世纪初期的西方“史料革命”倡导扩大历史研究范围,由政治史扩展至社会史、经济史、文化史、生态史等。在这一过程中,史料的范围亦随之扩大,不再局限于官方档案和传世历史文献,还包括书信、日记、碑刻、家谱、契约文书、账本、回忆录等。尤为重要的是,20世纪50年代计算机技术被引入历史研究之中,使用计算机技术处理历史数据,把各种形式的文字史料转化为数字信息并进行加工、处理、存储,开启了史料数字化的进程。史料数字化早期主要采用直接扫描的方式,将文献史料逐页传输至计算机内,存储为图像文件,不仅保存了史料的原貌,还使零散的史料集中起来。在此基础上,计算机技术将文献史料转换成文本形式,建立了可以全文检索的数据系统,史料数据库由此出现,从技术层面进一步推动了“史料革命”。同时,互联网技术的发展加快了数字化史料的传输速度、拓宽了史料的获取渠道,促进各种“史料数据库”的开发。就我国而言,史料数字化开启于20世纪90年代,其发展脉络与西方较为相似,也是采用先扫描、后文本化的形式将“二十四史”“十三经注疏”“诸子集成”“四库全书”以及近代报纸、杂志等史料大规模地数据化、信息化,并利用网络技术开发了各种类型的史料数据库。在近30年的时间里,中国国家图书馆、高校和科研机构等先后建成了数以百计的全文检索、高级检索等多条件检索的数据库。以“中国基本古籍库”和“全国报刊索引”为例,前者收录了自先秦至民国时期的历代文献1万多种,共计17万卷,全文约17亿字,数据量约330G,是中国最大的历代典籍总汇;后者收录的报刊数据可追溯至1833年,至今已累计收录报刊5万余种、文献5000多万篇,年更新数据量超过500万条。此外,大量的国外史学数据库引入国内,不仅促进了中国的世界史研究,更与国内史料数据库建设共同推动了史料数字化进程。
史料数字化使史料呈现出几何级数增长的趋势,极大扩充了历史研究工作者可以使用的史料规模,在多个方面对历史研究产生了深远影响。第一,无论是史料数字化,还是数字化史料,都能让历史研究工作者占有越来越广泛和丰富的史料,有助于实现研究对象从“宏观”向“微观”扩展。历史研究工作者利用数据库中的海量文献,既可以对政治史、军事史、思想史等进行宏观研究,也可以对经济史、社会史、文化史等进行微观研究,通过研究日记、书信、账本等私人文献,折射出大历史背景下个人的生活与思考,进而理解历史事件的复杂性,在一定程度上弥补了宏观研究的不足。第二,史料数据库改变传统的历史研究方式。史料数据库将众多史料融为一体,其中的全文检索、高级检索,为历史研究工作者快捷查找史料提供了便利。数据库使史料搜集方式从抄史料、做笔记等转变为便捷化的智能检索,在获取史料的途径、数量以及效率方面均得到了空前提高。第三,史料数字化进一步推动跨学科研究。比如,对历史研究工作者而言,不但要掌握基本的数据挖掘、数据分析等方法,还要了解数字技术的最新动态,从而实现历史研究与数字技术紧密结合。此外,针对数字化史料的研究,还需要借助人类学、民族学、民俗学、人口学、统计学、生态学等学科的研究方法,通过对史料的定量、精准分析,得出相对客观的结论,能够促进历史研究视角的多元化。
也要看到,史料数据库在给历史研究带来极大便利的同时,其局限性也日益凸显。史料数据库只是历史研究的辅助工具,并不是历史研究的全部,检索也无法代替阅读和思考。若无扎实的史学基础训练和对整体历史脉络的把握,经由史料数据库检索得出的大多是不完整的信息,而仅仅依靠这些不完整的信息进行研究就会影响历史研究的整体性、系统性。同时,虽然史料数据库使用便捷,但如果历史研究工作者没有深入考察史料来源和真实性,便不能完全信任数据库中的史料。特别是文书、账本、日记、书信等私人史料或民间史料,若无相关史料的佐证,是不能视为权威的一手资料的。面向未来,广大历史研究工作者要加强史学训练,扎实提高史学素养和问题意识,在研究中始终坚持辩证唯物主义和历史唯物主义,秉持正确的史料观念,科学合理利用包括史料数据库、人工智能大模型技术等在内的各种数字技术。