你的鼠标,能否打开两三百年前的贵州乡村?|清水江文书座谈会

视听产品部 | 2025-11-28 13:35

编者按:

贵州黔东南的木楼梁上、族谱夹层与老箱底,沉睡着约50万份民间契纸。

11月27日,清水江文书座谈会暨《清水江学文库》出版规划论证会在贵州贵阳召开。那些被称为“清水江文书”的民间档案,将被重新发现、整理与激活。

挖掘清水江的故事,实则是在重述一个由无数普通人书写的中国。


用户轻点鼠标,即可穿越两三百年时光,看到某块田地如何流转、某个家族如何兴衰、某条山溪如何被共治。

在教育部长江学者特聘教授、浙江大学数字人文研究中心主任徐永明的构想中,那50万份散落于贵州山乡的清水江文书,未来不再只是档案馆里沉默的故纸,而是一个可搜索、可关联、可交互的“活态历史系统”。

教育部长江学者特聘教授、浙江大学数字人文研究中心主任徐永明

目前民间初步估计,清水江文书总量约有50万件。若按古籍整理的常规标准来换算,一般一册古籍为100至200页,假设每件文书平均为一页,那么这些材料相当于2000多册;即便按更紧凑的300页一册计算,也至少有1000多册的规模。

更重要的是,这些文书蕴含的信息极为丰富:每一份都带有明确的时间、地点、类别,内容涵盖土地交易、山林管理、婚姻聘礼、借贷典当等多个维度。

但清水江文书多为手写契约,有印制模板填空的,也有工整抄录的家族账簿、分家单、鱼鳞册。过去,这类材料整理靠“一人一灯一放大镜”,耗时耗力。

得益于近年来中文古籍识别模型的进步,即便是半印半写的契约文本,也能被智能OCR(光学字符识别)高精度识别。系统还可自动标引其中的人名、地名、职官、时间、文书类型等关键信息。

目前,徐永明团队开发的“智慧古籍平台”已实现在线协同整理:用户登录后,可参与OCR校对、标点修正、实体标注等任务。全球任何角落的历史爱好者、方言研究者、甚至中学生,都能为清水江文书的整理贡献力量。

学术壁垒被打破。知识生产,成为一场公共文化行动。

此外,地理信息技术的引入,让文本中的空间信息“活”了起来。当文书经过标引处理后,其中的地名,无论是村寨、山岭还是河流,均可在后台匹配精确的经纬度坐标。这种直观的空间呈现,极大提升了受众对历史事件地理背景的理解力。

图谱技术,则进一步揭示了人与人之间的复杂联结。文书里出现的人物,不仅可以构建家族世系图,还能生成社会关系网络图、人际交往图乃至个人行迹图。借助图数据库的强大支撑,这些原本分散在不同契约中的名字,被编织成一张张动态的社会网络,让隐匿于纸背的乡土秩序浮出水面。

而人工智能技术的融入,则赋予整个系统“对话”能力。

一旦文本完成结构化整理,用户便可通过自然语言提问,系统结合deepseek、豆包等通用大模型,即可快速、准确地给出答案,古籍真正从“可读”迈向“可问、可思、可交互”的新阶段。